![]() |
Модераторы: Aliance, skyboy, MoLeX, ksnk |
![]() ![]() ![]() |
|
kobNET |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 5 Регистрация: 19.4.2007 Где: Украина, Черкассы Репутация: нет Всего: нет |
Здраствуйте, уважаемые профи, нужна ваша помощь! Дело обстоит так: хочу разработать парсер на php дляизвлечения инф. с HTML-страниц, но соображений как это организовать маловато. Имею знания php выше базовых. Хотел бы услишать какими функциями и методами php надо пользоватся, чтобы написать такой скрипт. Укажите какие разделы php надо изучить и, если не затруднит, поверхносно обьясните структуру такого скрипта и общие аспекты этого вопроса. Если вопрос сформулирован не совсем понятно, напишите, постараюсь выразится конкретней.
Зарание большое спасибо! с ув. Александр
Это сообщение отредактировал(а) PARROT - 19.4.2007, 10:14 |
|||
|
||||
-=Ustas=- |
|
||||
![]() Ustix IT Group ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 2222 Регистрация: 21.1.2005 Где: Краснодар Репутация: 6 Всего: 69 |
1. fsockopen - для получения контента из УРЛ 2. Регулярные выражения - для парсинга нужной тебе инфы 3. preg_* - для работы с рег.вырами.
Пользуй поиск. Тут уже достаточно много обсуждений было на тему парсеров ![]() -------------------- В искаженном мире все догмы одинаково произвольны, включая догму о произвольности догм. ----- |
||||
|
|||||
capitan |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 602 Регистрация: 27.2.2005 Где: Москва Репутация: 1 Всего: 13 |
Из личного опыта советую использовать не fsockopen, а curl. Т.к у них намного больше возможностей. Например можно парсить информацию с сайтов где стоит авторизация, т.к. они работают с куками. Единственный минус,- они не выполняют JS. А так эмулируют работу браузера почти полностью. |
|||
|
||||
-=Ustas=- |
|
|||
![]() Ustix IT Group ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 2222 Регистрация: 21.1.2005 Где: Краснодар Репутация: 6 Всего: 69 |
Ну, Curl стоит использовать тогда, когда он действительно необходим. А так, для рядовых задач fsock* вполне достаточно ![]() -------------------- В искаженном мире все догмы одинаково произвольны, включая догму о произвольности догм. ----- |
|||
|
||||
kobNET |
|
||||||
![]() Новичок Профиль Группа: Участник Сообщений: 5 Регистрация: 19.4.2007 Где: Украина, Черкассы Репутация: нет Всего: нет |
Использую виртуальный хост. Скрипт инициирует поточное соединение, но выдает ошибку:
В чом здесь проблема?
Это сообщение отредактировал(а) kobNET - 20.4.2007, 11:52 |
||||||
|
|||||||
-=Ustas=- |
|
|||
![]() Ustix IT Group ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 2222 Регистрация: 21.1.2005 Где: Краснодар Репутация: 6 Всего: 69 |
kobNET, а заголовки кто за тебя писать будет?!
-------------------- В искаженном мире все догмы одинаково произвольны, включая догму о произвольности догм. ----- |
|||
|
||||
kobNET |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 5 Регистрация: 19.4.2007 Где: Украина, Черкассы Репутация: нет Всего: нет |
Не понял вопроса. Какие заголовки? |
|||
|
||||
capitan |
|
||||||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 602 Регистрация: 27.2.2005 Где: Москва Репутация: 1 Всего: 13 |
А мануал не судьба почитать? http://www.php.net/manual/ru/function.fsockopen.php Вот эти заголовки:
Это сообщение отредактировал(а) capitan - 20.4.2007, 14:56 |
||||||
|
|||||||
![]() ![]() ![]() |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | PHP: Тексты | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |