![]() |
Модераторы: skyboy, MoLeX, Aliance, ksnk |
![]() ![]() ![]() |
|
SqueeZe |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 48 Регистрация: 1.10.2007 Где: Санкт-Петербург Репутация: 1 Всего: 1 |
Здравствуйте.
Тут пришлось занятся такой вещью, как парсинг html-страниц, с целью выдирания оттуда определенных данных и складирования их в БД. В чем же проблема? В связи с тем, что страниц, подлежащих парсингу довольно много (например для порядка 4000 наименований, нужно для каждого выбирать данные из нескольких страниц), время затрачиваемое на парсинг даже в условиях широкого канала довольно велико. Интересуясь скоростью выполнения скрипта, и проведя пару тестов, я выяснил, что основное время уходит на запрос содержимого страницы, а не на дальнейший парсинг. Получаю содержимое страницы функцией file_get_contents(). Возможно есть более шустрые способы, предложения которых я и хотел бы услышать от участников форума. С Уважением, Константин. |
|||
|
||||
americanets |
|
|||
Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1100 Регистрация: 27.9.2006 Репутация: 5 Всего: 12 |
для получения страниц сокеты и курл в мануале по file_get_contents есть примеры, чтоб лишний раз не пользовали функцию для работы с файлами которая вобщем-то для этого не предназначена
-------------------- Пусть популярную музыку слушают те, среди кого она популярна |
|||
|
||||
SqueeZe |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 48 Регистрация: 1.10.2007 Где: Санкт-Петербург Репутация: 1 Всего: 1 |
Спасибо. Стало работать на порядок быстрее.
|
|||
|
||||
![]() ![]() ![]() |
Правила форума "PHP" | |
|
Новичкам:
Важно:
Внимание:
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | PHP: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |