Здравствуйте.
Тут пришлось занятся такой вещью, как парсинг html-страниц, с целью выдирания оттуда определенных данных и складирования их в БД. В чем же проблема? В связи с тем, что страниц, подлежащих парсингу довольно много (например для порядка 4000 наименований, нужно для каждого выбирать данные из нескольких страниц), время затрачиваемое на парсинг даже в условиях широкого канала довольно велико. Интересуясь скоростью выполнения скрипта, и проведя пару тестов, я выяснил, что основное время уходит на запрос содержимого страницы, а не на дальнейший парсинг. Получаю содержимое страницы функцией file_get_contents(). Возможно есть более шустрые способы, предложения которых я и хотел бы услышать от участников форума.
С Уважением, Константин.
|