Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате |
Форум программистов > PHP: Тексты > Извлечение нужных данных из страницы |
Автор: poushkar 12.3.2007, 18:23 |
Здраствуйте. Сразу скажу, что я не прошу писать вместо меня код. Я только хочу словесное описание КАК делать. Поскольку некоторые моменты мне не совсем ясны из-за моей неопытности. Есть страница. На ней в таблицах имеются некоторые данные. А именно: ------------------------------------------------------- Фамилия | еще какие-то данные | число| ------------------------------------------------------- Число для каждой из списка фамилий может меняться раз в 10 секунд. Фамилия же является ссылкой на которую надо нажать если число изменилось. У меня в принцыпе есть некоторые соображения на счёт того, как именно делать программу. Но из-за многих неясностей они почти ничего не стоят. Поэтому очень надеюсь на Вашу помощь. |
Автор: Vaulter 12.3.2007, 21:19 | ||
таблица id, string, number программа делает периодические (желательно ассинхронные) запросы к серверу (WEB) ну и разруливает все дела ![]() ![]() удачи. зы: кажис
![]() |
Автор: poushkar 14.3.2007, 20:59 |
Что такое ТЗ ? Каким образом делать асинхронные запросы к серверу ? ![]() |
Автор: mishaSL 14.3.2007, 22:01 |
Техническое задание. Можешь начать с неасинхронных ![]() |
Автор: poushkar 15.3.2007, 09:13 |
Platon, сохраняем страницу на диске в виде HTML кода. С помощью регулярных выражений ищем теги таблиц с Фамилией и Числом (эти таблицы всё же должны как-то отличаться. то ли заданным размером, то ли цветом, то ли вставленной картинкой). Извлекаем эти данные и записываем в файл. Через, допустим 5с делаем то же самое, записываем в другой файл и сравниваем оба файла. Если были изменения - каким-то образом нажимаем на ссылку... Ну примерно так я себе это представляю. Всё еще жду помощи, более конкретной, чем была выше. В таком виде, как расписал я. Заранее спасибо всем, кто не поленится отписать ![]() |
Автор: mishaSL 15.3.2007, 13:31 |
Я так и не до конца понял всю суть твоей задачи, но я себе это вижу так: 1. Парсишь страницу: сразу получаю контент через сокеты или curl (начем сохранять ее на диск?) - полячаешь нужные тебе данные, на сколько я понял: Фамилия, Число и ссылка. Сохраняешь в БД в удобном виде. 2. При сохранении в БД проверяешь изменились ли числа. Если да, то у тебя уже есть полученные ссылки - соответственно парсишь их или не знаю, что ты понимаешь под словами "нажимаем на ссылку" 3. Самый простой вариант прицепить этот скрипт через cron (планировщик *nix систем). Но выполняя этот скрипт раз в 5 секунд ты очень сильно перегрузишь свой сервер, так что задумайся о частоте запросов к серверу и о том как ты будешь вызывать этот скрипт. |