Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > PHP: Тексты > Извлечение нужных данных из страницы


Автор: poushkar 12.3.2007, 18:23
Здраствуйте. Сразу скажу, что я не прошу писать вместо меня код. Я только хочу словесное описание КАК делать. Поскольку некоторые моменты мне не совсем ясны из-за моей неопытности.

Есть страница. На ней в таблицах имеются некоторые данные. А именно: 

-------------------------------------------------------
Фамилия | еще какие-то данные | число|
-------------------------------------------------------

Число для каждой из списка фамилий может меняться раз в 10 секунд.
Фамилия же является ссылкой на которую надо нажать если число изменилось.


У меня в принцыпе есть некоторые соображения на счёт того, как именно делать программу. Но из-за многих неясностей они почти ничего не стоят. Поэтому очень надеюсь на Вашу помощь. 


Автор: Vaulter 12.3.2007, 21:19
таблица
id, string, number

программа делает периодические (желательно ассинхронные) запросы к серверу (WEB)
ну и разруливает все дела smile как далше по ТЗ smile
удачи.

зы: кажис 
Цитата

словесное описание КАК делать
 получилос smile

Автор: poushkar 14.3.2007, 20:59
Что такое ТЗ ?
Каким образом делать асинхронные запросы к серверу ?  smile 

Автор: Platon 14.3.2007, 22:01
Цитата(poushkar @  12.3.2007,  18:23 Найти цитируемый пост)
У меня в принцыпе есть некоторые соображения на счёт того, как именно делать программу. Но из-за многих неясностей они почти ничего не стоят.

Эээх, не увидел я ни соображений как именно делать программу, ни многих неясностей, чем помочь не знаю.

Автор: mishaSL 14.3.2007, 22:01
Цитата(poushkar @  14.3.2007,  20:59 Найти цитируемый пост)
Что такое ТЗ ?


Техническое задание.

Цитата(poushkar @  14.3.2007,  20:59 Найти цитируемый пост)
Каким образом делать асинхронные запросы к серверу ?


Можешь начать с неасинхронных smile  А еще лучше сначало напиши скрипт, который будет брать нужные тебе данные в нужном формате, а потом уже разберешься как  и с помошью чего тебе делать запросы к серверу.

Автор: poushkar 15.3.2007, 09:13
Platon
сохраняем страницу на диске в виде HTML кода. С помощью регулярных выражений ищем теги таблиц с Фамилией и Числом (эти таблицы всё же должны как-то отличаться. то ли заданным размером, то ли цветом, то ли вставленной картинкой). Извлекаем эти данные и записываем в файл. Через, допустим 5с делаем то же самое, записываем в другой файл и сравниваем оба файла. Если были изменения - каким-то образом нажимаем на ссылку...

Ну примерно так я себе это представляю. Всё еще жду помощи, более конкретной, чем была выше. В таком виде, как расписал я. Заранее спасибо всем, кто не поленится отписать smile

Автор: mishaSL 15.3.2007, 13:31
Цитата(poushkar @  15.3.2007,  09:13 Найти цитируемый пост)
Всё еще жду помощи, более конкретной, чем была выше. 


Я так и не до конца понял всю суть твоей задачи, но я себе это вижу так:

1. Парсишь страницу: сразу получаю контент через сокеты или curl (начем сохранять ее на диск?) - полячаешь нужные тебе данные, на сколько я понял: Фамилия, Число и ссылка. Сохраняешь в БД в удобном виде.
2. При сохранении в БД проверяешь изменились ли числа. Если да, то у тебя уже есть полученные ссылки - соответственно парсишь их или не знаю, что ты понимаешь под словами "нажимаем на ссылку"
3. Самый простой вариант прицепить этот скрипт через cron (планировщик *nix систем). Но выполняя этот скрипт раз в 5 секунд ты очень сильно перегрузишь свой сервер, так что задумайся о частоте запросов к серверу и о том как ты будешь вызывать этот скрипт.

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)