Модераторы: Aliance, skyboy, MoLeX, ksnk
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> как вытащить нужную информацию из HTML страницы, с определенной структурой ? 
:(
    Опции темы
TheAviator
Дата 21.7.2006, 13:10 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 219
Регистрация: 28.9.2003
Где: Николаев-Киев

Репутация: нет
Всего: нет



Собственно, есть HTML страничка на которой лежит таблица с данными.
Как перегнать данные из таблицы в базу.
Если знаете - закиньте, пожалуйста, ссылочки на  примеры аналогичные.
таблица,которой я занимаюсь, тут http://www.er.gov.ua/graphic/graphicw.php?...mp;m=2&d=20
спасибо! 
PM MAIL WWW ICQ   Вверх
Bikutoru
Дата 21.7.2006, 15:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Увлекающийся
**


Профиль
Группа: Участник
Сообщений: 522
Регистрация: 24.5.2005
Где: Москва

Репутация: 3
Всего: 22



Все очень просто:
1. определяются данные, которые необходимо вытащить;
2. аналищируется содержимое страницы/страниц, из которых эти данные нужно вытащить
3. на основании данных, полученных на предыдущем этапе составляются регулярные выражения, "вытаскивающие" нужные данные.
4. пишется скрипт, который с помощью имеющихся регулярных выражений вытаскивает нужные данные и заливает их в базу.

P.S. У меня как раз такая задачка сейчас есть - перелить данные со старой версии сайта на новую. А там всего-то 500 страничек...

Добавлено @ 16:01 
а со ссылками здесь будет сложно - задача довольно специфическая. Думаю, будет достаточно руководств по регулярным выражениям и функциям MySQL (или какой-то другой базы, в зависимости от того, что ты используешь)... 


--------------------
Человек, словно в зеркале мир — многолик, 
Он ничтожен — и он же безмерно велик!
Омар Хайям
PM   Вверх
Step
Дата 23.7.2006, 23:20 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Экс. модератор
Сообщений: 5151
Регистрация: 26.9.2002
Где: дурдом.UA

Репутация: нет
Всего: 25



если табличка толком сделана
в регулярных в цикле выбераешь название столбиков между <th> И вЫбрасывая теги 

чтото типа preg_match("/<th.+>(.*)</th>/",строкаб масив)
потом получив название каждого составляешь запрос на создание таблицы в базе
потом выбераешь строки <tr>
и в каждой выбераешь ячейки <td> и формируешь запрос инсерт

что бы в базу не попали теги, там цвета и все такое

делаешь предварительную обработку 
строка=preg_replace("/<.+>/","", строка) будет теги вырезать smile должна smile


да и к этому всему нужно не забыть добавить модификатор, что бы регулярное выражение ело поминимому

но это подойдет для таблицы которая нормально оформлена в противном случаии нужно будет долго мучаться с модификаторами и регулярными выражениями

проще конечно изучить особенности твоей таблицы и сделать одно регулярное выражение которы будет выбирать данные сразу из всей строки  


--------------------
- Дурак учится на своих ошибках, умный на чужих.
 - умные учатся у дураков
PM MAIL ICQ   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PHP: Тексты | Следующая тема »


 




[ Время генерации скрипта: 0.0884 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.