![]() |
Модераторы: Daevaorn |
![]() ![]() ![]() |
|
n1ke |
|
||||
![]() Новичок Профиль Группа: Участник Сообщений: 26 Регистрация: 3.12.2006 Репутация: нет Всего: нет |
Привет всем!
Значит есть HTML файл, например, такой:
мне надо выбрать строку которая находится между тегами <teg> и </teg>, тоесть строка "Test String". Я так понимаю ето надо делать через HTML-парсер (htmllib)?! И ещё, если например у нас есть такой файл:
Как мне поступить в ситуации если мне надо выбрать Test String3 ?? Заранее спасибо, всем удачи! |
||||
|
|||||
kulibinka |
|
|||
Бывалый ![]() Профиль Группа: Участник Сообщений: 191 Регистрация: 20.11.2006 Репутация: 2 Всего: 4 |
забудь о парсерах.
просто напиши ф-ю, которая получает 2 фразы + текст и вырезает кусок из текста между этими двумя строчками, и будет тебе счастье. если тебе ее не хватит - тогда и приступай к изучению парсеров. |
|||
|
||||
Daevaorn |
|
|||
![]() Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Комодератор Сообщений: 2155 Регистрация: 29.11.2004 Где: Москва Репутация: 9 Всего: 70 |
n1ke, я бы посоветовал любой из стандартных парсеров, лучше наверно DOM.
|
|||
|
||||
rib |
|
|||
Новичок Профиль Группа: Участник Сообщений: 1 Регистрация: 14.3.2007 Репутация: нет Всего: нет |
SGMLParser или HTMLParser как раз для таких задач. как пользоваться написано в dive into python
|
|||
|
||||
dvska |
|
|||
![]() Бывалый ![]() Профиль Группа: Участник Сообщений: 182 Регистрация: 30.1.2006 Репутация: 6 Всего: 9 |
BeautifulSoup тоже хорошая вещь ..
--------------------
|
|||
|
||||
nerezus |
|
|||
![]() Вселенский отказник ![]() ![]() ![]() ![]() Профиль Группа: Участник Сообщений: 3330 Регистрация: 15.6.2005 Репутация: 1 Всего: 43 |
Копать в сторону http://www.intuit.ru/department/sa/compilersdev/5/ |
|||
|
||||
kulibinka |
|
|||
Бывалый ![]() Профиль Группа: Участник Сообщений: 191 Регистрация: 20.11.2006 Репутация: 2 Всего: 4 |
не похоже, что n1ke решил свой собственный парсер написать - ему готовый инструмент для конкретной задачи нужен... n1ke - послушай совета dvska, просто сделай все через BeautifulSoup ![]() |
|||
|
||||
rgb |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 42 Регистрация: 31.8.2006 Репутация: 1 Всего: 2 |
как-то пришлось решать подобную задачу - парсеры частенько валятся наткнувшись на тег <script>. пришлось писать свою функцию с использованием регулярных выражений.
|
|||
|
||||
Yurietc |
|
|||
Новичок Профиль Группа: Участник Сообщений: 5 Регистрация: 13.7.2007 Репутация: 1 Всего: 1 |
|
|||
|
||||
Yurietc |
|
|||
Новичок Профиль Группа: Участник Сообщений: 5 Регистрация: 13.7.2007 Репутация: 1 Всего: 1 |
А подробнее о написании парсеров ? Если можно - ссылки. |
|||
|
||||
Daevaorn |
|
|||
![]() Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Комодератор Сообщений: 2155 Регистрация: 29.11.2004 Где: Москва Репутация: 9 Всего: 70 |
BeautifulSoup справляется даже с невалидным html кодом.
|
|||
|
||||
Yurietc |
|
|||
Новичок Профиль Группа: Участник Сообщений: 5 Регистрация: 13.7.2007 Репутация: 1 Всего: 1 |
А где можно почитать про BeautifulSoup, кроме
http://www.crummy.com/software/BeautifulSo...l#Quick%20Start ? |
|||
|
||||
![]() ![]() ![]() |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Python: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |