![]() |
Модераторы: bsa |
![]() ![]() ![]() |
|
oleg200095 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 22 Регистрация: 3.6.2009 Репутация: нет Всего: нет |
Доброго времени суток.
Мне понадобилось написать парсер html/xml на чистом Си. Хотелось бы узнать, какие алгоритмы/теории нужно знать что бы эффективно выполнить эту работу? Заранее спасибо за ответ |
|||
|
||||
boostcoder |
|
|||
![]() pattern`щик ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 5458 Регистрация: 1.4.2010 Репутация: 20 Всего: 110 |
flex/bison
|
|||
|
||||
math64 |
|
|||
Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 2505 Регистрация: 12.4.2007 Репутация: 12 Всего: 72 |
Есть готовые парсеры xml на чистом C - поищи в инете.
Если писать самому - да, flex/bison, но писать полный парсер это работа не для новичка. |
|||
|
||||
baldina |
|
|||
![]() Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 3433 Регистрация: 5.12.2007 Где: Москва Репутация: 15 Всего: 101 |
||||
|
||||
EvilsInterrupt |
|
|||
Executables research ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1019 Регистрация: 14.7.2007 Где: Железнодорожный, МО, Россия Репутация: нет Всего: 9 |
oleg200095, Лучше воспользуйся готовыми решениями, а так есть книга Ахо про компиляторы. Но прежде чем хоть что-то вменяемое напишешь пройдет достаточно много времени, имеет ли смысл?
|
|||
|
||||
xvr |
|
|||
Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Комодератор Сообщений: 7046 Регистрация: 28.8.2007 Где: Дублин, Ирландия Репутация: 35 Всего: 223 |
Вам шашечки, или ехать? Если второе, то возьмите libxml2 и не парьтесь А если первое, то для xml теории синтаксического анализа будут чересчур - у него грамматика простая как сапог ![]() |
|||
|
||||
oleg200095 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 22 Регистрация: 3.6.2009 Репутация: нет Всего: нет |
Мне и шашечки и ехать, с одной стороны его нужно использовать в проекте, а с другой хотелось бы и научиться.
|
|||
|
||||
baldina |
|
||||
![]() Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 3433 Регистрация: 5.12.2007 Где: Москва Репутация: 15 Всего: 101 |
да, его описание всего-то 1000 с небольшим строк. Добавлено через 3 минуты и 8 секунд а bnf порядка 200 занимает, с пустыми строками. Добавлено через 5 минут и 59 секунд
разделите это на две задачи ![]() научиться цель благородная, но сильно затормозит Ваш проект. так что почитайте про лексический и синтаксический анализ вобщем, поймите как устроен построитель компиляторов типа flex/bison, а для проекта возьмите специализированную библиотеку Это сообщение отредактировал(а) baldina - 11.7.2012, 17:40 |
||||
|
|||||
xvr |
|
|||
Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Комодератор Сообщений: 7046 Регистрация: 28.8.2007 Где: Дублин, Ирландия Репутация: 35 Всего: 223 |
Это не значит, что и парсер на 1000 строк будет А не надо в одном bnf смешивать лексику и семантику. Да и DTD ТС видимо не нужен (я так подозреваю) ![]() Чистый bnf на семантику там будет строк на 20 максимум. И требование к совпадению открывающих и закрывающих тегов, а так же к уникальности атрибутов вообще в bnf не выражается ![]() Это всегда полезно, но для парсинга XML это из пушки по воробьям (хотя flex можно задействовать) Это сообщение отредактировал(а) xvr - 11.7.2012, 22:16 |
|||
|
||||
magesi |
|
|||
Шустрый ![]() Профиль Группа: Участник Сообщений: 120 Регистрация: 20.5.2012 Репутация: нет Всего: -4 |
oleg200095, да не надо всякие Бауэра и Замельзона или Рутисхаузера учить по разбору выражений, ты сразу генетические алгоритмы бери
![]() ![]() |
|||
|
||||
![]() ![]() ![]() |
Правила форума "C/C++: Для новичков" | |
|
Запрещается! 1. Публиковать ссылки на вскрытые компоненты 2. Обсуждать взлом компонентов и делиться вскрытыми компонентами
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, JackYF, bsa. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | C/C++: Для новичков | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |