![]() |
Модераторы: Daevaorn |
![]() ![]() ![]() |
|
andrew_121 |
|
|||
![]() Кодофей ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 3448 Регистрация: 3.1.2008 Репутация: 6 Всего: 33 |
Задача: Распарсить html файл, для извлечения ссылок.
Проблема: Как определить что ссылка полная? К примеру. Нужно найти все ссылки на .rar файлы. Находим текст .rar, итерируемся в обратном направлении для нахождения http://. По идее, так мы получим ссылку. Но в .html файле, может быть несколько упоминаний .rar, и мы найдем(а может и нет) подстроку http:// не являющуюся частью ссылки на это расширение. Как можно еще решить эту задачу? Может есть какие-то другие способы? -------------------- Удалил аккаунт. Прощайте! |
|||
|
||||
Anikmar |
|
|||
![]() Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 2513 Регистрация: 26.11.2006 Где: Санкт-Петербург Репутация: 9 Всего: 59 |
Нужно будет все-таки анализировать все символы.
Например, если встретились недопустимые символы (тот же знак >) прекращать итерацию. Либо уже как выделили строку с http по .rar смотреть на ее дропустимость в качестве имени файла (ссылки). |
|||
|
||||
andrew_121 |
|
|||
![]() Кодофей ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 3448 Регистрация: 3.1.2008 Репутация: 6 Всего: 33 |
Anikmar, Да, так я и думал. Просто любопытно было, какие еще есть варианты.
-------------------- Удалил аккаунт. Прощайте! |
|||
|
||||
MAKCim |
|
|||
![]() Воін дZэна ![]() ![]() ![]() ![]() Профиль Группа: Экс. модератор Сообщений: 5644 Регистрация: 10.12.2005 Где: Менск, РБ Репутация: 52 Всего: 207 |
по-хорошему нужно взять что-то типа libhtml и не париться ;)
-------------------- Ах, у елі, ах, у ёлкі, ах, у елі злыя волкі © |
|||
|
||||
andrew_121 |
|
|||
![]() Кодофей ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 3448 Регистрация: 3.1.2008 Репутация: 6 Всего: 33 |
Дык... Так это меня и интересовало! Спасибо! -------------------- Удалил аккаунт. Прощайте! |
|||
|
||||
mrbrooks |
|
|||
![]() трололомен ![]() ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 4259 Регистрация: 4.10.2006 Где: Дол Гулдур Репутация: 2 Всего: 306 |
andrew_121, можно заюзать еще Xerces-C++. Правда не думаю, что это кошернее варианта MAKCim.
|
|||
|
||||
Cheloveck |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1578 Регистрация: 26.7.2008 Где: Тула Репутация: 3 Всего: 32 |
а почему бы не регепсы?
как-то так, кажется Это сообщение отредактировал(а) Cheloveck - 7.9.2009, 08:35 -------------------- ![]() |
|||
|
||||
![]() ![]() ![]() |
Правила форума "С++:Общие вопросы" | |
|
Добро пожаловать!
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Earnest Daevaorn |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | C/C++: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |