Модераторы: LSD, AntonSaburov
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Проверка html файлов на битые ссылки, Нужна Open source утилита для сабжа.  
:(
    Опции темы
defunct
Дата 15.8.2008, 08:09 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 11
Регистрация: 3.9.2007

Репутация: нет
Всего: нет



Привет!
нужна Open Source утилита для проверки html файлов на битые ссылки, запускающаяся из командной строки (не графическая), написанная на Java. 

Подскажите, пожалуйста, где такую можно взять.
PM MAIL   Вверх
ecologist
Дата 15.8.2008, 10:25 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 452
Регистрация: 28.2.2007

Репутация: нет
Всего: 9



А что значит "битые ссылки" ? Если имеется в виду, что они не работают - то думаю, что такую утилиту можно написать достаточно быстро.

Код

URL url = new URL(<стрjка с URL>);
HttpURLConnection con = new HttpURLConnection(url);
con.getRequestMethod("GET");
con.connect();


Поставь это в цикл, который также будет по регекспам будет искать на странице ссылки - и по идее все. Ну понятно надо будет еще при эксепшене обработчик делать, который запишет в лог, что ссылка не открылась.
PM MAIL   Вверх
defunct
Дата 18.8.2008, 13:31 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 11
Регистрация: 3.9.2007

Репутация: нет
Всего: нет



Не совсем так: нужно парсить HTML файл, найти все ссылки например в тэге img и проверить наличие соответствующих файлов.
Аналогично для ссылок вида <a href
Файлов много, поэтому вручную делать не хотелось бы.
PM MAIL   Вверх
Ortega
Дата 18.8.2008, 15:35 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 5.11.2005
Где: Харьков, Украина

Репутация: 1
Всего: 6



Так никто тебе не предлагает руками перебрать файлы. 

ecologist предложил руками написать программку, которая будет перебирать файлы. А кусок кода, который он привел, отвечает на вопрос "является ли заданный урл рабочим?"
--------------------
Всему свое время (с) ЧайфНе парься, будь счастлив (с) Пеппи Длинный Чулок
PM MAIL WWW ICQ Skype GTalk   Вверх
defunct
Дата 18.8.2008, 20:13 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 11
Регистрация: 3.9.2007

Репутация: нет
Всего: нет



как такую утилиту написать я знаю. было интересно, может кто-то это уже за меня сделал. smile 
PM MAIL   Вверх
AxNe0
Дата 19.8.2008, 13:44 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 263
Регистрация: 24.4.2006
Где: St. Petersburg

Репутация: 1
Всего: 5



ИМХО, искать дольше придется, чем самому написать....


--------------------
SCJP 6, SCBCD 5, OCEWSD 6
blog
PM ICQ Skype   Вверх
Platon
Дата 19.8.2008, 13:55 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1801
Регистрация: 25.4.2006

Репутация: нет
Всего: 40



Цитата(AxNe0 @  19.8.2008,  14:44 Найти цитируемый пост)
ИМХО, искать дольше придется, чем самому написать.... 

И это правда. 
1. Достаточно знать ,как работать с регулярными выражениями, найти шаблон, который определяет ссылки.
2. Найти функцию, которая правильно склеивает относительные пути
3. экранировать/деэкранировать, а может даже и не надо, извлеченные ссылки

Всё.

PM MAIL ICQ   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Java"
LSD   AntonSaburov
powerOn   tux
  • Прежде, чем задать вопрос, прочтите это!
  • Книги по Java собираются здесь.
  • Документация и ресурсы по Java находятся здесь.
  • Используйте теги [code=java][/code] для подсветки кода. Используйтe чекбокс "транслит", если у Вас нет русских шрифтов.
  • Помечайте свой вопрос как решённый, если на него получен ответ. Ссылка "Пометить как решённый" находится над первым постом.
  • Действия модераторов можно обсудить здесь.
  • FAQ раздела лежит здесь.

Если Вам помогли, и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, LSD, AntonSaburov, powerOn, tux.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Java tools & IDE's | Следующая тема »


 




[ Время генерации скрипта: 0.0801 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.