Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате |
Форум программистов > Python: Общие вопросы > Небольшая проблема с парсингом ссылок |
Автор: ShaiTan 16.12.2011, 10:03 | ||||
Такой код:
Собирает внутреннии ссылки, выбирает рандомную, приводит в норм. вид. Проблема в том, что некоторые ссылки имеют в начале слеш /, а другие нет. Соответственно часть ссылок нерабочая - http://domain.com//(urls[1]) или http://domain.com(urls[1]) в зависимости от наличия слеша здесь:
Плюс попадаются внешние ссылки. Они тоже собираются и портят картину. Возможно в некоторых случаях внутренние ссылки будут также начинаться с http://domain.com... Как все это грамотно и макс просто разрулить? Нужны только внутренние ссылки, 100% рабочие. |