Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > Perl: Регулярные выражения > регулярные выражения фильтрация сайтов


Автор: VutDen 22.1.2014, 14:41
Добрый день уважаемые Программисты!smile Я уже 3 день мучаюсь с фильтрацией сайтов по регулярным выражением от номеров телефонов, они указаны через точку, и майла....
есть такое выражение :

(((www.|)+[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|[а-я0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[а-я0-9!#$%&'*+/=?^_`{|}~-]+)*(?:[а-я0-9](?:[а-я0-9-]*[а-я0-9])?\.(рф))))

он та ищет сайты как www. XXXXX. XX  и без www. , НО... также появляется "мусор " такой как : почта т.е. XXXXX@. XX и телефоны в виде X.XXX.XXX.XX.XX и XXX.XX.XX . Помогите по человечески сделать выражение для вырывания только сайтов с www. И без www. . а то уже мозг кипит, выкурено 100 пачек сигарет и выпито несколько ведер кофию smile 

Автор: alezzz 22.1.2014, 21:18
Цитата(VutDen @  22.1.2014,  14:41 Найти цитируемый пост)
почта т.е. XXXXX@. XX и телефоны в виде X.XXX.XXX.XX.XX и XXX.XX.XX

У вас ответ в вопросе. email обычно пишут с '@', по нему и можно фильтровать. Доменов верхнего уровня с цифрами не встречал.
Посмотрите классику, Дж. Фридла, там есть примеры поиска url.

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)