![]() |
Модераторы: korob2001, ginnie |
![]() ![]() ![]() |
|
migaro |
|
||||
Новичок Профиль Группа: Участник Сообщений: 36 Регистрация: 4.2.2010 Репутация: нет Всего: нет |
В общем я у меня есть куча html'ок.. В каждой есть строка "хлебных крошек".. В конце строки есть текст на русском.. Мне надо регуляркой находить русский текст в конце и сохранять в переменную.. вроде все просто.. Но я заметил такой ньюанс, что текст не находиться..
Я написал такой проверочный скрипт и начал капать..
Строка в которой должно находиться совпадение:
HTML - коряв и негоден, это понятно, но не в этом сейчас дело. Дело в том, файлы мне прислали и они вроде как в cp1251. Локаль у меня ru_RU.UTF-8, но и ru_RU.CP1251 тоже установлена и скрипт должен исполняться под ней (setlocale(LC_ALL, "ru_RU.CP1251");).. Но почему-то не хочет.. Может кто сталкивался с работой регулярок под русский ср1251?.. Это сообщение отредактировал(а) migaro - 19.12.2012, 17:09 |
||||
|
|||||
arto |
|
|||
Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1495 Регистрация: 31.10.2004 Репутация: 38 Всего: 40 |
# cat a.txt | perl -0777 -lne 'BEGIN{ use encoding "cp1251", STDOUT => "utf8" } print join "\n", m#(\p{Cyrillic}+)#gsm;'
Главная Банковское дело Банковские операции Васюренко # Добавлено через 2 минуты и 56 секунд а если выход тоже в cp1251, то # cat a.txt | perl -Mencoding=cp1251 -0777 -lne 'print join "\n", m#(\p{Cyrillic}+)#gsm;' Главная Банковское дело Банковские операции Васюренко # |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Perl" | |
|
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Perl: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |