Модераторы: Aliance, skyboy, MoLeX, ksnk
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> preg_match на русском языке 
:(
    Опции темы
WebS
Дата 22.3.2010, 11:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 1.6.2008

Репутация: нет
Всего: -3



Как сделать чтобы preg_match парсил из русского текста?

Функция, которая не работает:
Код

function get_yandex_index($host){

    $s=file('http://yandex.ru/yandsearch?surl='.$host.'&pag=u&numdoc=50&rd=0&lr=213');
        
    $match = iconv("utf-8","windows-1251", "/нашлось (.+?) страниц/");
    $sourse = iconv("utf-8","windows-1251",join("",$s));
    
    preg_match('/нашлось (.+?) страниц/',$sourse,$a);
    
    //echo "match: $match<BR>sourse: $sourse<br>$a[1]";
    
    return $a[1];
}


Аналог с англ-яз(гугл) работает норм

Это сообщение отредактировал(а) WebS - 22.3.2010, 11:36
--------------------
Услуги web мастера... php+sql, вёрстка, дизайн, программирование, и.д.р
PM MAIL WWW ICQ   Вверх
skyboy
Дата 22.3.2010, 12:50 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


неОпытный
****


Профиль
Группа: Модератор
Сообщений: 9820
Регистрация: 18.5.2006
Где: Днепропетровск

Репутация: 8
Всего: 260



кодировка приведенного кода(файла с кодом) - ср1251?

Добавлено через 27 секунд
непонятно, зачем перекодировать в ср1251. почему не использовать utf-8?
PM MAIL   Вверх
patap
Дата 22.3.2010, 14:01 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 893
Регистрация: 7.5.2005
Где: Украина, Зп

Репутация: 5
Всего: 40



вроде бы достаточно указать флаг u в рег. выражении

Код
 preg_match('/нашлось (.+?) страниц/u', $sourse, $a);



--------------------
На боку кобура болталась, сзади шашка отцовская звякала. 
Впереди меня все хохотало, а позади все плакало (с)
PM MAIL ICQ   Вверх
skyboy
Дата 22.3.2010, 14:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


неОпытный
****


Профиль
Группа: Модератор
Сообщений: 9820
Регистрация: 18.5.2006
Где: Днепропетровск

Репутация: 8
Всего: 260



patap, после того, как текст перекодировал из utf-8 в ср1251?
PM MAIL   Вверх
brother79
Дата 22.3.2010, 14:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 471
Регистрация: 18.8.2009

Репутация: нет
Всего: 6



Цитата(skyboy @  22.3.2010,  12:50 Найти цитируемый пост)
непонятно, зачем перекодировать в ср1251. почему не использовать utf-8? 


Я подозреваю просто там в самом preg_match используются константы в 1251, видимо сайт разрабатывается под виндой в 1251


--------------------
PM MAIL WWW   Вверх
patap
Дата 22.3.2010, 14:57 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 893
Регистрация: 7.5.2005
Где: Украина, Зп

Репутация: 5
Всего: 40



skyboy, я имел ввиду без всяких конвертировок, а сразу подставлять в preg_match()


--------------------
На боку кобура болталась, сзади шашка отцовская звякала. 
Впереди меня все хохотало, а позади все плакало (с)
PM MAIL ICQ   Вверх
krypt3r
Дата 25.3.2010, 07:37 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 359
Регистрация: 9.6.2009

Репутация: 1
Всего: 16



patap, и как вы себе это представляете? На сайте UTF-8, у вас CP1251. Не хотите возиться с перекодировками, переводите свои скрипты на UTF-8 и юзайте модификатор u в регулярках
PM MAIL   Вверх
skyboy
Дата 25.3.2010, 09:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


неОпытный
****


Профиль
Группа: Модератор
Сообщений: 9820
Регистрация: 18.5.2006
Где: Днепропетровск

Репутация: 8
Всего: 260



krypt3r, patap как раз это и предлагал. читай внимательно, пожалуйста.
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PHP: Тексты | Следующая тема »


 




[ Время генерации скрипта: 0.0963 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.