Модераторы: korob2001, ginnie
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Опять траблы с кодировкой. 
:(
    Опции темы
Гость_s_a_s_h_a
Дата 6.8.2004, 16:43 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Описываю проблему. На сайт приходят люди отовсюду и в базу данных записываются нечитабельные фразы, как распознать в какой они кодировке, или хотя бы как-то отсеивать их. Если что-то непонятно, задавайте вопросы я попытаюсь подробнее объяснить. Жду ответов.
  Вверх
s_a_s_h_a
Дата 9.8.2004, 17:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 261
Регистрация: 20.7.2004
Где: Петрозаводск

Репутация: нет
Всего: 1



Нашел способ частично справиться с этой проблемой. Для этого потребуются два модуля
use Text::Iconv;
use Lingua::DetectCharset;

#массив @phrases содержит фразы в разных кодировках

my $k=0;
my @right_phrases=();

for(my $i=0;$i<scalar(@phrases);$i++)
{ $Src = Lingua::DetectCharset::Detect ($phrases[$i]);
if($Src eq 'UTF8')
{ my $converter = Text::Iconv->new("UTF8", "WINDOWS-1251");
$right_phrases[$k] = $converter->convert($phrases[$i]);
$k++;
}
if($Src eq 'KOI8')
{ my $converter = Text::Iconv->new("KOI8", "WINDOWS-1251");
$right_phrases[$k] = $converter->convert($phrases[$i]);
$k++;
}
if($Src eq 'WIN' || $Src eq 'ENG')
{ $right_phrases[$k]=$phrases[$i];
$k++;
}
}

Но тут мы видим, что набор кодировок-то беден. В модуле Lingua::DetectCharset они следующие: WIN, UTF8, KOI8, ENG, при этом случаются еще и различные казусы.
PM MAIL   Вверх
HISH
Дата 13.8.2004, 19:31 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 16
Регистрация: 24.4.2003
Где: Брянск

Репутация: нет
Всего: нет



может быть Cyrillic::CPdetect и Cyrillic::CPconvert пойдет?
PM WWW ICQ   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Perl: CGI программирование"
korob2001
sharq
  • В этом разделе обсуждаются вопросы относящиеся только к CGI программированию
  • Если ваш вопрос не относится к системному или CGI программированию, задавайте его в общем разделе
  • Если ваш вопрос относится к системному программированию, задавайте его здесь
  • Интерпретатор Perl можно скачать здесь ActiveState, O'REILLY, The source for Perl
  • Справочное руководство "Установка perl-модулей", качать здесь


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Perl: разработка для Web | Следующая тема »


 




[ Время генерации скрипта: 0.0679 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.