Модераторы: korob2001, ginnie

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> utf2win, Перекодировка! 
:(
    Опции темы
rcdimon
Дата 4.2.2006, 14:29 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 766
Регистрация: 12.7.2004
Где: Москва

Репутация: 1
Всего: 2



Есть строка, в utf8 и мне нужно ее перекодировать в win-1251 для вывода на экран!

Для этого я неизвестно где взял вот такую процедуру

Код

sub utf2win
{
  my $in=shift;
  my @in=split(//,$in);
  my $len=@in;
  my @out;
  my $byte2=0;
  for ($c=0;$c<$len;$c++)
  {
    $i=ord($in[$c]);
    if ($i<=127)
    {
         push @out,$s[$c];
    }
    elsif ($byte2>0)
    {
        if (($i==129) && ($byte2==208)) {
            $newi=168; # ¨
        }
        elsif (($i==145) && ($byte2==209)) {
            $newi=184; # ¸
        }
        elsif (($i>=144) && ($i<=191)) {
            $newi=$i+48;
        }
        elsif (($i>=128) && ($i<=143)) {
            $newi=$i+112;
        }
        else {
            $newi=35;
        }
        push @out,chr($newi);
        $byte2=0;
    }
    elsif (($i==208) || ($i==209)) {
      $byte2=$i;}
  }
  return join('',@out);
}


Если в нее сунуть данные из переменной она ответит пустой строкой! Но если считать данные из файла тоже в кодировке utf8 То она переконвертирует.

Тогда я свою переменную сначала пихал в файл, потом читал его и вводил в процедуру- тогда все ОК.

Но прямо из переменной не хочет конвертировать и все!

Тогда я решил проверить чем же отличаются данные из файла и из переменной. Если просто вывести на экран- то ничем. Для детальной проверки сделал так

Код

@a = split(//,$a);

foreach (@a){
    print ord($_) . '<br>';
}


и у меня получились очень интерсеные результаты smile

Из файла вот:
Код

75<br>105<br>110<br>100<br>101<br>114<br>46<br>114<br>117<br>32<br>45<br>32<br>208<br>148<br>208<br>181<br>209<br>130<br>209<br>129<br>208<br>186<br>208<br>184<br>208<br>181<br>32<br>208<br>189<br>208<br>190<br>208<br>178<br>208<br>190<br>209<br>129<br>209<br>130<br>208<br>184<br>


а из переменной вот

Код

75<br>105<br>110<br>100<br>101<br>114<br>46<br>114<br>117<br>32<br>45<br>32<br>1044<br>1077<br>1090<br>1089<br>1082<br>1080<br>1077<br>32<br>1085<br>1086<br>1074<br>1086<br>1089<br>1090<br>1080<br>



Откуда код символа может быть 1082, 180 и т.д! Я просто в шоке..

Помогите пожалуйста с перекодировкой!
PM MAIL ICQ   Вверх
sharq
Дата 4.2.2006, 15:42 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Perl Liker
**


Профиль
Группа: Участник
Сообщений: 841
Регистрация: 13.12.2004
Где: Ростов-на-Дону

Репутация: 23
Всего: 28



rcdimon
perldoc perlunicode
perldoc perluniintro

Код

use Encode 'from_to';

my $data = 'привет';
from_to($data, 'cp1251', 'utf8');
print 'Unicode: '.$data, "\n";
from_to($data, 'utf8', 'cp1251');
print 'Cyrillic:  '.$data, "\n";


smile


--------------------
[color=gray]There's More Than One Way To Do It[/color]
PM MAIL WWW ICQ Skype   Вверх
rcdimon
Дата 4.2.2006, 16:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 766
Регистрация: 12.7.2004
Где: Москва

Репутация: 1
Всего: 2



Software error:

Cannot decode string with wide characters at q:/usr/perl58/lib/Encode.pm line 186.

For help, please send mail to the webmaster (rcdimon), giving this error message and the time and date of the error.
Добавлено @ 16:08
Кстати если интересно откуда я беру данные для перекодировки- то я получаю их из модуля XML::RSS и пытаюсь их перекодировать в windows-1251 а XML::RSS в процессе своей работы входящие в него данные перекодирует в UTF-8
PM MAIL ICQ   Вверх
sharq
Дата 4.2.2006, 17:37 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Perl Liker
**


Профиль
Группа: Участник
Сообщений: 841
Регистрация: 13.12.2004
Где: Ростов-на-Дону

Репутация: 23
Всего: 28



rcdimon ты мой пример запускал?

у меня вот что:
Код

>perl utf2win.pl
Unicode: РїСЂРёРІРµС‚
Cyrillic:  привет





--------------------
[color=gray]There's More Than One Way To Do It[/color]
PM MAIL WWW ICQ Skype   Вверх
rcdimon
Дата 4.2.2006, 20:29 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 766
Регистрация: 12.7.2004
Где: Москва

Репутация: 1
Всего: 2



ДА. Работает если давать ему нормальные данные... НО smile Мне надо перекодировать то, что выдает XML::RSS! А вот при перекодировки его ответа как раз и происходит ошибка

Software error:
Cannot decode string with wide characters at q:/usr/perl58/lib/Encode.pm line 186.
For help, please send mail to the webmaster (rcdimon), giving this error message and the time and date of the error.
PM MAIL ICQ   Вверх
rcdimon
Дата 4.2.2006, 22:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 766
Регистрация: 12.7.2004
Где: Москва

Репутация: 1
Всего: 2



Короче rod() от символов получается больше чем 255. Поэтому он и не хочет эти символы перекодировать! А почему такие символы берутся- непонятно smile
PM MAIL ICQ   Вверх
korob2001
Дата 5.2.2006, 03:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 2871
Регистрация: 29.12.2002

Репутация: 31
Всего: 61



Код

use Text::Iconv;
my $conv = Text::Iconv->new("UTF-8", "WINDOWS-1251");
my $string = "Строка из XML в кодировке utf-8";
print $conv->convert( $string );



--------------------
"Время проходит", - привыкли говорить вы по неверному пониманию. 
"Время стоит - проходите вы".
PM MAIL WWW ICQ MSN   Вверх
rcdimon
Дата 5.2.2006, 08:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 766
Регистрация: 12.7.2004
Где: Москва

Репутация: 1
Всего: 2



А никак нельзя обойтись без подключения нестандартного модуля?
PM MAIL ICQ   Вверх
Sadok
Дата 6.2.2006, 11:13 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 74
Регистрация: 2.11.2004

Репутация: 1
Всего: 2



rcdimon
Цитата
А никак нельзя обойтись без подключения нестандартного модуля?

Вот тебе хэш,по нему и заменяй
Код

%code2char = (

# CYRILLIC 1251

1025 => "Ё",
1040 => "А",
1041 => "Б",
1042 => "В",
1043 => "Г",
1044 => "Д",
1045 => "Е",
1046 => "Ж",
1047 => "З",
1048 => "И",
1049 => "Й",
1050 => "К",
1051 => "Л",
1052 => "М",
1053 => "Н",
1054 => "О",
1055 => "П",
1056 => "Р",
1057 => "С",
1058 => "Т",
1059 => "У",
1060 => "Ф",
1061 => "Х",
1062 => "Ц",
1063 => "Ч",
1064 => "Ш",
1065 => "Щ",
1066 => "Ъ",
1067 => "Ы",
1068 => "Ь",
1069 => "Э",
1070 => "Ю",
1071 => "Я",
1072 => "а",
1073 => "б",
1074 => "в",
1075 => "г",
1076 => "д",
1077 => "е",
1078 => "ж",
1079 => "з",
1080 => "и",
1081 => "й",
1082 => "к",
1083 => "л",
1084 => "м",
1085 => "н",
1086 => "о",
1087 => "п",
1088 => "р",
1089 => "с",
1090 => "т",
1091 => "у",
1092 => "ф",
1093 => "х",
1094 => "ц",
1095 => "ч",
1096 => "ш",
1097 => "щ",
1098 => "ъ",
1099 => "ы",
1100 => "ь",
1101 => "э",
1102 => "ю",
1103 => "я",
1105 => "ё",
);

PM   Вверх
rcdimon
Дата 6.2.2006, 13:24 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 766
Регистрация: 12.7.2004
Где: Москва

Репутация: 1
Всего: 2



Пасиба smile
PM MAIL ICQ   Вверх
nitr
Дата 14.2.2006, 01:40 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник Клуба
Сообщений: 2543
Регистрация: 10.2.2006
Где: Россия :)

Репутация: 37
Всего: 84



Код


$content; 
utf2str(\$content);

sub utf2str {
  my $str = shift;
  die "$str is not a scalar reference" unless ref($str) eq 'SCALAR';
  $$str =~ s/\x{410}/А/g;
  $$str =~ s/\x{411}/Б/g;
  $$str =~ s/\x{412}/В/g;
  $$str =~ s/\x{413}/Г/g;
  $$str =~ s/\x{414}/Д/g;
  $$str =~ s/\x{415}/Е/g;
  $$str =~ s/\x{401}/Ё/g;
  $$str =~ s/\x{416}/Ж/g;
  $$str =~ s/\x{417}/З/g;
  $$str =~ s/\x{418}/И/g;
  $$str =~ s/\x{419}/Й/g;
  $$str =~ s/\x{41A}/К/g;
  $$str =~ s/\x{41B}/Л/g;
  $$str =~ s/\x{41C}/М/g;
  $$str =~ s/\x{41D}/Н/g;
  $$str =~ s/\x{41E}/О/g;
  $$str =~ s/\x{41F}/П/g;
  $$str =~ s/\x{420}/Р/g;
  $$str =~ s/\x{421}/С/g;
  $$str =~ s/\x{422}/Т/g;
  $$str =~ s/\x{423}/У/g;
  $$str =~ s/\x{424}/Ф/g;
  $$str =~ s/\x{425}/Х/g;
  $$str =~ s/\x{426}/Ц/g;
  $$str =~ s/\x{427}/Ч/g;
  $$str =~ s/\x{428}/Ш/g;
  $$str =~ s/\x{429}/Щ/g;
  $$str =~ s/\x{42A}/Ъ/g;
  $$str =~ s/\x{42B}/Ы/g;
  $$str =~ s/\x{42C}/Ь/g;
  $$str =~ s/\x{42D}/Э/g;
  $$str =~ s/\x{42E}/Ю/g;
  $$str =~ s/\x{42F}/Я/g;
  $$str =~ s/\x{430}/а/g;
  $$str =~ s/\x{431}/б/g;
  $$str =~ s/\x{432}/в/g;
  $$str =~ s/\x{433}/г/g;
  $$str =~ s/\x{434}/д/g;
  $$str =~ s/\x{435}/е/g;
  $$str =~ s/\x{451}/ё/g;
  $$str =~ s/\x{436}/ж/g;
  $$str =~ s/\x{437}/з/g;
  $$str =~ s/\x{438}/и/g;
  $$str =~ s/\x{439}/й/g;
  $$str =~ s/\x{43A}/к/g;
  $$str =~ s/\x{43B}/л/g;
  $$str =~ s/\x{43C}/м/g;
  $$str =~ s/\x{43D}/н/g;
  $$str =~ s/\x{43E}/о/g;
  $$str =~ s/\x{43F}/п/g;
  $$str =~ s/\x{440}/р/g;
  $$str =~ s/\x{441}/с/g;
  $$str =~ s/\x{442}/т/g;
  $$str =~ s/\x{443}/у/g;
  $$str =~ s/\x{444}/ф/g;
  $$str =~ s/\x{445}/х/g;
  $$str =~ s/\x{446}/ц/g;
  $$str =~ s/\x{447}/ч/g;
  $$str =~ s/\x{448}/ш/g;
  $$str =~ s/\x{449}/щ/g;
  $$str =~ s/\x{44A}/ъ/g;
  $$str =~ s/\x{44B}/ы/g;
  $$str =~ s/\x{44C}/ь/g;
  $$str =~ s/\x{44D}/э/g;
  $$str =~ s/\x{44E}/ю/g;
  $$str =~ s/\x{44F}/я/g;
}



--------------------
PM   Вверх
sharq
Дата 14.2.2006, 11:08 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Perl Liker
**


Профиль
Группа: Участник
Сообщений: 841
Регистрация: 13.12.2004
Где: Ростов-на-Дону

Репутация: 23
Всего: 28



nitr, попробуй то же самое сделать через tr и задание диапазона значений (значения у тебя ведь попорядку идут). smile

Зачем в ручную конвертировать, это же не транслит?
В perl 5.8.x - есть модуль Encode, который входит в стандартную поставку perl. (!)
В perl 5.6.x - можно используя дополнительные модули, например, cyrillic или Text::Iconv.

Всем советую переходить на perl 5.8.7 - последюю стабильную версию perl и использовать встроенные средства.

smile



--------------------
[color=gray]There's More Than One Way To Do It[/color]
PM MAIL WWW ICQ Skype   Вверх
nitr
Дата 14.2.2006, 12:28 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник Клуба
Сообщений: 2543
Регистрация: 10.2.2006
Где: Россия :)

Репутация: 37
Всего: 84



=) Ему почему-то так не хотелось... И ещёё раз повторяюсь, на многих шеллах перл 5.004 и 5.005, и бывает урезаны модули, так что всё ОК думаю smile А это код я привёл как ещё один пример, выше до меня были уже... верные.


--------------------
PM   Вверх
sharq
Дата 14.2.2006, 14:29 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Perl Liker
**


Профиль
Группа: Участник
Сообщений: 841
Регистрация: 13.12.2004
Где: Ростов-на-Дону

Репутация: 23
Всего: 28



Цитата(nitr @ 14.2.2006, 13:28 Найти цитируемый пост)
И ещёё раз повторяюсь, на многих шеллах перл 5.004 и 5.005

к чертям такие шеллы!
Нормальная support-команда достаточно хорошо следит за своим программным обеспечением.




--------------------
[color=gray]There's More Than One Way To Do It[/color]
PM MAIL WWW ICQ Skype   Вверх
nitr
Дата 14.2.2006, 17:05 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник Клуба
Сообщений: 2543
Регистрация: 10.2.2006
Где: Россия :)

Репутация: 37
Всего: 84



Я думаю, скорее про халявные говрил ;)


--------------------
PM   Вверх
Страницы: (3) Все [1] 2 3 
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Perl"
korob2001
sharq
  • В этом разделе обсуждаются общие вопросы по языку Perl
  • Если ваш вопрос относится к системному программированию, задавайте его здесь
  • Если ваш вопрос относится к CGI программированию, задавайте его здесь
  • Интерпретатор Perl можно скачать здесь ActiveState, O'REILLY, The source for Perl
  • Справочное руководство "Установка perl-модулей", можно скачать здесь


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Perl: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0967 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.