Модераторы: skyboy, MoLeX, Aliance, ksnk

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Что это за кодировка?(2) 
V
    Опции темы
sTa1kEr
Дата 2.10.2007, 10:32 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


9/10 программиста
***


Профиль
Группа: Завсегдатай
Сообщений: 1553
Регистрация: 21.2.2007

Репутация: 56
Всего: 146



Цитата(sTa1kEr @  1.10.2007,  17:43 Найти цитируемый пост)
        $charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);

Хотя по поводу UTF-8 наврал... Здесь всегда используется 2 байта на символ, а в UTF-8 может быть переменное число байт. Скорее всего это UTF-16. Т.ч. перекодировать надо так
Код

echo mb_convert_encoding($str, "Windows-1251", "UTF-16");

PM MAIL   Вверх
Nickname
Дата 2.10.2007, 10:54 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 246
Регистрация: 24.10.2006
Где: Санкт-Петербург

Репутация: нет
Всего: 1



Цитата(sTa1kEr @  2.10.2007,  10:15 Найти цитируемый пост)
$str = "Свободные остатки ТМЦ на складах";
echo html_entity_decode($str, ENT_COMPAT, "cp1251"); // Свободные остатки ТМЦ на складах

В прицепе это помогло - все русские буквы стали русскими, но латинские так и остались html-сущностями (причем только в строках где есть и латинские и русские буквы вперемешку) - осталось только этот баг исправить и можно смело идти пить кофе...


Это сообщение отредактировал(а) Nickname - 2.10.2007, 10:58
PM MAIL   Вверх
Nickname
Дата 2.10.2007, 11:10 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 246
Регистрация: 24.10.2006
Где: Санкт-Петербург

Репутация: нет
Всего: 1



Все разобрался, спасибо огромное - просто подставил 
Код

$s=html_entity_decode(html_entity_decode($s, ENT_COMPAT, "cp1251"),ENT_COMPAT, "ISO-8859-1");

и все заработало.
PM MAIL   Вверх
sTa1kEr
Дата 2.10.2007, 12:11 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


9/10 программиста
***


Профиль
Группа: Завсегдатай
Сообщений: 1553
Регистрация: 21.2.2007

Репутация: 56
Всего: 146



Код

function uc2html($str) {
    $ret = '';
    for( $i=0; $i<strlen($str)/2; $i++ ) {
        $charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);
        $ret .= '&#'.$charcode.';';
    }
    return $ret;
}

$etalon = "Свободные остатки ТМЦ на складах";
foreach (mb_list_encodings() as $encoding)
{
    $new = mb_convert_encoding($etalon, $encoding, "HTML-ENTITIES");
    $html = uc2html($new);
    if ($etalon == $html)
    {
        echo "This function decode '$encoding' encoding!\n";
    }
}

Выдает
Код

This function decode 'byte2le' encoding!
This function decode 'UCS-2LE' encoding!
This function decode 'UTF-16LE' encoding!

Т.е. ваш парсер возвращает данные в кодировке UTF-16 с обратным порядком байт. Считайте, что это и есть ответ на вопрос вашей предыдущей темы. Т.ч. я бы все таки посоветовал не из html сущностей перекодировать, а сразу из UTF-16. Зачем делать лишнюю работу?
Код

echo mb_convert_encoding($str, "Windows-1251", "UTF-16LE");
// Или так
echo iconv("UTF-16LE", "Windows-1251", $str);

PM MAIL   Вверх
Nickname
Дата 2.10.2007, 12:32 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 246
Регистрация: 24.10.2006
Где: Санкт-Петербург

Репутация: нет
Всего: 1



Блин то что надо, Stalker, + в репутацию 
PM MAIL   Вверх
Ответ в темуСоздание новой темы Создание опроса
Правила форума "PHP"
Aliance
IZ@TOP
skyboy
SamDark
MoLeX

Новичкам:

  • PHP редакторы собираются и обсуждаются здесь
  • Электронные книги по PHP, документацию можно найти здесь
  • Интерпретатор PHP, полную документацию можно скачать на PHP.NET

Важно:

  • Не брезгуйте пользоваться тегами [code=php]КОД[/code] для повышения читабельности текста/кода.
  • Перед созданием новой темы воспользуйтесь поиском и загляните в FAQ
  • Действия модераторов можно обсудить здесь

Внимание:

  • Темы "ищу скрипт", "подскажите скрипт" и т.п. будут переноситься в форум "Web-технологии"
  • Темы с именами: "Срочно", "помогите", "не знаю как делать" будут УДАЛЯТЬСЯ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PHP: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0728 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.