|
Модераторы: Aliance, skyboy, MoLeX, ksnk |
|
Лёша Тёмный |
|
|||
Unregistered |
Проблема такая:
Есть HTML в кодировке windows-1251 Загружаю его в DOMDocument: $xml->loadHTML($text); Сохраняю ввиде xml: $xml->save("test.xml"); Открываю test.xml в браузере и вижу: часть текста в ввиде кракозябр (Âîññòàíîâëåíèå èíôîðìàöèè), а часть отображается нормально. Пробовал перед $xml->save вставлять $xml->encoding='utf-8'; // windows-1251, utf-16 в конечном итоге все равно есть кракозябры. Причем всегда каждый тестовый блок либо полностью нормальный либо в крокозябрах Пробовал исходный HTML конвертировать в utf-8 ($text = iconv('windows-1251', 'utf-8', $text)) - тогда вообще весть текст не читаем. PS: В общем нужно перегнать HTML (с кирилицей в windows-1251) в корректный XML (в любой кодировке windows-1251 или utf-8) для последующей обработки. Если есть другой варинт конвертировать, буду рад рассмотреть. |
|||
|
||||
Diesel Draft |
|
|||
Опытный Профиль Группа: Участник Сообщений: 876 Регистрация: 18.1.2005 Где: Lviv, Ukraine Репутация: нет Всего: 5 |
|
|||
|
||||
Kostuch |
|
|||
Новичок Профиль Группа: Участник Сообщений: 12 Регистрация: 10.9.2007 Где: Ukraine, Kiev Репутация: нет Всего: нет |
Аналогично и у меня, но незнаю помогло ли человеку что тут написал Ваша строчка мне не помогла... у меня есть такой вот файлик (http://files.kostya.net.ua/ftp/otovs.htm) и такой вот код в ПХП, выдает те самые каракули :(
|
|||
|
||||
Kostuch |
|
|||
Новичок Профиль Группа: Участник Сообщений: 12 Регистрация: 10.9.2007 Где: Ukraine, Kiev Репутация: нет Всего: нет |
и тишинаааа.............
Неужели никто не пользовался ? Это сообщение отредактировал(а) Kostuch - 14.12.2007, 10:29 |
|||
|
||||
Ruzzz |
|
|||
Новичок Профиль Группа: Участник Сообщений: 20 Регистрация: 8.3.2008 Репутация: 1 Всего: 1 |
А проблема то до сих пор Кто нибудь может подсказать решение?
|
|||
|
||||
Ruzzz |
|
|||
Новичок Профиль Группа: Участник Сообщений: 20 Регистрация: 8.3.2008 Репутация: 1 Всего: 1 |
вот решение: Функция подготовки html-кода для работы с DOM — решает проблемы с кириллицей!
Это сообщение отредактировал(а) Ruzzz - 12.6.2009, 14:09 |
|||
|
||||
patt |
|
|||
Бывалый Профиль Группа: Участник Сообщений: 230 Регистрация: 9.11.2004 Где: Николаев Репутация: нет Всего: 2 |
Ruzzz, спасибо за готовое решение, подозревал, что DOMDocument не осилил правильно распарсить документ и поэтому не шарит какую кодировку ставить, но мысль писать это самому нагояло тоску.... это +
|
|||
|
||||
HongKilDong |
|
|||
Новичок Профиль Группа: Участник Сообщений: 9 Регистрация: 19.9.2008 Репутация: нет Всего: нет |
Есть такая проблема, чуть не поседел пока нашёл решение - перепробовал кучу методов и в моём случае железно сработал такой хак:
Проверенно при парсинге кода более чем 30 сайтов - работает безотказно. Надеюсь это решение спасёт миллиарды нервных клеток ;) |
|||
|
||||
Luckylad |
|
|||
Новичок Профиль Группа: Участник Сообщений: 14 Регистрация: 27.11.2005 Где: Саратов/Россия Репутация: нет Всего: нет |
Ruzzz,
cпасибо, ваш код мне помог! |
|||
|
||||
akazakou |
|
||||
Новичок Профиль Группа: Участник Сообщений: 1 Регистрация: 9.1.2013 Репутация: нет Всего: нет |
Спасибо мужик! Полдня мучался с вопросом, почему так происходит! |
||||
|
|||||
night00 |
|
||||
Новичок Профиль Группа: Участник Сообщений: 11 Регистрация: 29.10.2011 Репутация: нет Всего: нет |
Спасибо, помогло!!! |
||||
|
|||||
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | PHP: X технологии | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |