![]() |
Модераторы: skyboy, MoLeX, Aliance, ksnk |
![]() ![]() ![]() |
|
Sniper_super |
|
||||
Шустрый ![]() Профиль Группа: Участник Сообщений: 84 Регистрация: 8.5.2007 Репутация: нет Всего: нет |
Здравствуйте!
Подключил библиотеку simple_html_dom.php для парсинга контента, файл запихнул в папку application\vendor\, создал action
где функция с файла simple_html_dom.php имеет следующее определение
и проблема в том что после $contents = file_get_contents($url, $use_include_path, $context, $offset); в $contents все русские символы записываются как \ufffd - вроде проблема не с кодировкой, а какая то магическая лажа с внешним файлом, поскольку когда я добавляю в action_index код $temp = file_get_contents( "http://lenta.ru/music/" ); то все нормально работает, может кто то стыкался с подобной проблемой. Это сообщение отредактировал(а) Sniper_super - 17.1.2012, 22:41 |
||||
|
|||||
$дмитрий |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1037 Регистрация: 19.6.2004 Репутация: 17 Всего: 45 |
Возможно проблема в том что на удаленной странице не указан meta charset, добавь сам
|
|||
|
||||
Sniper_super |
|
||||
Шустрый ![]() Профиль Группа: Участник Сообщений: 84 Регистрация: 8.5.2007 Репутация: нет Всего: нет |
Мистика какая то.
Интиресно что это случается только с сайтом лента.ру
Как результат в браузере
Русский текст в строке 3 удалился - остались только кавычки iconv - матюкается если вместо KOI8-U поставить UTF-8 - типа неопределенные символы хочу кодировать Это сообщение отредактировал(а) Sniper_super - 18.1.2012, 15:32 |
||||
|
|||||
krundetz |
|
|||
![]() Вечный странник ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1400 Регистрация: 14.6.2007 Где: НН(Сормово) Репутация: 20 Всего: 69 |
Sniper_super, а страница отдаваемая браузеру у тубя в UTF-8? Если да то ничего удивительного, ты же пытаешься вывести текст в разных кодировках.
|
|||
|
||||
Sniper_super |
|
|||
Шустрый ![]() Профиль Группа: Участник Сообщений: 84 Регистрация: 8.5.2007 Репутация: нет Всего: нет |
krundetz, это понятно, но прикол в том, смотри строчку 3, она пустая, то есть остались только кавычки от названия
|
|||
|
||||
ksnk |
|
|||
![]() прохожий ![]() ![]() ![]() ![]() Профиль Группа: Комодератор Сообщений: 6855 Регистрация: 13.4.2007 Где: СПб Репутация: 96 Всего: 386 |
В чем мистика-то? mb тебе честно декоднул кодировку и написал, что она UTF-8. После этого ты ее конвертируешь опять в UTF-8 из cp1251. Естественно процедура декодировки крутит у виска пальцем и выводит тебе пробелы... -------------------- Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! ![]() |
|||
|
||||
Sniper_super |
|
|||
Шустрый ![]() Профиль Группа: Участник Сообщений: 84 Регистрация: 8.5.2007 Репутация: нет Всего: нет |
ksnk, та нет, я кодирую с utf-8 в windows-1251 и получаю строку которая упустила все кириличиские символы, смотри http://docs.php.net/manual/en/function.mb-...rt-encoding.php
|
|||
|
||||
ksnk |
|
|||
![]() прохожий ![]() ![]() ![]() ![]() Профиль Группа: Комодератор Сообщений: 6855 Регистрация: 13.4.2007 Где: СПб Репутация: 96 Всего: 386 |
Да, у них с iconv разный порядок параметров...
Ну тогда надо посмотреть на страничку в кодировке windows, может все в порядке, просто броузер порезал.... Еще вариант - поменять window-1251 на cp1251. -------------------- Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! ![]() |
|||
|
||||
gta4kv |
|
|||
![]() Walking around mad. ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1868 Регистрация: 25.7.2006 Репутация: 21 Всего: 91 |
У меня вопрос немножко не в тему, зачем вы делаете:
Когда в Кохане работает автолоадер классов? |
|||
|
||||
Sniper_super |
|
|||
Шустрый ![]() Профиль Группа: Участник Сообщений: 84 Регистрация: 8.5.2007 Репутация: нет Всего: нет |
ksnk, Спасибо за cp1251, заработало. Ура!
Сделал mb_convert_encoding( $row->innertext, "UTF-8", "cp1251" ), странно что mb_detect_encoding( $row->innertext ) пишет UTF-8. Добавлено через 4 минуты и 41 секунду gta4kv, я сторонний пхп инклудю, который содержит функцию file_get_html З.Ы. С коханой недавно начал разбираться, пока нашел такой способ инклудить сторонний код. |
|||
|
||||
gta4kv |
|
|||
![]() Walking around mad. ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1868 Регистрация: 25.7.2006 Репутация: 21 Всего: 91 |
Загляните в \system\classes\kohana\core.php
метод auto_load ![]() Добавлено @ 19:57 инклюдить руками ничего не надо, кохана сделает все сама upd ах, у вас функция, а не класс, тогда я извиняюсь. Это сообщение отредактировал(а) gta4kv - 23.1.2012, 21:26 |
|||
|
||||
krundetz |
|
|||
![]() Вечный странник ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1400 Регистрация: 14.6.2007 Где: НН(Сормово) Репутация: 20 Всего: 69 |
||||
|
||||
![]() ![]() ![]() |
Правила форума "PHP" | |
|
Новичкам:
Важно:
Внимание:
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | PHP: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |