Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > Java: Общие вопросы > Парсинг русского XML


Автор: Гость_NIMahno 5.2.2004, 12:31
Разбираю DOMParser-ром XML-фаил типа:

<lan>
<en>Hello</en>
<русс>Привет</русс>
</lan>

после ввода строки:

<?xml version="1.0" encoding="Windows-1251"?>

даже ругаться перестал, и правильно разбирать начал, хотя при проссмотре в java-приложении - разбирает, но русские слова выдает в неразборчивой кодировке.

Однако, я еще вызываю этот класс в JSP и прошу у него отдельные строки из XML, которые вывожу в окно браузера. Там уже выводится как "?confused.gif?", т.е. даже не псевдографикой.

Посоветуйте на каком этапе лучше производить перекодировку и предположительно из чего во что...

Автор: NIMahno 5.2.2004, 12:43
Снова я, но уже опознаный
я смайлик не вставлял, хотел просто показать, что выводится вопросительными знаками

Автор: XClan 5.2.2004, 12:52
Используй для создания XML файлов какой нибудь редактор специально предназначенный для редактирования XML , он то наверняка сохранит твой файл в кодировке UTF-8
А если ты пишешь в каком нибудь Notepad - он естественно сохраняет твои файлы в системной кодировке (в случае Windows - CP1251)
ну и конечно парсер потом оказывается в дурацком положении
ему говорят что тут UTF-8 а он находит строки содержащие символы с кодами которых в UTF-8 нет.
насчёт редактора - лично мне понравился XML Spy
http://www.xmlspy.com

Взята http://www.relib.com/forums/topic.asp?id=756460

Автор: AntonSaburov 5.2.2004, 13:42
В добавление сказанному - часто XML файл содержит первый символ, который говорит в какой кодировке сам файл.

Автор: NIMahno 6.2.2004, 10:49
XML Spy - программа видать хорошая, мощная (15М как-никак), но без VS-Net ставиться отказывается. А последний продукт мне даром не сдался...

Автор: XClan 6.2.2004, 11:27
Aditor pro кажется знает такую кодировку или я ошибаюсь?

Автор: BearBeer 6.2.2004, 13:22
http://xmlcooktop.com/
- бесплатный редактор.


В программе попробуй читать не строкой, а потоком байт.

Автор: NIMahno 9.2.2004, 16:29
нашел уж, и даже вывел, как на консоль, так и в JSP.
Спасибо

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)