Модераторы: LSD, AntonSaburov
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Парсинг XML из строкового потока. Как парсить XML в кодировке Unicode? 
:(
    Опции темы
SID_M
Дата 6.4.2006, 11:04 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 195
Регистрация: 11.2.2005
Где: Россия, г. Москва

Репутация: нет
Всего: нет



Есть проблема!
XML контенты хранятся в базе данный, как строка. По запросу достаются из базы, парсятся и выдаётся адаптированное содержание пользователю.
Выдается такая ошибка:
[Fatal Error] :1:49: An invalid XML character (Unicode: 0x10) was found in the value of attribute "ID" and element is "STORED_FRAGMENT".
org.xml.sax.SAXParseException: An invalid XML character (Unicode: 0x10) was found in the value of attribute "ID" and element is "STORED_FRAGMENT".

Структура XML не важна, приводить тут её не буду. Вот текст, который парсит эту XML-ку.
Код

                    String docXMLContent = baseWorker.getDocumentContentByID(selTerminalNode.getID());                    
                    
                    StringBufferInputStream sbis = new StringBufferInputStream(docXMLContent); 
                                        
                    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
                    DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
                    
                    Document document = docBuilder.parse(sbis); // тут ошибка

ПОМОГИТЕ!!! Что делать? smile

Это сообщение отредактировал(а) SID_M - 6.4.2006, 11:05
--------------------
Если тебе не дано летать, то хотя бы ползай с гордо поднятой головой.
PM MAIL ICQ Skype GTalk   Вверх
LSD
Дата 6.4.2006, 11:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Leprechaun Software Developer
****


Профиль
Группа: Модератор
Сообщений: 15718
Регистрация: 24.3.2004
Где: Dublin

Репутация: 210
Всего: 538



Цитата(SID_M @ 6.4.2006, 12:04 Найти цитируемый пост)
Структура XML не важна, приводить тут её не буду. Вот текст, который парсит эту XML-ку.

А ты уверен, что XML корректный (проверь его другим парсером)? И какой именно юникод используется?


--------------------
Disclaimer: this post contains explicit depictions of personal opinion. So, if it sounds sarcastic, don't take it seriously. If it sounds dangerous, do not try this at home or at all. And if it offends you, just don't read it.
PM MAIL WWW   Вверх
SID_M
Дата 6.4.2006, 12:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 195
Регистрация: 11.2.2005
Где: Россия, г. Москва

Репутация: нет
Всего: нет



Да, он корректный. Я его в Altova XML Spy проверял, причем он создан по схеме, которая с помощью Altova написана.
А юникод UTF-8 использую.
--------------------
Если тебе не дано летать, то хотя бы ползай с гордо поднятой головой.
PM MAIL ICQ Skype GTalk   Вверх
LSD
Дата 6.4.2006, 22:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Leprechaun Software Developer
****


Профиль
Группа: Модератор
Сообщений: 15718
Регистрация: 24.3.2004
Где: Dublin

Репутация: 210
Всего: 538



1. Замени StringBufferInputStream на StringReader:
Код
String docXMLContent = baseWorker.getDocumentContentByID(selTerminalNode.getID());
DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
Document document = docBuilder.parse(new InputSource(new StringReader(docXMLContent)));


2. Если не поможет, то попробуй распарсить документ из файла:
Код
FileInputStream in = new FileInputStream("some.xml");
DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
Document document = docBuilder.parse(in);

будет он ругаться или нет.


--------------------
Disclaimer: this post contains explicit depictions of personal opinion. So, if it sounds sarcastic, don't take it seriously. If it sounds dangerous, do not try this at home or at all. And if it offends you, just don't read it.
PM MAIL WWW   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Java"
LSD   AntonSaburov
powerOn   tux
javastic
  • Прежде, чем задать вопрос, прочтите это!
  • Книги по Java собираются здесь.
  • Документация и ресурсы по Java находятся здесь.
  • Используйте теги [code=java][/code] для подсветки кода. Используйтe чекбокс "транслит", если у Вас нет русских шрифтов.
  • Помечайте свой вопрос как решённый, если на него получен ответ. Ссылка "Пометить как решённый" находится над первым постом.
  • Действия модераторов можно обсудить здесь.
  • FAQ раздела лежит здесь.

Если Вам помогли, и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, LSD, AntonSaburov, powerOn, tux, javastic.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Java: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0670 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.