Модераторы: Daevaorn
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Multibyte char в wchar_t 
V
    Опции темы
Therion
Дата 13.10.2009, 11:10 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 121
Регистрация: 21.12.2003

Репутация: нет
Всего: нет



Доброе время суток. У меня есть масив типа char где сохранена строка имеющая 2-х байтовые символы \xC3\xBC и \xC3\x9F (ü и ß). При преобоазовании функциями типа mbstowcs, я вместо одного нужного получаю по два символа Гј и Гџ. Как мне корректно сделать преобразования и получить нормальную строчку?
Заранее благодарен.
PM MAIL   Вверх
Alek86
Дата 13.10.2009, 11:17 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1299
Регистрация: 30.1.2007
Где: Киев

Репутация: 21
Всего: 25



можешь код показать?


--------------------
user posted image    user posted image
PM MAIL   Вверх
Therion
Дата 13.10.2009, 11:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 121
Регистрация: 21.12.2003

Репутация: нет
Всего: нет



Код

HTMLToRich(
        const std::string& inHTML,
        СRichText& outRichText
    )
{
    CHTMLParser parser;
    parser.enableDecodeEntity();
    parser.parse(inHTML);
    
    outRichText.Assign(parser.GetText(), parser.GetFormat());
}

К сожалению код CHTMLParser и СRichText показать не могу, да и писал не я их. Сюда приходит HTML код в котором и присутствуют эти символы. Парсер возвращает текст std::string, в котором и символы Гј и Гџ, которые являются частями нужных мне ü и ß. Нужно эту строку преобразовать в 2-х байтовую.
PM MAIL   Вверх
niXman
Дата 13.10.2009, 11:54 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 211
Регистрация: 4.7.2009

Репутация: 0
Всего: 0



Therion, Есть подозрение, что исходные данные у тебя в кодировке UTF-8
--------------------
if ( !c++ ) {   *power--;   this->wussiness += 10;}
PM MAIL   Вверх
xvr
Дата 13.10.2009, 13:55 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 7046
Регистрация: 28.8.2007
Где: Дублин, Ирландия

Репутация: 60
Всего: 223



MSDN:
Цитата

mbstowcs uses the current locale for any locale-dependent behavior;
т.е. выстави правильно локаль в начале программы (setlocale)

PM MAIL   Вверх
Therion
Дата 13.10.2009, 15:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 121
Регистрация: 21.12.2003

Репутация: нет
Всего: нет



Спасибо большое. setlocale помогла.
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "С++:Общие вопросы"
Earnest Daevaorn

Добро пожаловать!

  • Черновик стандарта C++ (за октябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика(4.4мб).
  • Черновик стандарта C (за сентябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика (3.4мб).
  • Прежде чем задать вопрос, прочтите это и/или это!
  • Здесь хранится весь мировой запас ссылок на документы, связанные с C++ :)
  • Не брезгуйте пользоваться тегами [code=cpp][/code].
  • Пожалуйста, не просите написать за вас программы в этом разделе - для этого существует "Центр Помощи".
  • C++ FAQ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Earnest Daevaorn

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | C/C++: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0810 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.