Модераторы: LSD, AntonSaburov
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> String -> hex -> String, и не ancii символы 
V
    Опции темы
GZep
Дата 2.3.2011, 01:03 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


участник Винграда
***


Профиль
Группа: Завсегдатай
Сообщений: 1528
Регистрация: 7.7.2006
Где: Москва

Репутация: нет
Всего: 32



Здравствуйте!

Вот такой код:
Код

    public static encodeAndDecodeString(String string) {

        byte[] bytes = string.getBytes();
        final StringBuilder buf = new StringBuilder(bytes.length * 2);

        for (final byte b : bytes) {

            buf.append(Integer.toHexString(b));

        }

        String result = buf.toString().toUpperCase();//Результат кодирования
System.out.println("закодированно: " + result );

//ДАЛЕЕ РАСКОДИРУЕМ ОБРАТНО

        char[] chars = result.toCharArray();
        final StringBuilder buf2 = new StringBuilder(chars.length / 2);

        for (int i = 0; i < chars.length; i += 2) {

            buf2.append((char) Integer.parseInt(chars[i] + "" + chars[i + 1], 16));

        }

System.out.println("декодированно: " + buf2.toString());

    }

функция кодирует строку в строку состоящую из шестнадцатеричных кодов её символов, потом пытается из этих кодов восстановить обратно искомую строку.

Проблема: не работает кириллица.

Это сообщение отредактировал(а) GZep - 2.3.2011, 01:05


--------------------
user posted imageuser posted image
PM MAIL WWW ICQ Skype GTalk   Вверх
jk1
Дата 2.3.2011, 08:57 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Участник
Сообщений: 1168
Регистрация: 17.10.2008
Где: Санкт-Петербург

Репутация: 40
Всего: 75



Код

public class Test {

    public static byte[] hexStringToByteArray(String s) {
        int len = s.length();
        byte[] data = new byte[len / 2];
        for (int i = 0; i < len; i += 2) {
            data[i / 2] = (byte) ((Character.digit(s.charAt(i), 16) << 4)
                    + Character.digit(s.charAt(i + 1), 16));
        }
        return data;
    }

    public static String byteArrayToHexString(byte[] b) {
        StringBuilder result = new StringBuilder();
        for (int i = 0; i < b.length; i++) {
            result.append(Integer.toString((b[i] & 0xff) + 0x100, 16).substring(1));
        }
        return result.toString();
    }

    public static void main(String[] args)  {
        String s = "Киррилический текст";
        System.out.println("Incoming: " + s);
        String result = byteArrayToHexString(s.getBytes());
        System.out.println("Encoded: " + result);
        System.out.println("Decoded: " + new String(hexStringToByteArray(result)));
    }
}



--------------------
Opinions are like assholes — everybody has one
PM MAIL   Вверх
Skipy
Дата 2.3.2011, 11:34 (ссылка) |    (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 487
Регистрация: 24.8.2006
Где: Москва, Россия

Репутация: 6
Всего: 16



А где Вы учитываете, что Integer.toHexString(b) для некоторых значений вернет не два символа, а один? Например, для 13 (CR) - d, 10(LF) - a, 8 (TAB) - 8. А комбинация CRLF - это перевод строки в Win, так что может встретиться. При декодировании Ваш код даст сбой в таком случае.

Кстати. Результат работы getBytes отличается на разных платформах, если Вы не указали кодировку.


--------------------
С уважением,
Евгений aka Skipy
www.skipy.ru
PM MAIL WWW ICQ   Вверх
GZep
Дата 2.3.2011, 12:11 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


участник Винграда
***


Профиль
Группа: Завсегдатай
Сообщений: 1528
Регистрация: 7.7.2006
Где: Москва

Репутация: нет
Всего: 32



Цитата(Skipy @  2.3.2011,  11:34 Найти цитируемый пост)
А где Вы учитываете, что Integer.toHexString(b) для некоторых значений вернет не два символа, а один? Например, для 13 (CR) - d, 10(LF) - a, 8 (TAB) - 8. А комбинация CRLF - это перевод строки в Win, так что может встретиться. При декодировании Ваш код даст сбой в таком случае.

Вот в принципе, думал по этому поводу, но ковыряния кода в этом направлении быстро прекратил.

На самом деле у меня есть решение, но оно "в лоб" - это URLEncode на входе и URLDecode на выходе соответственно. Вот и хотелось увидеть адекватную реализацию.
Цитата(Skipy @  2.3.2011,  11:34 Найти цитируемый пост)
Кстати. Результат работы getBytes отличается на разных платформах, если Вы не указали кодировку. 

А поддержка UTF-8 везде есть? Нужно как-то исключение обрабатывать из-за отсутствия кодировки или игнорировать?
jk1, спасибо огромное, сейчас попробую!


--------------------
user posted imageuser posted image
PM MAIL WWW ICQ Skype GTalk   Вверх
LSD
Дата 2.3.2011, 12:22 (ссылка) |    (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Leprechaun Software Developer
****


Профиль
Группа: Модератор
Сообщений: 15718
Регистрация: 24.3.2004
Где: Dublin

Репутация: 210
Всего: 538



Цитата(GZep @  2.3.2011,  12:11 Найти цитируемый пост)
А поддержка UTF-8 везде есть? Нужно как-то исключение обрабатывать из-за отсутствия кодировки или игнорировать?

UTF-8 должна быть на всех Java платформах, так что исключение можно и проигнорировать.


--------------------
Disclaimer: this post contains explicit depictions of personal opinion. So, if it sounds sarcastic, don't take it seriously. If it sounds dangerous, do not try this at home or at all. And if it offends you, just don't read it.
PM MAIL WWW   Вверх
GZep
Дата 2.3.2011, 13:46 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


участник Винграда
***


Профиль
Группа: Завсегдатай
Сообщений: 1528
Регистрация: 7.7.2006
Где: Москва

Репутация: нет
Всего: 32



Вот чуть-чуть переделанный вариант jk1'а.
Код

public final class Hexadecimal {

    private static String CHARSET_NAME = "UTF-8";

    public static String encodeString(String string) {

        byte[] bytes;

        try {

            bytes = string.getBytes(CHARSET_NAME);

        } catch (UnsupportedEncodingException e) {
            
            bytes = string.getBytes();

        }

        final StringBuilder buf = new StringBuilder(bytes.length * 2);

        for (final byte b : bytes) {

            buf.append(Integer.toHexString(b & 0xFF));

        }

        return buf.toString().toUpperCase();

    }

    public static String decodeString(String string) {

        int length = string.length();

        if ((length % 2) != 0) {

            throw new IllegalArgumentException("Input string must contain an even number of characters");

        }

        byte[] bytes = new byte[length / 2];

        for (int i = 0; i < length; i += 2) {

            bytes[i / 2] = (byte) ((Character.digit(string.charAt(i), 16) << 4)
                    + Character.digit(string.charAt(i + 1), 16));

        }

        try {

            return new String(bytes, CHARSET_NAME);

        } catch (UnsupportedEncodingException e) {

            return new String(bytes);

        }

    }

}

Всем большое спасибо за помощь!


--------------------
user posted imageuser posted image
PM MAIL WWW ICQ Skype GTalk   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Java"
LSD   AntonSaburov
powerOn   tux
javastic
  • Прежде, чем задать вопрос, прочтите это!
  • Книги по Java собираются здесь.
  • Документация и ресурсы по Java находятся здесь.
  • Используйте теги [code=java][/code] для подсветки кода. Используйтe чекбокс "транслит", если у Вас нет русских шрифтов.
  • Помечайте свой вопрос как решённый, если на него получен ответ. Ссылка "Пометить как решённый" находится над первым постом.
  • Действия модераторов можно обсудить здесь.
  • FAQ раздела лежит здесь.

Если Вам помогли, и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, LSD, AntonSaburov, powerOn, tux, javastic.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Java: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0768 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.