![]() |
Модераторы: LSD, AntonSaburov |
![]() ![]() ![]() |
|
unkis |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 802 Регистрация: 8.9.2004 Репутация: нет Всего: 1 |
Ребята у меня такая вот проблема, есть на диске файлы в линуксе, надо определить в какой кодировке они сохранены.
Это обычные .txt, то есть никакой информации в теле файла я не нашел. У кого-нибудь есть какие-нибудь идеи как это реализовать на java? Или если это можно реализовать средствами линукса тоге подойдет. -------------------- www.unkis.com |
|||
|
||||
valiantsin |
|
|||
Новичок Профиль Группа: Участник Сообщений: 13 Регистрация: 25.10.2007 Репутация: нет Всего: 1 |
Уважаемый ,
unkis, возможно вот этот код решит проблемму:
|
|||
|
||||
unkis |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 802 Регистрация: 8.9.2004 Репутация: нет Всего: 1 |
спасибо но как-то странно,
на все файлы которие я создал, будь-то utf-8 или ANSI, программа говорит Cp1252. что-то здесь не правильно -------------------- www.unkis.com |
|||
|
||||
Kangaroo |
|
|||
![]() AA - Aussie Animal ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 2042 Регистрация: 7.10.2006 Где: US Репутация: 21 Всего: 104 |
имхо, это:
выведет не кодировку файла, а кодировку, которую использует FileReader. А использует он кодировку по-умолчанию (если явно не указать другую). -------------------- Lost.... |
|||
|
||||
Alexandr87 |
|
|||
![]() дыкий псых ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1459 Регистрация: 27.11.2004 Где: Алматы, Казахстан Репутация: 9 Всего: 39 |
думаю стандратных средств нет, но
можно самому программку написать, которая будет это определять, просто методом перебора всех вероятных локалей. Полученный текст для данной локали, проверяется на соответсвие модели открытого текста русского языка (вероятностые характеристики отдельных символов, биграмм текста). Это сообщение отредактировал(а) Alexandr87 - 5.11.2007, 18:59 |
|||
|
||||
unkis |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 802 Регистрация: 8.9.2004 Репутация: нет Всего: 1 |
Так что должна это программка делать, по какому принципу она будет определять в какой кодировке файл ? -------------------- www.unkis.com |
|||
|
||||
Alexandr87 |
|
|||
![]() дыкий псых ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1459 Регистрация: 27.11.2004 Где: Алматы, Казахстан Репутация: 9 Всего: 39 |
unkis, выше посмотри, просто пока добавлял в пост, ты уже отписал.
и в линуксе была софтинка, для правильного определения кодировки русских тегов - rus-xmms (или как-то так?), можешь еще попробовывать посмотреть. Это сообщение отредактировал(а) Alexandr87 - 5.11.2007, 19:04 |
|||
|
||||
jer1 |
|
|||
![]() Шустрый ![]() Профиль Группа: Участник Сообщений: 123 Регистрация: 24.1.2005 Где: Харьков Украина Репутация: 4 Всего: 5 |
http://trific.ath.cx/software/enca/ (бывает не все гладко, но тем не менее)
--------------------
:w!q |
|||
|
||||
_Michael |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 375 Регистрация: 23.6.2007 Где: з полонини Репутация: 2 Всего: 6 |
http://ru.wikipedia.org/wiki/%D0%AE%D0%BD%....82.D0.BE.D0.B2
Вот здесь пишет о Юникоде. Если в начале файла есть хоть одна из указанных сигнатур, значит однозначно файл в том Юникоде, который соответсвует присутсвующей сигнатуре. Если ж в начале файла етого нету, а сразу идет текст, то надо тогда пользоваться как выразился Alexandr87 : ![]() -------------------- ...не убивайся ни о чем - все временно, хоть ночь темна но светлым днем беременна... Саади |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Java" | |
|
Если Вам помогли, и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, LSD, AntonSaburov, powerOn, tux, javastic. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Java: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |