Модераторы: powerfox, ZeeLax
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Преобразование текстовых файлов в UTF-8 
:(
    Опции темы
arcsupport
Дата 8.12.2010, 23:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 725
Регистрация: 24.10.2008

Репутация: нет
Всего: 2



Есть каталог. В нем МНОГО текстовых файлов. Они имеют различную кодировку, в т.ч. CP866, CP1251, Unicode (BE и LE), KOI-8.
Их надо всех:
  • Перекодировать в UTF8
  • Изменить символы окончания строки на unix-like.
Дайте команду и/или скрипт для этих целей.
PM MAIL   Вверх
Egik2
Дата 9.12.2010, 11:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 302
Регистрация: 29.7.2008
Где: Агудзера

Репутация: 4
Всего: 11



Все утро пытался решить твою проблему smile.
К сожалению стандартными средствами не получается.
Под стандартными я понимаю команду iconv - для нее на входе уже должна быть задана кодировка из которой перекодировать.
делал это средствами file, но толком ничего не получилось.
Вот скрипт:
Код

#!/bin/bash

to="UTF-8";

for file in `find $1 -type f`
do
 from=`file -bi $file  | perl -e 'my $input = <>; $input =~ /charset=(.*)$/; print $1'`;
 echo "Converting $file from $from to $to"
 iconv -f $from -t $to $file > $file.$to;
done;

Проблема в том, что команда file -bi не всегда выводит правильную кодировку.

Вернулись к тому, с чего начали - используй утилиту enca
Скачать например здесь

По поводу символов окончания используй команду dos2unix - если надо из виндовой кодировки в unixовую


Это сообщение отредактировал(а) Egik2 - 9.12.2010, 11:30


--------------------
Три великие добродетели программиста: лень, нетерпение и самомнение (Larry Wall)
a-nav.com
developer-blog.ru
world-poetry.org
PM MAIL WWW ICQ   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Linux/UNIX: Oбщие вопросы"
nickless
Imple
nerezus

В тему здесь вопросы общие - не привязанные к определенному ПО или дистрибутиву BSD/Linux/UNIX.
Например вопросы о выборе ОС для определенных задач (но если Вы просто хотите узнать "Какой дистрибутив лучше", то для этого есть Клуб юнуксоидов).
Общие вопросы по shell-программированию тоже лучше задавать здесь.


  • Вопросы мобильной разработки тут
  • Вы должны соблюдать правила форума.
  • Помните: какой вопрос, такой и ответ. Прежде чем задать вопрос прочитайте вот эту статью на форуме CIT.
  • Оскорблять запрещается.
  • Религиозные войны в Религиозных войнах.
  • Общение "просто так" в Клубе юнуксоидов. В отличие от многих других разделов, здесь разрешается сдержанно оффтопить и юморить в тему.

За интересные статьи, находки, решения, программы и просто реальную помощь будут ставиться + в репу).


В данный момент этот раздел модерируют nerezus, nickless, powerfox, pythonwin, Imple и ZeeLax. Если вы хотите помочь нам, пишите в ПМ и мы обсудим.


Спасибо. И use UNIX or die; С уважением, nerezus, nickless, powerfox, pythonwin, Imple, ZeeLax.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | *NIX системы: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0684 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.