Модераторы: BearBeer
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Как получить текст *.doc файла? 
:(
    Опции темы
multik
Дата 9.3.2009, 19:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 16
Регистрация: 10.7.2008

Репутация: нет
Всего: нет



Всем привет!!!

 Задача такая, необходимо найти в файле *.doc  некоторую последовательность  символов. Как найти эти символы и все другое мне понятно, а как вот найти их в *doc - нет, т.к. кроме текста *.doc файлы тащат с собой кучу ненужной информации, и например вот такое вот послание:

 A/62/638-S/2008/14  

может быть закодировано так:

 A}{\rtlch\fcs1 \af0\afs18 \ltrch\fcs0 \cs32\fs18\lang1049\langfe1033\langfenp1033\insrsid9767021\charrsid9767021 /62/638}{\rtlch\fcs1 
\ab\af0\afs36 \ltrch\fcs0 \cs27\b\fs36\lang1049\langfe1033\langfenp1033\insrsid9767021\charrsid9767021 -}{\rtlch\fcs1 \ab\af0\afs36 \ltrch\fcs0 \cs27\b\fs36\lang1033\langfe1033\langnp1033\langfenp1033\insrsid9767021 S}{\rtlch\fcs1 \af0\afs18 \ltrch\fcs0 \cs32\fs18\lang1049\langfe1033\langfenp1033\insrsid9767021\charrsid9767021 /2008/14

 соответственно то что я ищу я не найду.

Если у кого есть какие идеи как можно получить только текст из doc-файлов или как найти то что я хочу в doc файле, буду рада услышать))))
PM MAIL   Вверх
SABROG
Дата 9.3.2009, 19:42 (ссылка) |   (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Hacker
****


Профиль
Группа: Завсегдатай
Сообщений: 2481
Регистрация: 18.9.2006

Репутация: нет
Всего: 91





--------------------
Национальная группа Russian Federation на QtCentre.
PM MAIL   Вверх
multik
Дата 12.3.2009, 22:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 16
Регистрация: 10.7.2008

Репутация: нет
Всего: нет



SABROG как нить по другому нельзя сделать, а то я с библиотеками никогда не работала и даже не знаю с какой стороны к ней подойти. smile 


PM MAIL   Вверх
Любитель
Дата 13.3.2009, 00:03 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Программист-романтик
****


Профиль
Группа: Комодератор
Сообщений: 3645
Регистрация: 21.5.2005
Где: Воронеж

Репутация: нет
Всего: 92



Если речь не о библиотеках - то причём вообще С++? И тм более данный раздел.


--------------------
PM MAIL ICQ Skype   Вверх
Данкинг
Дата 13.3.2009, 00:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Yersinia pestis
****


Профиль
Группа: Завсегдатай
Сообщений: 8302
Регистрация: 7.11.2006
Где: მოსკოვი

Репутация: 1
Всего: 130



Цитата(multik @  9.3.2009,  19:12 Найти цитируемый пост)
как можно получить только текст из doc-файлов 

Написать программу, которая будет открывать .doc и искать то, что нужно, на любом известном тебе языке. smile Или я чего-то не понял?


--------------------
There's nothing left but silent epitaphs.
PM MAIL WWW   Вверх
leneCaress
Дата 15.3.2009, 18:34 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 54
Регистрация: 12.12.2008
Где: Москва

Репутация: нет
Всего: 1



есть такая программа - antiword ( http://www.winfield.demon.nl/ )
пропускаешь через него документ и работаешь как с простым текстом =)
PM MAIL   Вверх
Google
  Дата 19.11.2019, 12:50 (ссылка)  





  Вверх
  
Ответ в темуСоздание новой темы Создание опроса
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Форматы файлов и данных | Следующая тема »


 




[ Время генерации скрипта: 0.0821 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.