Модераторы: LSD, AntonSaburov
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Lucene, получить все уникальные слова. Lucene 
:(
    Опции темы
CSharpProgrammer
Дата 13.5.2011, 16:22 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 44
Регистрация: 6.7.2006

Репутация: нет
Всего: нет



Доброго времени суток!

Задача такая, есть большой текстовый файл, нужно получить все уникальные слова из этого текста при помощи Lucene. Подскажите как лучше это сделать? С Lucene я новичек.
PM MAIL   Вверх
CSharpProgrammer
Дата 14.5.2011, 18:45 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 44
Регистрация: 6.7.2006

Репутация: нет
Всего: нет



Код

List<String> sentences = ...
Directory d = new RAMDirectory();
StandardAnalyzer analyzer = new StandardAnalyzer(MATCH_VERSION, new HashSet<String>());
IndexWriterConfig conf = new IndexWriterConfig(MATCH_VERSION, analyzer);
IndexWriter w = new IndexWriter(d, conf);
for (String sentence : sentences) {
    Document doc = new Document();
    doc.add(new Field("sentence", value, Field.Store.YES, Field.Index.ANALYZED));
    w.addDocument(doc);
}
w.optimize();
w.close();

IndexReader ir = IndexReader.open(dir);
TermEnum trms = ir.terms();
int count = 0;
while (trms.next()){
    Term t = trms.term();
    System.out.println(++count + ". " + t.text() + ":" + trms.docFreq());
}

PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Java"
LSD   AntonSaburov
powerOn   tux
javastic
  • Прежде, чем задать вопрос, прочтите это!
  • Книги по Java собираются здесь.
  • Документация и ресурсы по Java находятся здесь.
  • Используйте теги [code=java][/code] для подсветки кода. Используйтe чекбокс "транслит", если у Вас нет русских шрифтов.
  • Помечайте свой вопрос как решённый, если на него получен ответ. Ссылка "Пометить как решённый" находится над первым постом.
  • Действия модераторов можно обсудить здесь.
  • FAQ раздела лежит здесь.

Если Вам помогли, и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, LSD, AntonSaburov, powerOn, tux, javastic.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Java: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0844 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.