Модераторы: LSD
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Поиск по словарю, сделать как можно быстрее 
:(
    Опции темы
Carlos0N
Дата 1.11.2012, 14:00 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 73
Регистрация: 9.10.2007

Репутация: нет
Всего: 1



Здравствуйте! Имеется словарь русских слов в нормальной форме с указанием части речи, к каждому слову прилагается его форма в различных падежах и его синонимы. Необходимо по слову с любой форме находить его нормальную форму и часть речи с синонимами.
Есть особенность в том, что словарь меняться после создания не будет и работать с ним будут только на чтение.
Поиск надо организовать как можно более быстрый.
Пока мне не понятно, надо ли использовать full text search, как лучше организовать базу и какие примочки использовать для ускорения поиска.
Буду крайне благодарен за любые советы.
PM MAIL ICQ   Вверх
Akina
Дата 1.11.2012, 14:05 (ссылка) |    (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Советчик
****


Профиль
Группа: Модератор
Сообщений: 20581
Регистрация: 8.4.2004
Где: Зеленоград

Репутация: 3
Всего: 454



Цитата(Carlos0N @  1.11.2012,  15:00 Найти цитируемый пост)
надо ли использовать full text search

Нет

Цитата(Carlos0N @  1.11.2012,  15:00 Найти цитируемый пост)
как лучше организовать базу 

Нормализовать данные

Цитата(Carlos0N @  1.11.2012,  15:00 Найти цитируемый пост)
какие примочки использовать для ускорения поиска

Индексирование


--------------------
 О(б)суждение моих действий - в соответствующей теме, пожалуйста. Или в РМ. И высшая инстанция - Администрация форума.

PM MAIL WWW ICQ Jabber   Вверх
Atum
Дата 27.3.2013, 08:36 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 265
Регистрация: 3.10.2008

Репутация: нет
Всего: нет



Цитата(Carlos0N @ 1.11.2012,  14:00)
Здравствуйте! Имеется словарь русских слов в нормальной форме с указанием части речи, к каждому слову прилагается его форма в различных падежах и его синонимы. Необходимо по слову с любой форме находить его нормальную форму и часть речи с синонимами.
Есть особенность в том, что словарь меняться после создания не будет и работать с ним будут только на чтение.
Поиск надо организовать как можно более быстрый.
Пока мне не понятно, надо ли использовать full text search, как лучше организовать базу и какие примочки использовать для ускорения поиска.
Буду крайне благодарен за любые советы.

Это не дело базы данных !

Для Ваших целей лучше всего использовать готовую технологию :

Смотрите в сторону Apache Solr  ( Lucene ) http://lucene.apache.org/solr/

если Ваш словарь представляет из себя библиотеку  в виде конечного автомата типа 
 библиотеки АОТ http://aot.ru/

Все что Вам нужно это :
1) настроить solr
2) написать свой фильтр для АОТ (вот пример http://solr.pl/en/2012/05/14/developing-yo...n-solr-filter/) 

тем самым поиск у вас будет в solr индексе, и вы разгрузите от него свою базу ненужными запросами.

PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PostgreSQL | Следующая тема »


 




[ Время генерации скрипта: 0.0609 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.