Модераторы: korob2001, ginnie
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Поиск в базе с учетом русской морфологии 
:(
    Опции темы
Logo
Дата 4.5.2010, 23:01 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 694
Регистрация: 22.7.2008

Репутация: 3
Всего: 10



Что нужно для организации поиска по базе с учетом морфологии на perl? Есть ли готовые модули на эту тему?
PM MAIL   Вверх
DurRandir
Дата 4.5.2010, 23:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 335
Регистрация: 27.9.2009

Репутация: 14
Всего: 17



Движок поиска именно на перле? Вряд ли. Лучше взять готовую библиотку+биндинги. Отдельные продукты со своими движками - Lucene/Sphinx, или postgres начиная с версии 8.3
PM   Вверх
Logo
Дата 4.5.2010, 23:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 694
Регистрация: 22.7.2008

Репутация: 3
Всего: 10



Да, и на MySQL. Хотя бы для работы с только морфологией, вроде phpMorphy, есть что-то? Тогда можно было бы создавать дубль текста с приведенными в нормальную форму словами, и использовать встроенный в MySQL полнотекстовой поиск.
PM MAIL   Вверх
gcc
Дата 6.5.2010, 03:59 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Агент алкомафии
****


Профиль
Группа: Участник
Сообщений: 2691
Регистрация: 25.4.2008
Где: %&й

Репутация: 1
Всего: 17



существуют базы со словами словоформами... (или какок они там?)
т.е группа слов, которые означают что-то одно, синонимы, или слова подобные, с одним корнем, но с разными окончаниями...
но, например, в яндекс-поиск есть более разных приколов для лучшего поиска, трансилит т .д.
PM WWW ICQ Skype GTalk Jabber   Вверх
KSURi
Дата 6.5.2010, 13:14 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 887
Регистрация: 8.6.2006
Где: Russia

Репутация: 20
Всего: 27



Есть модуль KinoSearch - практически готовый поисковый движок. Эффективность его не проверял, и не помню, есть ли там поддержка морфологии. Может пригодится для разбора, если решите свое писать. Также есть биндинги к большим движкам - Lucene, Sphinx, etc.
В принципе написать свой простенький движок, заточенный под конкретный сайт/базу, не сложно.

Вот с морфологией на перле уже сложнее. Для русского языка ничего бесплатного, внятного и готового к употреблению я не видел. Только какие-то "запчасти", которые сами по себе ничем не помогут. Приходится все самому писать и собирать из разных запчастей)

Это сообщение отредактировал(а) KSURi - 6.5.2010, 13:42


--------------------
Died at Life.pl line 21
PM Jabber   Вверх
gcc
Дата 6.5.2010, 13:48 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Агент алкомафии
****


Профиль
Группа: Участник
Сообщений: 2691
Регистрация: 25.4.2008
Где: %&й

Репутация: 1
Всего: 17



если поискать в гугле, то можно найти несколько таких баз с морфологией, где кто-то закачал такую базу...
у меня была такая база, могу поискать...

я пользуюсь на одном сайте поиском где можно поставить в символ *
(для корня помогает)

т.е. будет означать:

привет*
приветы
приветствия
ит.д.

Это сообщение отредактировал(а) gcc - 6.5.2010, 13:49
PM WWW ICQ Skype GTalk Jabber   Вверх
Logo
Дата 6.5.2010, 19:48 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 694
Регистрация: 22.7.2008

Репутация: 3
Всего: 10



Цитата

я пользуюсь на одном сайте поиском где можно поставить в символ *
(для корня помогает)

т.е. будет означать:

привет*
приветы
приветствия
ит.д.



Нужна именно морфология. 

А звездочка реализуется стандартными средствами MySQL.
PM MAIL   Вверх
Nab
Дата 11.5.2010, 08:58 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 582
Регистрация: 25.3.2006
Где: Kiev

Репутация: 26
Всего: 37



Смотрел в Википедии о Lucene, и наткнулся на вот что
http://search.cpan.org/dist/Plucene/


--------------------
 Чтобы правильно задать вопрос нужно знать больше половины ответа...
Perl Community 
FREESCO in Ukraine 
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Perl"
korob2001
sharq
  • В этом разделе обсуждаются общие вопросы по языку Perl
  • Если ваш вопрос относится к системному программированию, задавайте его здесь
  • Если ваш вопрос относится к CGI программированию, задавайте его здесь
  • Интерпретатор Perl можно скачать здесь ActiveState, O'REILLY, The source for Perl
  • Справочное руководство "Установка perl-модулей", можно скачать здесь


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Perl: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.1181 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.