Модераторы: LSD
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> create stoplist... пробелы в стоп словах русского языка 
:(
    Опции темы
Anet
Дата 1.3.2006, 07:01 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 41
Регистрация: 8.1.2005
Где: Алтайский край

Репутация: нет
Всего: нет



Здравствуйте,

я занимаюсь соданием системы поиска по русскому тексту в oracle. в русском языке есть предлоги, стостоящие больше чем из 1 слова (в качестве, в знак, в обход, во имя, в глубь, и т.д. ). как показать ораклу, чтоб он воспринимал их как слово в стоп листе? т.е. сейчас он их не видит потому что есть пробелы и получается, что это не одно слово, а несколько.
заключаю их в "в знак" тоже не помогает...


PM MAIL ICQ   Вверх
LSD
Дата 1.3.2006, 11:42 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Leprechaun Software Developer
****


Профиль
Группа: Модератор
Сообщений: 15718
Регистрация: 24.3.2004
Где: Dublin

Репутация: 18
Всего: 538



Цитата(Anet @ 1.3.2006, 07:01 Найти цитируемый пост)
я занимаюсь соданием системы поиска по русскому тексту в oracle

А с помощью чего ты осуществляешь поиск?


--------------------
Disclaimer: this post contains explicit depictions of personal opinion. So, if it sounds sarcastic, don't take it seriously. If it sounds dangerous, do not try this at home or at all. And if it offends you, just don't read it.
PM MAIL WWW   Вверх
igon
Дата 4.3.2006, 00:09 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 327
Регистрация: 30.10.2004

Репутация: 7
Всего: 21



Речь, видимо, идет об Oracle Text.
Так как индексы текста строятся на основе отдельных слов (группы символов, окруженных пробелом), в них нет места двойным и более словам. По отдельности добавить в stoplist компоненты сложного предлога - тоже не выход: они могут иметь самостоятельное значение.
Вариант: во всех текстах в сложных предлогах заменить пробел на, скажем, $$$ (или ъъъ) и уже такие конструкции (в$$$качестве) добавить в stoplist.
Разумеется, перед показами оригинального текста нужно делать обратное преобразование.
ИМХО, конечно smile



--------------------
Хотите поговорить об этом?
PM   Вверх
Anet
Дата 23.3.2006, 06:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 41
Регистрация: 8.1.2005
Где: Алтайский край

Репутация: нет
Всего: нет



iqon, а это ведь вариант! тогда при вводе данных в строке поиска надо будет все пробелы заменять на определенный символ $$$ , например, чтоб найти стоп-комбинации...

PM MAIL ICQ   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Oracle"
Zloxa
LSD

Данный раздел предназначен для обсуждения проблем с Oracle Database, другие продукты Oracle здесь не обсуждаются. Просьба при создании темы, придерживаться следующих правил:

  • при создании темы давайте ей осмысленное название, описывающее суть проблемы
  • указывайте используемую версию базы, способ соединения и язык программирования
  • при ошибках обязательно приводите код ошибки и сообщение сервера
  • приводите код в котором возникла ошибка, по возможности дайте тестовый пример демонстрирующий ошибку
  • при вставке кода используйте соответсвующие теги: [code=sql] [/code] для подсветки SQL и PL/SQL кода, [code=java] [/code] - для Java, и т.д.

  • документация по Oracle: 9i, 10g, 11g
  • книги по Oracle можно поискать здесь
  • действия модераторов можно обсудить здесь

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Zloxa, LSD.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Oracle | Следующая тема »


 




[ Время генерации скрипта: 0.0858 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.