Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Алгоритм поиска опечаток 
:(
    Опции темы
TIT
  Дата 27.9.2010, 16:01 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 49
Регистрация: 4.4.2010

Репутация: нет
Всего: 3



По какому алгоритму работает поиск опечаток при проверке орфографии?
Например, пользователь написал "перзидент", а система ему подсказывает, что он, возможно, имел в виду "президент".
Список правильных значений у меня не большой (порядка 20 слов). А вот опечаток может быть много.
Пока вижу только один вариант, это загнать все возможные варианты опечаток в словарь, но может быть есть вариант проще?
PM MAIL WWW ICQ Skype GTalk Jabber MSN   Вверх
azesmcar
Дата 27.9.2010, 16:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


uploading...
****


Профиль
Группа: Участник Клуба
Сообщений: 6291
Регистрация: 12.11.2004
Где: Армения

Репутация: 1
Всего: 211



Ищет в словаре те слова, для которых Расстояние Левенштейна между введенным словом < (меньше) некого числа X.

Добавлено через 31 секунду
Цитата(TIT @  27.9.2010,  16:01 Найти цитируемый пост)
Пока вижу только один вариант, это загнать все возможные варианты опечаток в словарь, но может быть есть вариант проще? 

не слабо так smile 
PM   Вверх
Akina
Дата 27.9.2010, 16:13 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Советчик
****


Профиль
Группа: Модератор
Сообщений: 20581
Регистрация: 8.4.2004
Где: Зеленоград

Репутация: 20
Всего: 454





--------------------
 О(б)суждение моих действий - в соответствующей теме, пожалуйста. Или в РМ. И высшая инстанция - Администрация форума.

PM MAIL WWW ICQ Jabber   Вверх
Pavia
Дата 27.9.2010, 19:34 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 418
Регистрация: 6.12.2008

Репутация: 11
Всего: 12



azesmcar, Загонял! Жрет много памяти и получилось медленно.
Проще проверять по  расстоянию Левенштейна  с некоторыми отсечениями. 
А еще лучше именно лингвистические алгоритмы - т.е алгоритмы учитывающие специфику языка и написания, произнесения слов, вероятности ошибок.
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.0993 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.