Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Проверка орфографии 
:(
    Опции темы
T0ohtik
Дата 8.7.2008, 09:08 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 9.2.2008

Репутация: нет
Всего: 1



Задумал написать не большую программу, которая будет проверять вводимое слово на  наличие только грамматических ошибок. Предполагается брать уже готовую базу слов, к примеру выдрать из firefox. Для начала интересует какой именно словарь использовать и откуда его скачатьsmile
PM MAIL   Вверх
dereyly
Дата 8.7.2008, 10:54 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 217
Регистрация: 16.6.2006

Репутация: 1
Всего: 4



предлагаю проверку так же взять из firefox
PM MAIL   Вверх
SoWa
Дата 9.7.2008, 05:29 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Харекришна
****


Профиль
Группа: Комодератор
Сообщений: 2422
Регистрация: 18.10.2004

Репутация: 6
Всего: 74



Ну, словарь это не алгоритм smile
Можно попробовать описать алгоритм разбора слова на составляющие(приставка, корень, суффикс, окончание), и вот уже по менее громоздким словарям этих самых частей судить об ошибках в слове smile И, думаю, такие алгоритмы уже есть, и велосипед изобретать не надо(хотя очень хочется).


--------------------
Всем добра smile
PM MAIL ICQ   Вверх
T0ohtik
Дата 9.7.2008, 10:17 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 9.2.2008

Репутация: нет
Всего: 1



Ну я не собираюсь изобретать велосипед, я спрашиваю, кто, где чего видел, включая алгоритмы.  

PM MAIL   Вверх
aleksh
Дата 9.7.2008, 11:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 609
Регистрация: 8.7.2008

Репутация: нет
Всего: 13



где-то читал что ms word проверяет орфографию посредством сравнения хеммингового расстояния (это теория кодирования), то бишь имеряется это расстояние для вводимого слова и сравнивается с расстояними слов из словаря, если оно достаточно/приемлемо мало -- предлагает как правильный вариант, если словарь большой то проверка будет на уровне
вопрос в другом: что делать с морфологией русского. тут лучше брать не словарь, а тезариус, но если тексты для ввода простые, то можно и без него
PM MAIL   Вверх
T0ohtik
Дата 9.7.2008, 14:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 9.2.2008

Репутация: нет
Всего: 1



Да у меня в принципе тексты и не большие и не сложные. Я хочу попробовать написать плагин к аське, для проверки орфографии. 
PM MAIL   Вверх
aleksh
Дата 9.7.2008, 15:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 609
Регистрация: 8.7.2008

Репутация: нет
Всего: 13



если попробовать, то тогда, пожалуй, можно обойтись словарем, просто игнорировать окончания слов (а то склонения всякие и пр.)
а рассматривался вариант использования word-а? точнее, загрузить и обращаться посредством ole? сам такого не делал, но по идее, это вполне возможно

Это сообщение отредактировал(а) aleksh - 9.7.2008, 15:53
PM MAIL   Вверх
T0ohtik
Дата 9.7.2008, 17:19 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 9.2.2008

Репутация: нет
Всего: 1



aleksh,  да это вполне возможно, но тогда в память будет загружаться ворд, прикольная перспектива, когда для проверки орфографии, еще надо будет за собой загружать целого монстраsmile))
PM MAIL   Вверх
aleksh
Дата 10.7.2008, 08:39 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 609
Регистрация: 8.7.2008

Репутация: нет
Всего: 13



согласен, с вордом это я перегнул, но если поискать, думаю можно будет найти способ обращатся только к проверке орфографии из ms office
но если задача просто вводимые слова минемально проверять на опечатки, то можно так: при наборе слова отдельным потоком пустить сверку со словарем (измерять хемминговое растояние полезно для составления списка вариантов исправления) и при появлении ошибки возможные варианты предлагать после нажатия пробела (и потери активности окна), прописать возможность добавления новых слов в словарь, игнорировать последние пару символов (зачем раздувать словарь вариациями склонения, иначе надо задуматься над структурой словаря)
алгоритм проверки того самого расстояния, так понимаю, расписывать не надо
PM MAIL   Вверх
DRUID3
Дата 10.7.2008, 11:58 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



А разве с словаре firefox лежат не все возможные написания слов и они не тупо перебираются на соответствие?

Цитата(aleksh @  9.7.2008,  10:18 Найти цитируемый пост)
где-то читал что ms word проверяет орфографию посредством сравнения хеммингового расстояния (это теория кодирования)

хм... может пунктуацию - т.к. там нельзя ожидать абсолютную четкость и предопределенность, а написание слов можно проверять простым перебором. У меня уже давно нет ничего майкрософтовского кроме "выньXP" дома для цацэк, но насколько я помню ворд, если там написать ласкательное производное от слова - он выдает ошибку, т.е. он тупо перебирает - а раз слова в словаре заведомо упорядоченные по алфавиту то затраты на перебор минимальные из возможных. Не вижу сложности... Думаю и Firefox(кстати, загляните в код!) и PSPad, и Linuxовые аськи делают это точно также - перебором...


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
T0ohtik
Дата 10.7.2008, 22:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 9.2.2008

Репутация: нет
Всего: 1



DRUID3, вот вот и я так думаю, по этому дело завязывается на базе слов, а не на алгоритме, т.к. алгоритмов множество!
PM MAIL   Вверх
polosatij
Дата 11.7.2008, 21:51 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



вопрос.. каким образом работает поиск в этом форуме? напишите слово "орфография", например..

Добавлено @ 21:52
Цитата(T0ohtik @  10.7.2008,  22:33 Найти цитируемый пост)
DRUID3, вот вот и я так думаю, по этому дело завязывается на базе слов, а не на алгоритме, т.к. алгоритмов множество! 


да? хм.. черкани парочку  smile допустим у нас есть 1.000.000 слов и 1 секунда на поиски  smile 

Это сообщение отредактировал(а) polosatij - 11.7.2008, 21:53


--------------------
PM   Вверх
dereyly
Дата 12.7.2008, 00:07 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 217
Регистрация: 16.6.2006

Репутация: 1
Всего: 4



У мну была идея как посторить такую систему... смысл заключается в построении некой хеш ф-ии которая дает близкие значения для слова и искаженного слова
Такою фигню наверное можно сделать с помощью LVQ загрузить словарь и выполнять в словаре перестановки и назначать искаженным словам тот же кластер

Попутно надо решить как кодировать буквы:
линейно  от 0 до 33
или, к примеру, а и о закодировать близкими значениями

Нужно ли использовать словосочетания...

Еще можно почитать, что умные люди поэтому поводу пишут... http://itman.narod.ru/

PS: тема мне интересна, так что если мне объяснить как вытащить из лисы слова, то я могу провести над ними дикие опыты и отписаться об этом на форуме... rtfm на конкретную страницу мурзилки тож сгодится


Это сообщение отредактировал(а) dereyly - 13.7.2008, 15:19
PM MAIL   Вверх
polosatij
  Дата 12.7.2008, 00:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



Цитата(dereyly @  12.7.2008,  00:07 Найти цитируемый пост)
тема мне интересна, так что если мне объяснить как вытащить из лисы слова, то я могу провести над ними дикие опыты


я думаю, это было бы многим интереснА  smile 



--------------------
PM   Вверх
DRUID3
  Дата 13.7.2008, 05:01 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



polosatij
Цитата(polosatij @  11.7.2008,  20:51 Найти цитируемый пост)
да? хм.. черкани парочку   допустим у нас есть 1.000.000 слов и 1 секунда на поиски   

??? а есть трудности ??? smile  во-первых словарь - заведомо упорядоченный список (по алфавиту) и слова в нем запросто могут лежать в виде деревьев - сложность обхода каждого конкретного случая будет равна количеству букв в слове, а не тупому перебору всего словаря. Собственно это стандартные условия и стандартное решение, даже не понимаю зачем я обьясняю? smile  Ну и во-вторых 1 000 000 слов не делают - возьмите любой разговорный словарь там из пару десятков тысяч - ну если там все падежи, или иные другие формы перебрать то 100 000 хватит с головой.


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
polosatij
Дата 13.7.2008, 13:18 (ссылка)    | (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



Цитата(DRUID3 @  13.7.2008,  05:01 Найти цитируемый пост)
??? а есть трудности ???


есть и ещё какие..




Цитата(DRUID3 @  13.7.2008,  05:01 Найти цитируемый пост)
во-первых словарь - заведомо упорядоченный список (по алфавиту) и слова в нем запросто могут лежать в виде деревьев - сложность обхода каждого конкретного случая будет равна количеству букв в слове, а не тупому перебору всего словаря.


а если нет словаря? скажем, это имена городов.. есть только имена городов, но речь тут идёт о "нечётком поиске"..



Цитата(DRUID3 @  13.7.2008,  05:01 Найти цитируемый пост)
возьмите любой разговорный словарь там из пару десятков тысяч - ну если там все падежи, или иные другие формы перебрать то 100 000 хватит с головой. 


и опять-таки словаря нет.. и падежей тоже считайте, что нет.. мне нужна такая штука на 15 языков.. это сколько надо информации перелопатить, пока напишешь правила, как вы говорите..  smile



--------------------
PM   Вверх
sergejzr
Дата 13.7.2008, 13:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Un salsero
Group Icon


Профиль
Группа: Админ
Сообщений: 13285
Регистрация: 10.2.2004
Где: Германия г .Ганновер

Репутация: 4
Всего: 360



Цитата(SoWa @  9.7.2008,  04:29 Найти цитируемый пост)
 И, думаю, такие алгоритмы уже есть, и велосипед изобретать не надо(хотя очень хочется). 

Велосипеды называются  aspell, ispell (последний более продвинутый) реализации есть на многих языках. Словари стандартные (вроде firefox тоже ими пользуется).


--------------------
PM WWW IM ICQ Skype GTalk Jabber AOL YIM MSN   Вверх
DRUID3
  Дата 13.7.2008, 21:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



polosatij Ваша критика несостоятельна, так как Вы сами придумываете трудности и сами же заходите в тупик их решения. Понабирайте слова в Firefox, openoffise, word и посмотрите сами

Цитата(polosatij @  13.7.2008,  12:18 Найти цитируемый пост)
а если нет словаря? скажем, это имена городов.. есть только имена городов, но речь тут идёт о "нечётком поиске"..
+
бред, бредом погоняет - еще раз повторюсь если слова нет в словаре оно будет ошибочным(красненьким подчеркнется). Вы вообще в дружбе с действительностью? smile  Имена городов в словарях перечисляют - если город малоизвестный то "любой ворд" выдает ошибку. Не верите проверьте сами. Даже человек не всегда по написанию слова понимает город это ли (а вдруг фамилия) !!!!!!!!!! - зачем сюда приплетать нечеткий поиск???

Цитата(polosatij @  13.7.2008,  12:18 Найти цитируемый пост)
и опять-таки словаря нет.. и падежей тоже считайте, что нет.. мне нужна такая штука на 15 языков.. это сколько надо информации перелопатить, пока напишешь правила, как вы говорите.. 

а Вы с производителями телевизоров часто спорите об истинном, на Ваш взгляд, их устройстве??? кажется не редко  smile 


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
T0ohtik
Дата 13.7.2008, 21:54 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 9.2.2008

Репутация: нет
Всего: 1



Цитата(polosatij @  11.7.2008,  21:51 Найти цитируемый пост)
да? хм.. черкани парочку  smile допустим у нас есть 1.000.000 слов и 1 секунда на поиски  smile 

База слов к словарю MySpell. В базе примерно 150000 слов + окончания, в конечном итоге 1,2 млн словоформ. Точного времени поиска слова, к сожалению, пока не замерил, но старт программы, считывание 150000 слов из файла, поиск захардкоженого слова и отображения на экран, занимает около 3 сек. Так что ничего сложного не вижу....

Добавлено через 7 минут и 8 секунд
Цитата(sergejzr @  13.7.2008,  13:41 Найти цитируемый пост)
Велосипеды называются  aspell, ispell (последний более продвинутый) реализации есть на многих языках. Словари стандартные (вроде firefox тоже ими пользуется). 

До aspell и ispell пока не добрался, но MySpell  что то мне не сильно понравилсяsmile Особенно этой строкой bool nosplitsugs= (0==1)? хотя можеть есть какой тайный смысл?  
PM MAIL   Вверх
sergejzr
Дата 13.7.2008, 22:35 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Un salsero
Group Icon


Профиль
Группа: Админ
Сообщений: 13285
Регистрация: 10.2.2004
Где: Германия г .Ганновер

Репутация: 4
Всего: 360





--------------------
PM WWW IM ICQ Skype GTalk Jabber AOL YIM MSN   Вверх
polosatij
Дата 14.7.2008, 02:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8







Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
Понабирайте слова в Firefox, openoffise, word и посмотрите сами


интересно, зачем они мне вообще нужны.. речь идёт об опечатках..



Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
бред, бредом погоняет - еще раз повторюсь если слова нет в словаре оно будет ошибочным(красненьким подчеркнется). Вы вообще в дружбе с действительностью?


найти, нет ли слова в словаре - как два пальза об асфальт и подчеркнуть красненьким.. а вот найти правильное слово, про это вы что-то забыли..

 
Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
Даже человек не всегда по написанию слова понимает город это ли (а вдруг фамилия) !!!!!!!!!! - зачем сюда приплетать нечеткий поиск???


у меня речь идёт о поиске городов.. человек может туда хоть "луну" написать.. речь идёт об опечатках в городах..



Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
polosatij Ваша критика несостоятельна, так как Вы сами придумываете трудности и сами же заходите в тупик их решения. Понабирайте слова в Firefox, openoffise, word и посмотрите сами


у меня к тебе один вопрос.. вот, ты такой крутой и не видишь юричины беспокоиться.. тогда напиши мне логику решения следующего:

юзер написал: Xberlin, berlXin тебе в базе данных нужно найти слово Berlin.. раскажи мне пожалуйста, как именно ты собираешься БЫСТРО найти слово Berlin, мне просто интересно..
нет.. действительно интересно.. может это я просто тут один такой  smile 



Цитата(T0ohtik @  13.7.2008,  21:54 Найти цитируемый пост)
База слов к словарю MySpell. В базе примерно 150000 слов + окончания, в конечном итоге 1,2 млн словоформ.


а синонимы там есть или слова близкие по значению? например, я набираю: "дом", а он мне выдаёт "вилла"? smile



Цитата(sergejzr @  13.7.2008,  13:41 Найти цитируемый пост)
aspell, ispell (последний более продвинутый) 


надо будет посмотреть smile

нада MySpell тоже посмотреть будет smile



--------------------
PM   Вверх
DRUID3
Дата 14.7.2008, 04:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
интересно, зачем они мне вообще нужны.. речь идёт об опечатках..

Та Вы што... smile 
Цитата(T0ohtik @  8.7.2008,  08:08 Найти цитируемый пост)
Задумал написать не большую программу, которая будет проверять вводимое слово на  наличие только грамматических ошибок. Предполагается брать уже готовую базу слов, к примеру выдрать из firefox.

Цитата(dereyly @  8.7.2008,  09:54 Найти цитируемый пост)
предлагаю проверку так же взять из firefox 

Цитата(DRUID3 @  13.7.2008,  20:26 Найти цитируемый пост)
2 polosatij Ваша критика несостоятельна, так как Вы сами придумываете трудности и сами же заходите в тупик их решения. Понабирайте слова в Firefox, openoffise, word и посмотрите сами


Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
у меня речь идёт о поиске городов.. человек может туда хоть "луну" написать.. речь идёт об опечатках в городах..


Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
найти, нет ли слова в словаре - как два пальза об асфальт и подчеркнуть красненьким.. а вот найти правильное слово, про это вы что-то забыли..

??? да, а должен был помнить? Покажите где ранее шла об этом речь??? 

Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
у меня к тебе один вопрос.. вот, ты такой крутой и не видишь юричины беспокоиться.. тогда напиши мне логику решения следующего:

юзер написал: Xberlin, berlXin тебе в базе данных нужно найти слово Berlin.. раскажи мне пожалуйста, как именно ты собираешься БЫСТРО найти слово Berlin, мне просто интересно..


2polosatij
Вы тупо уперлись рогами и не хотите сознавать, что не правы. smile  Опять "25" - да зачем мне искать слово Берлин по X-Берлин? Как можно вообще определить, что это ошибка? А может это фамилия??? Или название забегаловки? Вот потому-то можно только красненьким подчеркнуть! Мало того, если на то пошло, то и небыстро слово то не найти, хоть весь список переберай.  И каким боком Вы сюда приторочите нечеткий поиск и нечеткую логику??? 
Если же Вы имели ввиду вывод списка слов близких по написанию или исправление одиночной ошибки(две оибки в слове и ворд бессилен, помните?), то это сделать можно уймой простых и быстрых способов - если слово не обнаружено в словаре, то добавляем его в словарь (который хранится в виде дерева и такое добавление тоже не занимает особо времени) соответсвенно любое слово в дереве отличное на одну букву будет выводиться в списке близких в написании слов. В таком алгоритме опять же не нужно перебирать весь словарь. И т.д. и т.п. напридумывать их можно пучок, да и из продуктов open source их можно навытягивать готовых...

Модератор:  немного подправил, просьба быть немного посдержаннее

Это сообщение отредактировал(а) maxim1000 - 14.7.2008, 10:43


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
maxim1000
Дата 14.7.2008, 10:36 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник
Сообщений: 3334
Регистрация: 11.1.2003
Где: Киев

Репутация: 33
Всего: 110



Модератор: 
давайте, немного потише smile
эмоции, тем более подобные, редко помогают решить задачу

если в условии что-то непонятно, или создалось впечатление, что оно неправильно сформулировано, можно просто попросить уточнить условие


--------------------
qqq
PM WWW   Вверх
polosatij
  Дата 14.7.2008, 14:50 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
??? да, а должен был помнить? Покажите где ранее шла об этом речь??? 


уж извините, чот зашёл дальше, чем ваше представление  smile  посмотрите проверку, например в гоогле майл, там, предлогаются варианты, а не тупое подчёркивание  smile 

Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
Как можно вообще определить, что это ошибка? 


очень просто  smile такого слова, нет в базе данных  smile 

Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
Вот потому-то можно только красненьким подчеркнуть!


если ты наберёшь в гоогле какое-нибудь этакое слово и опечатаешься, он предложит тебе варианты  smile  именно об этом я и говорю  smile а ты предлогаешь красненьким подчеркнуть, хех..  smile 

Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
В таком алгоритме опять же не нужно перебирать весь словарь.


Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
соответсвенно любое слово в дереве отличное на одну букву будет выводиться в списке близких в написании слов.


Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
И т.д. и т.п. напридумывать их можно пучок, да и из продуктов open source их можно навытягивать готовых...


ты забыл описать алгоритм нахождения слова Berlin  smile

Добавлено через 2 минуты и 22 секунды
Цитата(maxim1000 @  14.7.2008,  10:36 Найти цитируемый пост)
эмоции, тем более подобные, редко помогают решить задачу


это точно.. мы собираемся здесь, чтоб найти решение задачи, а стресса и на работе хватает smile  smile 


--------------------
PM   Вверх
DRUID3
  Дата 14.7.2008, 20:03 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



2maxim1000 smile я прямо в растерянности, кажется я же не матерился!? А то товарищ polosatij обо мне вообще очень плохо подумает...

polosatij
Я не даром привел цитаты "зачинщика" этой темы и вариантов предложенных ему кои он не отвергал - значит изначально речь шла о подчеркивании(выделении) неправильно написанных слов на что я и ориентировался...

Причем Вы, товарищ polosatij, были страшно возмущены поиском слова в большом словаре. На что я имел неосторожность возразить, мол ключевое слово словарь а значит заведомо отсортированный(упорядоченный), и следовательно храня его определенным образом (древовидная структура) мы избежим пересмотра всего списка при поиске определенного слова. Подход сей широко известен и универсален!!! Находит применение в ЦОС, криптографии, экспертных системах и т.д. И, собственно, указанная Вами трудность - не есть трудность на самом деле...
 Вы же в ответ задание усложнили. Ну хорошо, даже если и так и требуется выводить слова-ассоциации то все-равно нет необходимости в переборе всего списка даже однократно. И все потому же - т.к. проход дерева по одной ветви в глубь пусть(ну пусть даже несколько таких проходов для отображения всех слов ассоциаций) не сравнимо менее ресутрсоемкая задача чем перебор всех слов в словаре. Для точности надо заметить, что это справедливо для языковых словарей, но математически можно выдумать такие словари где это будет не так ...

Цитата(polosatij @  14.7.2008,  13:50 Найти цитируемый пост)
ты забыл описать алгоритм нахождения слова Berlin 

Вы что, хотите чтобы я Вам написал исходик??? Ведь идею я, кажеться, вполне ясно изложил...


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
polosatij
  Дата 14.7.2008, 20:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
А то товарищ polosatij обо мне вообще очень плохо подумает...


smile  smile 



Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
Ну хорошо, даже если и так и требуется выводить слова-ассоциации то все-равно нет необходимости в переборе всего списка даже однократно. И все потому же - т.к. проход дерева по одной ветви в глубь пусть



мне кажется такой способ неприемлимым.. объясняю почему, если юзер набирает Xberlin, то ты автоматически находишься уже не в той ветви, т.к. первая буква уже не та.. 

Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
Вы что, хотите чтобы я Вам написал исходик???


нет, мне достаточно "простого" алгоритма  smile

Добавлено через 8 минут и 13 секунд



DRUID3, лана.. мы просто не поняли друг-друга.. живи  smile 

шутю  smile 


--------------------
PM   Вверх
maxim1000
Дата 15.7.2008, 11:44 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник
Сообщений: 3334
Регистрация: 11.1.2003
Где: Киев

Репутация: 33
Всего: 110



Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
2maxim1000 smile я прямо в растерянности, кажется я же не матерился!? А то товарищ polosatij обо мне вообще очень плохо подумает...

нет, конечно же, никаких матов не было, но уж слишком близко к переходу на личности
просто, когда дискуссия горячая лучше гасить даже маленькие искорки smile


--------------------
qqq
PM WWW   Вверх
Rusdenis
Дата 5.11.2008, 14:24 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 1
Регистрация: 30.5.2008

Репутация: нет
Всего: нет



Парни, не парьтесь! smile
Уже есть множество платных и бесплатных реализаций так называемых Spell Checker`ов.
Среди бесплатных фигурируют aspell, ispell, myspell, hunspell. Последний является потомком проектов ispell и myspell, использует соответсвенно их же словари, которые можно взять с офф-сайта OpenOffice.org. 
hunspell, кстати, сейчас и используется в самом OpenOffice.org, как более продвинутая реализация.
PM MAIL   Вверх
Страницы: (2) [Все] 1 2 
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.1337 ]   [ Использовано запросов: 20 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.