Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Проверка орфографии 
:(
    Опции темы
polosatij
Дата 13.7.2008, 13:18 (ссылка)    | (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



Цитата(DRUID3 @  13.7.2008,  05:01 Найти цитируемый пост)
??? а есть трудности ???


есть и ещё какие..




Цитата(DRUID3 @  13.7.2008,  05:01 Найти цитируемый пост)
во-первых словарь - заведомо упорядоченный список (по алфавиту) и слова в нем запросто могут лежать в виде деревьев - сложность обхода каждого конкретного случая будет равна количеству букв в слове, а не тупому перебору всего словаря.


а если нет словаря? скажем, это имена городов.. есть только имена городов, но речь тут идёт о "нечётком поиске"..



Цитата(DRUID3 @  13.7.2008,  05:01 Найти цитируемый пост)
возьмите любой разговорный словарь там из пару десятков тысяч - ну если там все падежи, или иные другие формы перебрать то 100 000 хватит с головой. 


и опять-таки словаря нет.. и падежей тоже считайте, что нет.. мне нужна такая штука на 15 языков.. это сколько надо информации перелопатить, пока напишешь правила, как вы говорите..  smile



--------------------
PM   Вверх
sergejzr
Дата 13.7.2008, 13:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Un salsero
Group Icon


Профиль
Группа: Админ
Сообщений: 13285
Регистрация: 10.2.2004
Где: Германия г .Ганновер

Репутация: 4
Всего: 360



Цитата(SoWa @  9.7.2008,  04:29 Найти цитируемый пост)
 И, думаю, такие алгоритмы уже есть, и велосипед изобретать не надо(хотя очень хочется). 

Велосипеды называются  aspell, ispell (последний более продвинутый) реализации есть на многих языках. Словари стандартные (вроде firefox тоже ими пользуется).


--------------------
PM WWW IM ICQ Skype GTalk Jabber AOL YIM MSN   Вверх
DRUID3
  Дата 13.7.2008, 21:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



polosatij Ваша критика несостоятельна, так как Вы сами придумываете трудности и сами же заходите в тупик их решения. Понабирайте слова в Firefox, openoffise, word и посмотрите сами

Цитата(polosatij @  13.7.2008,  12:18 Найти цитируемый пост)
а если нет словаря? скажем, это имена городов.. есть только имена городов, но речь тут идёт о "нечётком поиске"..
+
бред, бредом погоняет - еще раз повторюсь если слова нет в словаре оно будет ошибочным(красненьким подчеркнется). Вы вообще в дружбе с действительностью? smile  Имена городов в словарях перечисляют - если город малоизвестный то "любой ворд" выдает ошибку. Не верите проверьте сами. Даже человек не всегда по написанию слова понимает город это ли (а вдруг фамилия) !!!!!!!!!! - зачем сюда приплетать нечеткий поиск???

Цитата(polosatij @  13.7.2008,  12:18 Найти цитируемый пост)
и опять-таки словаря нет.. и падежей тоже считайте, что нет.. мне нужна такая штука на 15 языков.. это сколько надо информации перелопатить, пока напишешь правила, как вы говорите.. 

а Вы с производителями телевизоров часто спорите об истинном, на Ваш взгляд, их устройстве??? кажется не редко  smile 


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
T0ohtik
Дата 13.7.2008, 21:54 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 115
Регистрация: 9.2.2008

Репутация: нет
Всего: 1



Цитата(polosatij @  11.7.2008,  21:51 Найти цитируемый пост)
да? хм.. черкани парочку  smile допустим у нас есть 1.000.000 слов и 1 секунда на поиски  smile 

База слов к словарю MySpell. В базе примерно 150000 слов + окончания, в конечном итоге 1,2 млн словоформ. Точного времени поиска слова, к сожалению, пока не замерил, но старт программы, считывание 150000 слов из файла, поиск захардкоженого слова и отображения на экран, занимает около 3 сек. Так что ничего сложного не вижу....

Добавлено через 7 минут и 8 секунд
Цитата(sergejzr @  13.7.2008,  13:41 Найти цитируемый пост)
Велосипеды называются  aspell, ispell (последний более продвинутый) реализации есть на многих языках. Словари стандартные (вроде firefox тоже ими пользуется). 

До aspell и ispell пока не добрался, но MySpell  что то мне не сильно понравилсяsmile Особенно этой строкой bool nosplitsugs= (0==1)? хотя можеть есть какой тайный смысл?  
PM MAIL   Вверх
sergejzr
Дата 13.7.2008, 22:35 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Un salsero
Group Icon


Профиль
Группа: Админ
Сообщений: 13285
Регистрация: 10.2.2004
Где: Германия г .Ганновер

Репутация: 4
Всего: 360





--------------------
PM WWW IM ICQ Skype GTalk Jabber AOL YIM MSN   Вверх
polosatij
Дата 14.7.2008, 02:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8







Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
Понабирайте слова в Firefox, openoffise, word и посмотрите сами


интересно, зачем они мне вообще нужны.. речь идёт об опечатках..



Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
бред, бредом погоняет - еще раз повторюсь если слова нет в словаре оно будет ошибочным(красненьким подчеркнется). Вы вообще в дружбе с действительностью?


найти, нет ли слова в словаре - как два пальза об асфальт и подчеркнуть красненьким.. а вот найти правильное слово, про это вы что-то забыли..

 
Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
Даже человек не всегда по написанию слова понимает город это ли (а вдруг фамилия) !!!!!!!!!! - зачем сюда приплетать нечеткий поиск???


у меня речь идёт о поиске городов.. человек может туда хоть "луну" написать.. речь идёт об опечатках в городах..



Цитата(DRUID3 @  13.7.2008,  21:26 Найти цитируемый пост)
polosatij Ваша критика несостоятельна, так как Вы сами придумываете трудности и сами же заходите в тупик их решения. Понабирайте слова в Firefox, openoffise, word и посмотрите сами


у меня к тебе один вопрос.. вот, ты такой крутой и не видишь юричины беспокоиться.. тогда напиши мне логику решения следующего:

юзер написал: Xberlin, berlXin тебе в базе данных нужно найти слово Berlin.. раскажи мне пожалуйста, как именно ты собираешься БЫСТРО найти слово Berlin, мне просто интересно..
нет.. действительно интересно.. может это я просто тут один такой  smile 



Цитата(T0ohtik @  13.7.2008,  21:54 Найти цитируемый пост)
База слов к словарю MySpell. В базе примерно 150000 слов + окончания, в конечном итоге 1,2 млн словоформ.


а синонимы там есть или слова близкие по значению? например, я набираю: "дом", а он мне выдаёт "вилла"? smile



Цитата(sergejzr @  13.7.2008,  13:41 Найти цитируемый пост)
aspell, ispell (последний более продвинутый) 


надо будет посмотреть smile

нада MySpell тоже посмотреть будет smile



--------------------
PM   Вверх
DRUID3
Дата 14.7.2008, 04:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
интересно, зачем они мне вообще нужны.. речь идёт об опечатках..

Та Вы што... smile 
Цитата(T0ohtik @  8.7.2008,  08:08 Найти цитируемый пост)
Задумал написать не большую программу, которая будет проверять вводимое слово на  наличие только грамматических ошибок. Предполагается брать уже готовую базу слов, к примеру выдрать из firefox.

Цитата(dereyly @  8.7.2008,  09:54 Найти цитируемый пост)
предлагаю проверку так же взять из firefox 

Цитата(DRUID3 @  13.7.2008,  20:26 Найти цитируемый пост)
2 polosatij Ваша критика несостоятельна, так как Вы сами придумываете трудности и сами же заходите в тупик их решения. Понабирайте слова в Firefox, openoffise, word и посмотрите сами


Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
у меня речь идёт о поиске городов.. человек может туда хоть "луну" написать.. речь идёт об опечатках в городах..


Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
найти, нет ли слова в словаре - как два пальза об асфальт и подчеркнуть красненьким.. а вот найти правильное слово, про это вы что-то забыли..

??? да, а должен был помнить? Покажите где ранее шла об этом речь??? 

Цитата(polosatij @  14.7.2008,  01:26 Найти цитируемый пост)
у меня к тебе один вопрос.. вот, ты такой крутой и не видишь юричины беспокоиться.. тогда напиши мне логику решения следующего:

юзер написал: Xberlin, berlXin тебе в базе данных нужно найти слово Berlin.. раскажи мне пожалуйста, как именно ты собираешься БЫСТРО найти слово Berlin, мне просто интересно..


2polosatij
Вы тупо уперлись рогами и не хотите сознавать, что не правы. smile  Опять "25" - да зачем мне искать слово Берлин по X-Берлин? Как можно вообще определить, что это ошибка? А может это фамилия??? Или название забегаловки? Вот потому-то можно только красненьким подчеркнуть! Мало того, если на то пошло, то и небыстро слово то не найти, хоть весь список переберай.  И каким боком Вы сюда приторочите нечеткий поиск и нечеткую логику??? 
Если же Вы имели ввиду вывод списка слов близких по написанию или исправление одиночной ошибки(две оибки в слове и ворд бессилен, помните?), то это сделать можно уймой простых и быстрых способов - если слово не обнаружено в словаре, то добавляем его в словарь (который хранится в виде дерева и такое добавление тоже не занимает особо времени) соответсвенно любое слово в дереве отличное на одну букву будет выводиться в списке близких в написании слов. В таком алгоритме опять же не нужно перебирать весь словарь. И т.д. и т.п. напридумывать их можно пучок, да и из продуктов open source их можно навытягивать готовых...

Модератор:  немного подправил, просьба быть немного посдержаннее

Это сообщение отредактировал(а) maxim1000 - 14.7.2008, 10:43


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
maxim1000
Дата 14.7.2008, 10:36 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник
Сообщений: 3334
Регистрация: 11.1.2003
Где: Киев

Репутация: 33
Всего: 110



Модератор: 
давайте, немного потише smile
эмоции, тем более подобные, редко помогают решить задачу

если в условии что-то непонятно, или создалось впечатление, что оно неправильно сформулировано, можно просто попросить уточнить условие


--------------------
qqq
PM WWW   Вверх
polosatij
  Дата 14.7.2008, 14:50 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
??? да, а должен был помнить? Покажите где ранее шла об этом речь??? 


уж извините, чот зашёл дальше, чем ваше представление  smile  посмотрите проверку, например в гоогле майл, там, предлогаются варианты, а не тупое подчёркивание  smile 

Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
Как можно вообще определить, что это ошибка? 


очень просто  smile такого слова, нет в базе данных  smile 

Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
Вот потому-то можно только красненьким подчеркнуть!


если ты наберёшь в гоогле какое-нибудь этакое слово и опечатаешься, он предложит тебе варианты  smile  именно об этом я и говорю  smile а ты предлогаешь красненьким подчеркнуть, хех..  smile 

Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
В таком алгоритме опять же не нужно перебирать весь словарь.


Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
соответсвенно любое слово в дереве отличное на одну букву будет выводиться в списке близких в написании слов.


Цитата(DRUID3 @  14.7.2008,  04:30 Найти цитируемый пост)
И т.д. и т.п. напридумывать их можно пучок, да и из продуктов open source их можно навытягивать готовых...


ты забыл описать алгоритм нахождения слова Berlin  smile

Добавлено через 2 минуты и 22 секунды
Цитата(maxim1000 @  14.7.2008,  10:36 Найти цитируемый пост)
эмоции, тем более подобные, редко помогают решить задачу


это точно.. мы собираемся здесь, чтоб найти решение задачи, а стресса и на работе хватает smile  smile 


--------------------
PM   Вверх
DRUID3
  Дата 14.7.2008, 20:03 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



2maxim1000 smile я прямо в растерянности, кажется я же не матерился!? А то товарищ polosatij обо мне вообще очень плохо подумает...

polosatij
Я не даром привел цитаты "зачинщика" этой темы и вариантов предложенных ему кои он не отвергал - значит изначально речь шла о подчеркивании(выделении) неправильно написанных слов на что я и ориентировался...

Причем Вы, товарищ polosatij, были страшно возмущены поиском слова в большом словаре. На что я имел неосторожность возразить, мол ключевое слово словарь а значит заведомо отсортированный(упорядоченный), и следовательно храня его определенным образом (древовидная структура) мы избежим пересмотра всего списка при поиске определенного слова. Подход сей широко известен и универсален!!! Находит применение в ЦОС, криптографии, экспертных системах и т.д. И, собственно, указанная Вами трудность - не есть трудность на самом деле...
 Вы же в ответ задание усложнили. Ну хорошо, даже если и так и требуется выводить слова-ассоциации то все-равно нет необходимости в переборе всего списка даже однократно. И все потому же - т.к. проход дерева по одной ветви в глубь пусть(ну пусть даже несколько таких проходов для отображения всех слов ассоциаций) не сравнимо менее ресутрсоемкая задача чем перебор всех слов в словаре. Для точности надо заметить, что это справедливо для языковых словарей, но математически можно выдумать такие словари где это будет не так ...

Цитата(polosatij @  14.7.2008,  13:50 Найти цитируемый пост)
ты забыл описать алгоритм нахождения слова Berlin 

Вы что, хотите чтобы я Вам написал исходик??? Ведь идею я, кажеться, вполне ясно изложил...


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
polosatij
  Дата 14.7.2008, 20:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1143
Регистрация: 22.2.2004
Где: Stuttgart<-> ;Karlsruhe, Germany

Репутация: нет
Всего: 8



Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
А то товарищ polosatij обо мне вообще очень плохо подумает...


smile  smile 



Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
Ну хорошо, даже если и так и требуется выводить слова-ассоциации то все-равно нет необходимости в переборе всего списка даже однократно. И все потому же - т.к. проход дерева по одной ветви в глубь пусть



мне кажется такой способ неприемлимым.. объясняю почему, если юзер набирает Xberlin, то ты автоматически находишься уже не в той ветви, т.к. первая буква уже не та.. 

Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
Вы что, хотите чтобы я Вам написал исходик???


нет, мне достаточно "простого" алгоритма  smile

Добавлено через 8 минут и 13 секунд



DRUID3, лана.. мы просто не поняли друг-друга.. живи  smile 

шутю  smile 


--------------------
PM   Вверх
maxim1000
Дата 15.7.2008, 11:44 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник
Сообщений: 3334
Регистрация: 11.1.2003
Где: Киев

Репутация: 33
Всего: 110



Цитата(DRUID3 @  14.7.2008,  20:03 Найти цитируемый пост)
2maxim1000 smile я прямо в растерянности, кажется я же не матерился!? А то товарищ polosatij обо мне вообще очень плохо подумает...

нет, конечно же, никаких матов не было, но уж слишком близко к переходу на личности
просто, когда дискуссия горячая лучше гасить даже маленькие искорки smile


--------------------
qqq
PM WWW   Вверх
Rusdenis
Дата 5.11.2008, 14:24 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 1
Регистрация: 30.5.2008

Репутация: нет
Всего: нет



Парни, не парьтесь! smile
Уже есть множество платных и бесплатных реализаций так называемых Spell Checker`ов.
Среди бесплатных фигурируют aspell, ispell, myspell, hunspell. Последний является потомком проектов ispell и myspell, использует соответсвенно их же словари, которые можно взять с офф-сайта OpenOffice.org. 
hunspell, кстати, сейчас и используется в самом OpenOffice.org, как более продвинутая реализация.
PM MAIL   Вверх
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.1085 ]   [ Использовано запросов: 20 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.