Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Распознавание рукописного текста 
:(
    Опции темы
PavelK
Дата 26.10.2005, 20:55 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 14
Регистрация: 11.9.2005

Репутация: нет
Всего: нет



Да в общем то сама идея простая, вот только писанины многовато.

Можно рассмотреть пример. Пуст есть векторный шаблон буквы "И". Он будет представлять собой 3 вектора (первый направлен вниз, второй - вверх под углом 45 градусов, третий - тоже вниз). Берем входной текст. Преобразовываем его в векторный вид. Идем по тексту и ищем направленный в низ вектор. Если сразу за ним идет вектор направленный вверх под углом близким к углу в 45 градусов, а следующий за ними вектор направлен вниз, то мы нашли искомую букву.

Теперь вариант когда у нас есть целый алфавит шаблонов.
Берем первые вектор из текста и проверяем каким буквам он может соответствовать. Получаем некоторое кол-во вариантов. Берем следующий в тексте вектор и пытаемся сопоставить с имеющимися вариантами. И так пока не получим 100% совпадение с каким-нибудь образцом. Если совпадений нет, то пропускаем первый вектор, берем второй и повторяем выше описанное.
В итоге получаем распознанный набор букв, не обращая внимания на их размер и связки между буквами в словах.

PM   Вверх
PavelK
Дата 26.10.2005, 21:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 14
Регистрация: 11.9.2005

Репутация: нет
Всего: нет



Самая большая проблема в этом алгоритме - это правильно выполнить преобразование текста в вектора. И в этой области есть где развернутся, хотя в распознавании образов есть (и даже не один) алгоритм как такое сделать.

Я вот все думаю над твоей идеей. Однослойная нейросеть проблему явно не решит. А как насчет более сложных вариантов?
PM   Вверх
alksoft
Дата 26.10.2005, 23:11 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 2
Регистрация: 22.10.2005

Репутация: нет
Всего: нет



В принцыпе можно сделать методомо жука.
Долго писать, если нужно стучи в аську - 24 9 9 60
PM MAIL   Вверх
DragonFire
Дата 27.10.2005, 06:07 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 725
Регистрация: 14.8.2005
Где: Москва

Репутация: нет
Всего: 9



Вариант хороший, только как ты представляешь себе на практике сравнивание векторов?
На счет многослойной сети можно подумать...


--------------------
PM MAIL ICQ   Вверх
PavelK
Дата 27.10.2005, 08:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 14
Регистрация: 11.9.2005

Репутация: нет
Всего: нет



А в чем проблема с векторами? Два направленных отрезка. Нужно получить угол между ними. Это еще в школе было.
PM   Вверх
DragonFire
Дата 27.10.2005, 13:02 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 725
Регистрация: 14.8.2005
Где: Москва

Репутация: нет
Всего: 9



Ну не знаю. Хотя идея мне нравится...


--------------------
PM MAIL ICQ   Вверх
RA
Дата 27.10.2005, 21:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Брутальный буратина
****


Профиль
Группа: Участник Клуба
Сообщений: 3497
Регистрация: 31.3.2002
Где: Лес

Репутация: нет
Всего: 115



Цитата
Совсем скоро компания ABBYY намерена выпустить инструментарий для разработчиков (SDK) - ABBYY FineReader Engine 8.0 для Windows. В нем содержатся все имеющиеся технологии распознавания, созданные компанией ABBYY к настоящему моменту: распознавание печатных текстов (OCR), текстов, написанных от руки (ICR), меток (OMR), одномерных и двумерных штрих-кодов, обработка PDF-файлов, извлечение данных с форм и неструктурированных документов. Все функции распознавания и сбора данных из документов, форм и PDF-файлов, доступны через единый универсальный API (Application Programming Interface).
 
В новой версии продукта улучшены возможности полнотекстового распознавания документов, впервые появится полный набор функций, рассчитанный для распознавания текста на уровне отдельных полей. ABBYY FineReader Engine 8.0 распознает печатный текст на 189 языках, а поля, заполненные печатными буквами от руки - на 91 языке. Новая версия имеет возможность настройки на необходимую точность за счет влияния на выбор гипотез, сформированных в процессе распознавания.

В новой версии ПО появилась функция диагностики, которая позволяет отследить все вызовы функций ABBYY FineReader Engine и измерить скорость их работы.

ABBYY FineReader Engine 8.0 будет поставляться в комплекте с примерами кода, демонстрирующими использование продукта в различных типовых сценариях работы. Каждый пример представляет собой небольшую программу, которую можно скомпилировать и изучить, как она работает. Приведены описания оптимальных параметров, в комплекте даны типовые изображения и данные по скорости работы и качеству распознавания. Примеры могут использоваться разработчиками в качестве шаблонов при создании своих собственных программ и решений.

ABBYY FineReader Engine поставляется в виде набора динамически подключаемых библиотек (DLL). Интерфейс прикладного программирования (API) ABBYY FineReader Engine поддерживает стандарт COM (Component Object Model) и позволяет создавать приложения в средах разработки C/C++, Visual Basic, Visual Studio.Net и любых других, поддерживающих COM-компоненты.

В продажу новая версия ABBYY FineReader Engine 8.0 поступит уже в ноябре. Более подробно ознакомиться со всеми новыми возможностями продукта можно здесь.

Источник: Компьюлента

PM   Вверх
sergejzr
Дата 27.10.2005, 22:44 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Un salsero
Group Icon


Профиль
Группа: Админ
Сообщений: 13285
Регистрация: 10.2.2004
Где: Германия г .Ганновер

Репутация: 4
Всего: 360



RAdmin, смысл не в результате, а в пути к нему smile Интересная ведь идея. Вот только я не очень понимаю, почему вектор для Буквы и описан как:
Цитата
Он будет представлять собой 3 вектора (первый направлен вниз, второй - вверх под углом 45 градусов, третий - тоже вниз).

А почему не:

вниз -> вниз под углом 45 -> вниз.

Добавлено @ 22:45
Вообще то можно не вектор, а кривые брать, Релевантны лишь начальная и конечная точка, а факторы колеблятся в пределах n.


--------------------
PM WWW IM ICQ Skype GTalk Jabber AOL YIM MSN   Вверх
DragonFire
Дата 28.10.2005, 06:02 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 725
Регистрация: 14.8.2005
Где: Москва

Репутация: нет
Всего: 9



И вообще почему именно три вектора? Как ты собираешся описывать букву "М" или "Ш" тремя векторами, а с "О", это вообще сложно будет разобратся...


--------------------
PM MAIL ICQ   Вверх
Guest
Дата 28.10.2005, 12:41 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Три вектора я взял только для буквы "И" как пример.
На самом деле, даже для буквы "и", их может быть больше.
И чего вы к этим трем векторам прицепились.

  Вверх
Guest
Дата 28.10.2005, 12:45 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Уважаемый, RAdmin, подскажите пожайлуста где ты взял статейку о ABBYY FineReader Engine 8.0.
  Вверх
Гость_Silver
Дата 8.11.2005, 14:55 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Про вектора идея не нова. У нас недавно аспирант защитил кандидатскую по распознованию, алгоритм основан на нечеткой логике(размытой логике) он там с петлями работал (что то вроде векторов smile)) ). Кстати его алгоритм очень хорош по минимизации ошибок по сравнению с западными аналогами, делал он его для КПК и вроде даже толкнул програмку за большие мани. Его автореферат попробуй найти (его зовут В. В. Киселев из Челябинского Государственного Университета)
  Вверх
Guest
Дата 15.1.2006, 01:06 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Да возможно это так, но я не представляю как это можно реализовать практически...
smile smile smile smile smile smile smile smile smile smile smile smile smile smile
  Вверх
sergejzr
Дата 15.1.2006, 01:11 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Un salsero
Group Icon


Профиль
Группа: Админ
Сообщений: 13285
Регистрация: 10.2.2004
Где: Германия г .Ганновер

Репутация: 4
Всего: 360



Вообще то темку не зря подняли. Год прошёл, может какие компоненты/алгоритмы появились на распознавание? Что скажете?


--------------------
PM WWW IM ICQ Skype GTalk Jabber AOL YIM MSN   Вверх
DeadSoul
Дата 15.1.2006, 01:21 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Участник
Сообщений: 1217
Регистрация: 25.9.2005
Где: Москва

Репутация: 1
Всего: 11



Цитата(alexeis1 @ 25.10.2005, 09:43 Найти цитируемый пост)

Компания Finereader так и не сумела решить эту задачу на должном уровне

alexeis1, данная компания называется Abbyy. Finereader - это програмный продукт.


--------------------
 Если Вы получили ответ на Ваш вопрос, то нажмите на "Вопрос решен". 

Бьем спамеров их же оружием. Пусть весь спам сыпется им
[email protected] 
PM   Вверх
Страницы: (3) Все 1 [2] 3 
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.1158 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.