Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > Алгоритмы > Выделение участка с текстом на изображении


Автор: SHShadow 25.12.2007, 18:24
Задача такова: 
Есть изображение, для простоты можно взять монохромное черно-белое с изображенными на нем различными объектами (картинки, участка с текстом, отдельно стоящие символы, таблицы ... ) необходимо выделить прямоугольник с текстом, для последующей подачи его на вход нейронной сети. На всем изображении текст набран одним шрифтом. Изображение без шумов, текст без наложений. Условия в общем идеальные.
Проблема: 
Определяю прямоугольники отдельных объектов (букв в том числе), не могу определить участок с надписью целиком. Размер шрифта не известен и интервал между символами соответственно то же.
http://forum.vingrad.ru/topic-132325.html нечто похожее, но решение так и не найдено.

Автор: JackYF 25.12.2007, 20:37
Цитата(SHShadow @  25.12.2007,  18:24 Найти цитируемый пост)
Определяю прямоугольники отдельных объектов (букв в том числе)

SHShadow, Ты можешь определить, буква это или нет? Если да, то тогда, имхо, нужно копать в сторону взаимных расстояний между этими объектами, выделить из них явные группы, а затем в каждой группе построить наименьшую выпуклую область (есть такой или похожий термин в графике).


Автор: SHShadow 26.12.2007, 12:28
Напрямую нет не могу, нужно определять по клсвенным признакам, а вот по каким....?

Автор: VictorTsaregorodtsev 26.12.2007, 16:32
SHShadow, См. описание алгоритма конверсии изображений в формат djvu - он как раз делит картинку на блоки, дабы пожать разные блоки разными алгоритмами. Там как раз мухи (пустые блоки) будут отделяться от котлет (блоков текста, картинок и т.д.).
Доки лежат где-то на djvuzone.org

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)