![]() |
Модераторы: korob2001, ginnie |
![]() ![]() ![]() |
|
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
Всем доброго дня. Нужно распарсить картинку, номер телефона, к примеру:
http://krasnodar.krd.slando.ru/ajax/misc/phoneimage/5qAzn/ http://www.avito.ru/items/phone/sochi_avto...ca696d11adf536f Погуглив к сожалению не нашёл вменяемых ответов да и вообще практически тем на то как распарсить картинку на perle. Зато нашёл кучу всякого софта OCR, погуглив ещё нашёл OCR для питона, но питон я вообще не учил начинал но этот "строгий синтаксис" убил во мне всё хорошее о питоне. Очень хочится написать именно на перле потому что лучше перловки ничего нет, может сталкивался кто с таким сабжем? помогите плз) |
|||
|
||||
shamber |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1422 Регистрация: 5.9.2006 Где: Россия Репутация: нет Всего: 18 |
||||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
shamber
Благодарю вас, но может посоветуе что-то более конкретное, с чем уже работали, опыта в OCR можно сказать что нет вообще, допустим объявления со слендо (открывал в некоторых программах) корректно просматриваются только в браузерах. upd Чтото у меня нефига не получается, разобраться с модулями. Image-OCR-Tesseract-1.24 для линукс только, скачивал для winx скачивал не работает, OCR::PerfectCR; пишет ошибку на charmap (так понимаю что невозможно открыть память) Это сообщение отредактировал(а) warlock000 - 11.8.2012, 10:53 |
|||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
Неужели никто не решал подобную проблемму на перле?
З.Ы. Так нехочеться учить питон :( |
|||
|
||||
lecharton |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 13 Регистрация: 10.3.2010 Репутация: нет Всего: нет |
Вы капчу делаете? Или в чем сама задача состоит?
Может вам сюда? Это сообщение отредактировал(а) lecharton - 16.8.2012, 14:32 |
|||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
Нужно распарсить номер телефона с картинки, нашел решение на питоне, хочу найти на перле, перерыл весь cpan ничего не нашел толкового (нужно найти для active perl и bsd)
|
|||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
Неужели никто не решал на перле подобной задачи? Не очень хотелось бы "изучать питон и его ### синтаксис"
|
|||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
OCR вменяемых на перле нету, начал писать подбор по шаблону, но пака результаты неочень... Всё ущё актуально.
З.Ы. Тессеракт на питоне тоже неочём, хоть и распазнаёт но часто путает 8 и $ 3 и 8 итд |
|||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
Написал свой OCR, всё работает совпадения 100%, жаль конечто что никто не смог дать конструктивных советов, пршлось читать тонну литературы...
|
|||
|
||||
shamber |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1422 Регистрация: 5.9.2006 Где: Россия Репутация: нет Всего: 18 |
warlock000, зато теперь вы знатно прокачались:)
|
|||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
shamber, Ценнее опыта нет ничего
![]() ![]() |
|||
|
||||
b00 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 13 Регистрация: 27.9.2009 Где: Петербург Репутация: нет Всего: нет |
Я бы передавал эти картинки на antigate, как обычную капчу.
|
|||
|
||||
lecharton |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 13 Регистрация: 10.3.2010 Репутация: нет Всего: нет |
shamber, расскажите, если не секрет, какую литературу читали?
|
|||
|
||||
peektoseen |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 12 Регистрация: 15.3.2012 Репутация: нет Всего: нет |
warlock000, статью не хотите написать?
|
|||
|
||||
warlock000 |
|
|||
Новичок Профиль Группа: Участник Сообщений: 43 Регистрация: 2.8.2011 Репутация: нет Всего: нет |
b00
Через антигейт и прочие сервисы разпознание длится от 10 до 40 секунд, это 10 тысяч объявлений сколько он мне будет обрабатывать? lecharton Всё что можно было найти по OCR в гугле ;) peektoseen Хорошо бы но есть два НО: 1) На это нет времени 2) Усложнят защиту сайта, что не хочется что бы было реализовано. |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Perl: CGI программирование" | |
|
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq. |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Perl: разработка для Web | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |