![]() |
Модераторы: korob2001, ginnie |
![]() ![]() ![]() |
|
infarch |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 526 Регистрация: 13.3.2009 Репутация: нет Всего: 1 |
Не встречался ли кто с модулями позволяющими разбирать адреса. Например строку "г. Москва, ул. В. Пупкина, дом 555, кв.666" надо разложить на город, улицу, дом и квартиру. Следует так-же учитывать что не все адреса написаны в едином стиле. Может отсутствовать точка или запятая, ну и так далее. Я делал такой разборщик, но вижу что много не распознается. Может, есть что либо готовое?
|
|||
|
||||
migaro |
|
|||
Новичок Профиль Группа: Участник Сообщений: 36 Регистрация: 4.2.2010 Репутация: нет Всего: нет |
Ну покажите что у вас уже есть.. а там и поглядим..
![]() |
|||
|
||||
infarch |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 526 Регистрация: 13.3.2009 Репутация: нет Всего: 1 |
Показывать не буду, а общий принцип могу рассказать. Адрес режется по запятым, а потом каждая часть анализируется по разным признакам. Типа "ул. ...", "пгт ...", "... пр-т" и так далее. Но учитывая криворукость адресописателей этот метод обрабатывает порядка 75 процентов записей. Хотелось бы повысить этот процент
![]() |
|||
|
||||
Suppir |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 588 Регистрация: 20.4.2009 Репутация: нет Всего: нет |
Это сложная задача. В первую очередь необходимо собрать все возможные варианты адресов.
Если в адресах некоторые части могут переставляться местами, то будет еще веселее. Не надейтесь найти готовое решение, которое будет распознавать 100% адресов. Добавлено через 5 минут и 10 секунд Если не очень торопитесь, могу взяться за эту задачу через два месяца. Напишу очень точный парсер (есть опыт работы в аналогичных задачах). |
|||
|
||||
infarch |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 526 Регистрация: 13.3.2009 Репутация: нет Всего: 1 |
А то я не знаю что сложная
![]() |
|||
|
||||
migaro |
|
|||
Новичок Профиль Группа: Участник Сообщений: 36 Регистрация: 4.2.2010 Репутация: нет Всего: нет |
Да.. это точно.. Дело в том что адресс можно записать по разному.. Нет единого стандарта для этого.. а если бы и был.. То врятли бы все писали по нему.. ![]() |
|||
|
||||
Suppir |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 588 Регистрация: 20.4.2009 Репутация: нет Всего: нет |
У меня есть парсер, которые распознает заголовки актов органов власти (делит на "орган", "тип документа", "дату", "номер", "название"). Так вот, несмотря на единые стандарты - в каждом регионе, каждый орган власти умудряется писать по-своему. Набоковы, блин!
![]() ![]() Это сообщение отредактировал(а) Suppir - 29.6.2010, 10:56 |
|||
|
||||
infarch |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 526 Регистрация: 13.3.2009 Репутация: нет Всего: 1 |
Спасибо, но я лучше сам поиграюсь ![]() |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Perl" | |
|
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Perl: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |