![]() |
|
![]() ![]() ![]() |
|
dinaria |
|
|||
Новичок Профиль Группа: Участник Сообщений: 2 Регистрация: 1.7.2011 Репутация: нет Всего: нет |
Здравствуйте, нужно решить программно следующую задачу:
1) есть база плательщиков с адресами; единообразного заполения адреса нет, т.е. адрес может быть написан по-разному пример:Вышний Волочек,г.Вышний Волочек,КОТОВСКОГО,44 ; 2) мне нужно адресную строку разбить на следующие составляющие:район, населенный пункт, населенный пункт второго уровня,улица, дом, квартира;и загнать все это в dbf таблицу в соответствующими полями) в адресе всегда есть район, населенный пункт и дом, а населенный пункт второго уровня, улица и квартира могут отсутствовать) мне бы алгоритм, который бы все это делал)может кто-нибудь уже сталкивался с такой задачей) поделитесь опытом, пожалуйста) |
|||
|
||||
nworm |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 502 Регистрация: 22.10.2005 Репутация: 4 Всего: 8 |
Это обычно вручную делают, если нужно точности достичь. Робот всё равно хоть раз да ошибётся.
Причина - ошибки при вводе данных. Пожалуй лучший пример, Комск вместо толи Томск, толи Омск. И дальше надо по улицам и домам выверять. Роботы это в настоящее время не делают. Можно делать полуавтоматические системы с апрувингом. То есть после работы программы модератор всё проверяет. Дальше смотрите, какие разделители в тексте, обращаете внимание на Индекс (самое, видимо, хорошее поле). Ну и заносите всё в свою базу данных. |
|||
|
||||
dinaria |
|
|||
Новичок Профиль Группа: Участник Сообщений: 2 Регистрация: 1.7.2011 Репутация: нет Всего: нет |
Спасибо за ответ)скорее всего буду делать нормализацию адресов)
|
|||
|
||||
_Y_ |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1651 Регистрация: 27.11.2006 Репутация: 8 Всего: 34 |
Я делал нечто подобное для списков научных журналов: названия, годы издания, издатель, адрес издателя. Получился полуавтомат с немаленькой базой данных. Работал примерно так.
В Вашем случае есть проблема. У меня адресов было не так уж и много - сколько издательств столько и адресов. У вас же названий улиц может быть ну ооочень много. -------------------- Я вот в этом поучаствовал: http://sbor-nik.appspot.com/kick.jsp?id=sbor5737960678883328 (на правах саморекламы:) |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Алгоритмы" | |
|
Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000. |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Алгоритмы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |