Модераторы: LSD, AntonSaburov
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> поиск XML файлов по атрибутам, поиск XML файлов в папке по атрибуту 
:(
    Опции темы
Tasch
Дата 7.5.2012, 21:17 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 1
Регистрация: 7.5.2012

Репутация: нет
Всего: нет



Есть папки в которых сожранены XML файлы (от 70 штук до 70 000 и более).
Нужно найти/отобрать XML файлы, которые содержат определенные значения атрибутов.

Например - номер страховки 12345.

Критерий - эффективный поиск за миниальное время.

Были мысли использовать алгоритм B-Tree, но т.к. поиск может производится по разным критериям ... ищем дальше

Были предложения испольовать XPath, т.к. названия атрибутов предположительно известны. Но вывод должен список файлов...

smile 

Может кто-то сталкивался с подобным  
PM MAIL   Вверх
Stolzen
Дата 10.5.2012, 08:58 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1041
Регистрация: 17.10.2005

Репутация: 23
Всего: 48



Какая ос? nix? Там в одну строку можно вывести список всех файлов - с помощью find и/или grep
Если нужно именно для джавы, то алгоритм примерно такой: ищем список всех xml фалов, и для каждого проверяем, содержится ли в нем номер страховки 12345 - http://www.coderanch.com/t/389830/java/jav...-contains-given


--------------------
datatalks.ru - анализ данных, статистика, машинное обучение
PM MAIL WWW   Вверх
LSD
Дата 10.5.2012, 11:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Leprechaun Software Developer
****


Профиль
Группа: Модератор
Сообщений: 15718
Регистрация: 24.3.2004
Где: Dublin

Репутация: 210
Всего: 538



Цитата(Tasch @  7.5.2012,  22:17 Найти цитируемый пост)
Критерий - эффективный поиск за миниальное время.

Можно подумать бывают случаи когда надо реализовать не эффективный поиск за максимальное время smile 
Понятия эффективности и минимальности времени слишком расплывчатые. Простейший вариант перебираем файлы XPath/регулярное выражение/поиск подстроки ищем нужный атрибут. Если скорость подобного поиска не устраивает, то нужно думать над созданием индекса и поиском по индексу.


--------------------
Disclaimer: this post contains explicit depictions of personal opinion. So, if it sounds sarcastic, don't take it seriously. If it sounds dangerous, do not try this at home or at all. And if it offends you, just don't read it.
PM MAIL WWW   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Java"
LSD   AntonSaburov
powerOn   tux
javastic
  • Прежде, чем задать вопрос, прочтите это!
  • Книги по Java собираются здесь.
  • Документация и ресурсы по Java находятся здесь.
  • Используйте теги [code=java][/code] для подсветки кода. Используйтe чекбокс "транслит", если у Вас нет русских шрифтов.
  • Помечайте свой вопрос как решённый, если на него получен ответ. Ссылка "Пометить как решённый" находится над первым постом.
  • Действия модераторов можно обсудить здесь.
  • FAQ раздела лежит здесь.

Если Вам помогли, и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, LSD, AntonSaburov, powerOn, tux, javastic.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Java: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0605 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.