Форум программистов [Powered by Invision Power Board]

Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате

Форум программистов > Java: Общие вопросы > Распознование схожих данных на Java

Автор: Akonkagva 1.1.2012, 21:36

С наступившим 2012 годом,

В новом году столкнулся с проблемой, нахождения схожести в большом обьеме данных.

У меня есть LinkedList<Vector3DMy> vec, где Vector3DMy хранит координаты и временной штамп. Есть некотрые заранее записанные данные тоже в LinkedList<Vector3DMy> формате, нужно найти схожесть между заранее записаным и растущим вектором, лутше в процентном соотношении.

Проблема заключаеться в том что данные не идентичные, длина вектора может варьироваться, но нужно стараться найти наиболее схожий обьект из доступных вариантов.

Какие алгоритмы лутше использовать ?
Что вы можете посоветовать ?

Жду советов и ответов)
Спасибо!

Автор: priam220 1.1.2012, 23:32

алгоритмы теже, что и при нахождении минимального элемента массива. Только Вы будите искать минимальную разность между заданным вектором и предлагамемыми вариантами.

Автор: Pawl 1.1.2012, 23:38

Наверное, надо задать условия равенства объектов класса Vector3DM в методах equals и hashCode? Как именно задавать условия, зависит от того, что считать "наиболее схожим объектом из доступных вариантов".

Автор: dobrolub 2.1.2012, 22:51

Я могу только ссылку дать, так как знаю об этом только теоретически. Твоя задача, скорее всего попадает в категорию 'soft clustering'. Не простая, но интересная задачка.
http://en.wikipedia.org/wiki/Cluster_analysis