Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > Алгоритмы > SVM для категоризации текстов


Автор: becks 8.2.2012, 15:14
Добрый день, коллеги! Может кто-нибудь на пальцах объяснить принцип применения SVM для категоризации текстов. Есть некоторое понимание, общего понимания нет.

Как я это сейчас вижу:

1) Есть некоторое количество категорий текстов. Для каждой категории есть некоторый набор обучающих файлов(текстов) 
2) Из этих текстов мы (каким-то образом) получаем самые значимые слова (в нормальной форме), и строим вектор для каждой категории.
3) Потом подаем тестовые тексты (в них выделяем ключевые слова) и смотрим с каким из векторов категорий больше пересечений к тому текст и относится.

Хотелось бы чтоб кто-нить поправил меня, на каком-нибудь элементарном примере. Спасибо.

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)