Форум программистов [Powered by Invision Power Board]

Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате

Форум программистов > Алгоритмы > SVM для категоризации текстов

Автор: becks 8.2.2012, 15:14

Добрый день, коллеги! Может кто-нибудь на пальцах объяснить принцип применения SVM для категоризации текстов. Есть некоторое понимание, общего понимания нет.

Как я это сейчас вижу:

1) Есть некоторое количество категорий текстов. Для каждой категории есть некоторый набор обучающих файлов(текстов)
2) Из этих текстов мы (каким-то образом) получаем самые значимые слова (в нормальной форме), и строим вектор для каждой категории.
3) Потом подаем тестовые тексты (в них выделяем ключевые слова) и смотрим с каким из векторов категорий больше пересечений к тому текст и относится.

Хотелось бы чтоб кто-нить поправил меня, на каком-нибудь элементарном примере. Спасибо.