Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате |
Форум программистов > Алгоритмы > SVM для категоризации текстов |
Автор: becks 8.2.2012, 15:14 |
Добрый день, коллеги! Может кто-нибудь на пальцах объяснить принцип применения SVM для категоризации текстов. Есть некоторое понимание, общего понимания нет. Как я это сейчас вижу: 1) Есть некоторое количество категорий текстов. Для каждой категории есть некоторый набор обучающих файлов(текстов) 2) Из этих текстов мы (каким-то образом) получаем самые значимые слова (в нормальной форме), и строим вектор для каждой категории. 3) Потом подаем тестовые тексты (в них выделяем ключевые слова) и смотрим с каким из векторов категорий больше пересечений к тому текст и относится. Хотелось бы чтоб кто-нить поправил меня, на каком-нибудь элементарном примере. Спасибо. |