Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Фильтр для спама на основе нейро сетей 
:(
    Опции темы
elitewise
Дата 14.5.2008, 19:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 1
Регистрация: 14.5.2008

Репутация: нет
Всего: нет



Привет всем!
Интересует вопрос кто либо разбирался с нейро сетями  и возможностями поиска спама на их основе?
И какие параметры нужно учитывать, что бы классифицировать письмо как спам?
Буду благодарна за любую информацию.
PM MAIL   Вверх
Toltek999
Дата 28.5.2008, 23:07 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 6
Регистрация: 28.5.2008

Репутация: нет
Всего: нет



Присоединюсь к вопросу. 
Интересная тема.

Поделитесь знаниями, кто их имеет.
PM MAIL   Вверх
marykone
Дата 11.6.2008, 11:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 2722
Регистрация: 2.5.2006
Где: Краснодар

Репутация: нет
Всего: 67



с нейро сетями знаком но вот для отлова спама применять не пытался.
идея хорошая.
только вот интересно вообще по каким критериям отбирать спам не спам 
давайте составим список. 


--------------------
получил ответ, пометь вопрос как решенный (правый верхний угол вашей темы).

PM   Вверх
Dobermann
Дата 16.7.2008, 05:39 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 992
Регистрация: 7.1.2008

Репутация: нет
Всего: 0



Цитата(marykone @  11.6.2008,  11:12 Найти цитируемый пост)
только вот интересно вообще по каким критериям отбирать спам не спам давайте составим список. 

Название темы(гнуха) и т.п.
Цитата(elitewise @  14.5.2008,  19:16 Найти цитируемый пост)
возможностями поиска спама на их основе?

Хоть какой-нибудь пример покажите!!!
PM   Вверх
newalex
Дата 29.12.2008, 13:57 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 92
Регистрация: 15.11.2005

Репутация: нет
Всего: нет



Сначала формируем обучающий корпус из писем, которые точно являются спамом. Проводим частотный анализ на предмет выявленя наиболее частых слов (выкидываем стоп-слова при этом). Таким образом получаем грубо говоря словарь спама.
Обучаем на нем нейросеть подавая на вход частоты этих слов для разных текстов: заведомо являющихся спамом и точно не спама. Сохраняем полученную нейросеть.
Для использования подаем на вход обученной нейронной сети частоты слов данного для анализа текста (те что были в словарике). Сеть формирует ответ: спам или не спам. 
PM MAIL   Вверх
marykone
Дата 14.1.2009, 16:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 2722
Регистрация: 2.5.2006
Где: Краснодар

Репутация: нет
Всего: 67



newalex, вы это реализовывали ? 



--------------------
получил ответ, пометь вопрос как решенный (правый верхний угол вашей темы).

PM   Вверх
MaXL
Дата 16.1.2009, 19:08 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Developer
**


Профиль
Группа: Участник
Сообщений: 380
Регистрация: 24.10.2005
Где: Владивосток

Репутация: нет
Всего: 2



А в чём заключается алгоритм Байеса, ведь он что-то такое и выполняет, только без нейросети ?
ему на вход идёт два потока, "белые" и "чёрные" письма. Он смотрит, какие слова где встречаются и потом уже на основе имеющихся знаний может дать ответ спам/не спам.


--------------------
MaXL
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Методы борьбы со спамом | Следующая тема »


 




[ Время генерации скрипта: 0.1145 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.