Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Алгоритм определения СПАМа, Давайте разработаем :) 
:(
    Опции темы
PostEr
Дата 29.7.2003, 21:08 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 282
Регистрация: 30.6.2003
Где: Самара

Репутация: нет
Всего: 1



Bayesian Engine for Spam / Non-Spam Detection
Bayesian support within the new Spam Filtering system has been completed. Bayesian classification is a mathematical process whereby machines can actually learn. Through repeated exposure to known samples of spam (and non-spam) Bayesian enabled software can learn to recognize patterns. Over time, Bayesian classification techniques grow more and more reliable.

MDaemon supports Bayesian classification through its incorporation of the SpamFilter heuristic software and through use of a "learning" program that is used to rapidly process and index spam and non-spam sample messages. The learning tool, SA-Learn, will be executed by MDaemon at midnight each night. The tool will examine the content of a "known-spam" folder and a "known-non-spam" folder. You provide the folders and the content. Since the Bayesian results improve over time the scoring tends to get more and more accurate.

SA-Learn trusts that the messages you feed it really and truly are spam and/or non-spam. It takes your word that the input data is accurate. Here's what you should do:

Go to the Spam Filtering|Bayesian tab and use the "Pub Folder" buttons to create two public folders - one for false negatives (messages that should have been flagged as spam but weren't) and another folder for false positives (messages that were incorrectly flagged as spam). Make these folders accessible to all your IMAP users. Now, instruct your users to place copies of any false positive or false negative messages that they receive into these public folders. MDaemon will process them through the learning tool at midnight each night. After processing, these messages are automatically deleted.


PS Как вам такое??

-----------
взято с MDaemon


--------------------

------------------------------------------------------------------

[email protected]
До востребования

PM MAIL WWW ICQ   Вверх
Phantomouse
Дата 30.7.2003, 14:02 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 16
Регистрация: 15.7.2003

Репутация: нет
Всего: нет



Пример реализации того, что мы ищем нам подсказывает сама природа. Вспомним школьный курс биологии… Клетка. Ее мембрана свободно пропускает воду, питательные вещества и кислород. Но она задерживает многие вредные газы. Лишь микробы способны проникнуть сквозь нее, но внутри его ждет фагоцитоз. Стоит заметить, что сама по себе мембрана не мешает, а даже помогает клетке общаться с миром :-). Вот к такой системе нам и надо стремиться. А для этого на мой взгляд нужно в первую очередь подумать, а не тупиковая ли та идея, тот алгоритм от которого мы оттолкнулись. Не приведет ли она нас к ограниченности общения| Я думаю, что надо попытаться начать с нуля (полного нуля) и разработать принципиально новую программу, а не двигать уже устаревшие и выработавшиеся механизмы.
PM MAIL ICQ YIM   Вверх
PostEr
Дата 30.7.2003, 17:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 282
Регистрация: 30.6.2003
Где: Самара

Репутация: нет
Всего: 1



Phantomouse, я с тобой согласен. Необходимо что-то принципиально новое!!!! Новый протокол, новые принципы, возможно новая сеть. А что если действительно организовать MailNet? Ж)


--------------------

------------------------------------------------------------------

[email protected]
До востребования

PM MAIL WWW ICQ   Вверх
Phantomouse
Дата 31.7.2003, 14:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 16
Регистрация: 15.7.2003

Репутация: нет
Всего: нет



Итак... Есть идеи по поводу основы такой сети?
PM MAIL ICQ YIM   Вверх
PostEr
Дата 31.7.2003, 14:39 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 282
Регистрация: 30.6.2003
Где: Самара

Репутация: нет
Всего: 1



Идей у меня пока нет. Но..


--------------------

------------------------------------------------------------------

[email protected]
До востребования

PM MAIL WWW ICQ   Вверх
PostEr
Дата 31.7.2003, 14:43 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 282
Регистрация: 30.6.2003
Где: Самара

Репутация: нет
Всего: 1



Я вот никак не пойму как POP3 работает. То есть рфц я посмотрел, но не пойму, как сделать сервак поповоский? Может нужно за основу брать уже что-то сделаное (поп3, imap), но делать это заново? То есть использовать те же принципы, но делать тоже самое с нуля?


--------------------

------------------------------------------------------------------

[email protected]
До востребования

PM MAIL WWW ICQ   Вверх
Phantomouse
Дата 31.7.2003, 15:08 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 16
Регистрация: 15.7.2003

Репутация: нет
Всего: нет



Я думаю, именно так и надо делать... Но фильтры нужно включать как на стороне сервера так и не стороне клиента... И вообще, можно первое время вообще не пускать в эту сеть внешние письма... Тогда мы сможем отслеживать спаммеров внутри сети... Ну а потом, просто поставить фильтрацию и пустить внешние письма внутрь... тогда кто захотел безопасности, с нами... А кто нет просто сможет общаться со счастливчиками )))
PM MAIL ICQ YIM   Вверх
PostEr
Дата 31.7.2003, 15:17 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 282
Регистрация: 30.6.2003
Где: Самара

Репутация: нет
Всего: 1



smile.gif)) Согласен, но ты меня чуть не грузанул smile.gif))


--------------------

------------------------------------------------------------------

[email protected]
До востребования

PM MAIL WWW ICQ   Вверх
MuToGeN
Дата 21.8.2003, 13:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Лесник
****


Профиль
Группа: Модератор
Сообщений: 4379
Регистрация: 15.8.2002
Где: Москва

Репутация: нет
Всего: 32





--------------------
Three pings for the token rings,
Five pings for the UNIX machines,
Hundred pings for the broken links,
One special ping to check them all
Through Simple Network Management Protocol!
PM MAIL ICQ   Вверх
stab
Дата 27.8.2003, 23:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Экс. модератор
Сообщений: 1839
Регистрация: 1.1.2003

Репутация: нет
Всего: 48



Цитата
http://www.downloads.ru/news/antispam.hts


тупо как-то smile.gif при большом объеме писем вероятность совпадения по размеру текста очень большая.

кроме того метод приведет к централизованной обработке писем (в этом случае он должен быть, по словам автора, особенно эффективен smile.gif ), а это не есть гуд. Интернет разрабатывался как децентрализованная система...


--------------------
6, 6, 6 - the number of the beast.
PM MAIL WWW   Вверх
NightGoblin
Дата 5.9.2003, 01:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Участник Клуба
Сообщений: 1021
Регистрация: 24.11.2002
Где: 127.0.0.1

Репутация: нет
Всего: 11



Не знаю, может кто-то уже это и предлагал, но у меня времени читать все не хватило. Почему не сделать на каждый емаил список разрешенных адресов, плюс определенную тему, с коротой почта будет приниматься отовсюду. Например, у меня так и сделано, единственное неудобство - нет удобной утилиты конфигурирования, приходится лазить через браузер, ну да по-другому в данном случае и никак - сервер не мой. В случае, если спамеры начинают присылать письма с этой темой, тему можно в любой момент поменять. К слову, ни одного письма, которое я бы тут же удалил (кроме ошибок с сервера), мне не приходило с февраля этого года, когда я этот фильтр поставил. Конечно, некоторые неудобства существуют, но их можно обойти тоже.

А вообще самый хороший способ защититься от спама - не раскидываться своим мыльником, особенно на сомнительных сайтах и форумах...


--------------------
Kernel panic: /dev/null overflow!
GCS/IT/MU/O d-@ s: a- C++$>++++$ ULSB(+++) P+++ L+++>++++ !E W++(-) N o? K w-- O? M>+ V? PS+ PE Y+ PGP+>+++ t- 5 X+ R- !tv b+ DI+ D+ G e++ h--- r++ y?
B4F1 54B6 8738 26CD 5125 0581 B923 9273 FE59 1981
PM MAIL WWW ICQ   Вверх
IZ@TOP
Дата 5.9.2003, 13:51 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Панда-бир!
****


Профиль
Группа: Участник
Сообщений: 4795
Регистрация: 3.2.2003
Где: Бамбуковый лес

Репутация: нет
Всего: 73



Да ... меня больше всего убило дополнение к статье
Цитата
http://www.downloads.ru/news/antispam.hts
на счет перемешанного текста разного цвета ... Вообще идеи тут очень даже не чего ... а нельзя действительно придумать какой нибудь лингвистичиский алгоритм ? Чтоб текст анлизировал, как если бы сам человек читал и отбрасывал письма рекламного характера ...

Тут кто то сказал на счет того что mail.ru фиговый сервак ... не согласен, у меня там мыло которое я всегда использую, и у спамеров мой мыльник давным-давно есть, но больше одного-двух спам-писем в неделю, мне не приходит smile.gif


--------------------
Один из розовых плюшевых-всадников апокалипсиса... очень злой...

Семь кругов ада для новых элементов языка
Мои разрозненные мысли
PM MAIL WWW ICQ Skype GTalk   Вверх
Гость_Серго
Дата 5.9.2003, 14:06 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Майл.Ру использует фильтр Спамтест, который фильтрует в том числе и по лингвистическим сигнатурам письма.
  Вверх
NightGoblin
Дата 6.10.2003, 09:31 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Участник Клуба
Сообщений: 1021
Регистрация: 24.11.2002
Где: 127.0.0.1

Репутация: нет
Всего: 11



Кстати, "письма рекламного характера" - очень размытое понятие. Понятно, что "Заработай $1,000,000,000,000 не выходя из дома" - реклама, а как насчет чего-нибудь в плане:
Цитата

Subject: Re: Привет!

Вася, привет!

Слушай, вот я тут лазил по инету и наткнулся на неплохой сайтик... Там такое!...
...

ну и тому подобное... То есть даже если будет анализировать интеллект (неважно, искусственный или нет), он с большой долей вероятности такое пропустит. А мне такое приходило раньше, и не раз... Я поначалу думал даже, что где-то что-то глюкануло и мне пришло чужое письмо. А если пытаться отфильтровать и это - начнутся ложные срабатывания, которые навредят еще больше, чем сам спам... То есть, имхо, тут надо анализировать не содержание, а именно на уровне символов...


--------------------
Kernel panic: /dev/null overflow!
GCS/IT/MU/O d-@ s: a- C++$>++++$ ULSB(+++) P+++ L+++>++++ !E W++(-) N o? K w-- O? M>+ V? PS+ PE Y+ PGP+>+++ t- 5 X+ R- !tv b+ DI+ D+ G e++ h--- r++ y?
B4F1 54B6 8738 26CD 5125 0581 B923 9273 FE59 1981
PM MAIL WWW ICQ   Вверх
_Rich_
Дата 16.10.2003, 16:45 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Совершенно согласен с NightGoblin.
Мне в последнее время приходит по нескольку писем такого рода в неделю.
  Вверх
Ответ в темуСоздание новой темы Создание опроса
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Методы борьбы со спамом | Следующая тема »


 




[ Время генерации скрипта: 0.0915 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.