Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Алгоритм определения СПАМа, Давайте разработаем :) 
:(
    Опции темы
stab
Дата 17.10.2003, 11:34 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Экс. модератор
Сообщений: 1839
Регистрация: 1.1.2003

Репутация: нет
Всего: 48



Цитата
Тут кто то сказал на счет того что mail.ru фиговый сервак ... не согласен, у меня там мыло которое я всегда использую, и у спамеров мой мыльник давным-давно есть, но больше одного-двух спам-писем в неделю, мне не приходит


а мне по 20-30 в день smile.gif


--------------------
6, 6, 6 - the number of the beast.
PM MAIL WWW   Вверх
maxim1000
Дата 17.10.2003, 11:44 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник
Сообщений: 3334
Регистрация: 11.1.2003
Где: Киев

Репутация: нет
Всего: 110



сегодня моему одному из наших сотрудников пришел спам вот в таком виде:
пустое письмо с прикреплением, в прикреплении - gif, в gif'е - текст рекламного содержания
вот и пиши после этого лингвистический анализатор......


--------------------
qqq
PM WWW   Вверх
NightGoblin
Дата 18.10.2003, 06:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Участник Клуба
Сообщений: 1021
Регистрация: 24.11.2002
Где: 127.0.0.1

Репутация: нет
Всего: 11



maxim1000, а сабж какой? Может, по сабжу в таких случаях можно вычислить?


--------------------
Kernel panic: /dev/null overflow!
GCS/IT/MU/O d-@ s: a- C++$>++++$ ULSB(+++) P+++ L+++>++++ !E W++(-) N o? K w-- O? M>+ V? PS+ PE Y+ PGP+>+++ t- 5 X+ R- !tv b+ DI+ D+ G e++ h--- r++ y?
B4F1 54B6 8738 26CD 5125 0581 B923 9273 FE59 1981
PM MAIL WWW ICQ   Вверх
stab
Дата 18.10.2003, 07:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Экс. модератор
Сообщений: 1839
Регистрация: 1.1.2003

Репутация: нет
Всего: 48



NightGoblin, а сабж, поди, "привет! давно не виделись..." smile.gif


--------------------
6, 6, 6 - the number of the beast.
PM MAIL WWW   Вверх
NightGoblin
Дата 19.10.2003, 07:21 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Участник Клуба
Сообщений: 1021
Регистрация: 24.11.2002
Где: 127.0.0.1

Репутация: нет
Всего: 11



Хм... В таком случае, похоже, придется еще и распознавалку текста впихивать.... smile.gif

Чувствую, если этим заняться, в результате получится нечто ужасающее...


--------------------
Kernel panic: /dev/null overflow!
GCS/IT/MU/O d-@ s: a- C++$>++++$ ULSB(+++) P+++ L+++>++++ !E W++(-) N o? K w-- O? M>+ V? PS+ PE Y+ PGP+>+++ t- 5 X+ R- !tv b+ DI+ D+ G e++ h--- r++ y?
B4F1 54B6 8738 26CD 5125 0581 B923 9273 FE59 1981
PM MAIL WWW ICQ   Вверх
Wowa
Дата 19.10.2003, 18:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
Group Icon


Профиль
Группа: Админ
Сообщений: 15017
Регистрация: 14.9.2000
Где: Винград

Репутация: 1
Всего: 290



Цитата
пустое письмо с прикреплением, в прикреплении - gif, в gif'е - текст рекламного содержания
вот и пиши после этого лингвистический анализатор......


Это и будет спамом будущего.
PM WWW   Вверх
frost
Дата 20.10.2003, 08:37 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 30
Регистрация: 20.10.2003
Где: г. Королёв М.о., м-рн Комитетский лес, д.5, кв.40

Репутация: нет
Всего: нет



Уважаемые товарищи, я серьёзно в этом не разбираюсь, но по-моему тут промелькнула одна интересная мысль... что спаммеры (или лучше с одной "м"?) никогда с одного адреса много не посылают... Это и естественно - засекут и выгонят или применят законодательство, в общем - поймают за руку. Поэтому они адресочки-то и бросают.

Так вот. Если эти адресочки быстро удаляются, это и есть необходимая система подтверждений. И сравнительно очень быстрая. Хорошим тоном станет посылать письма с правильным обратным адресом, а спаммерам ничего не останется, как его верно не указывать. И они сами сведутся на void.

На сервере скапливаются письма, робот их передерживает нужное время и проверяет существование обратного адреса. Если он накрылся, письмо удаляется. А если совместить с белыми списками, срочные письма будут приходить без проверки, так что проблем с передержкой не возникнет.

Ну как? Имеет эта идея хоть какое-то отношение к реальности?
PM MAIL   Вверх
stab
Дата 20.10.2003, 11:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Экс. модератор
Сообщений: 1839
Регистрация: 1.1.2003

Репутация: нет
Всего: 48



на сколько я знаю обратный адрес можно любой указать, так что простейший путь получения обратного валидного адреса -- это указание адреса из списка рассылки. smile.gif


--------------------
6, 6, 6 - the number of the beast.
PM MAIL WWW   Вверх
frost
Дата 20.10.2003, 11:58 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 30
Регистрация: 20.10.2003
Где: г. Королёв М.о., м-рн Комитетский лес, д.5, кв.40

Репутация: нет
Всего: нет



Серьёзно, может быть можно как-то использовать то, что спаммеры скрывают свой настоящий лицо?..
PM MAIL   Вверх
PAC-MAN
Дата 12.12.2003, 01:52 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Интересное обсуждение smile.gif я сам думал над этой проблемой.
1. На самом деле прога фильтрации должна обеспечивать высокую степень как защиты от спама, так и защиту нормальных писем от пометки их как спамерской
2. У каждого мейлаккаунта спам свой (у меня 2 старых ясчика, на каждый приходит разный спам, одинаковый спам приходит в разных объемах, например на один приходит по лекарствам и всяким антивирусам а на другой по менеджменту и продажам).
3. спамеры могут слать письма с "хорошего аккаунта" и пометив его в онлайновой базы как "плохой" вы лишаете как минимум одного юзера услуг. (все благодаря дырявому SMTP)
4. любое подтверждение письма есть индикатор того что мыло работает, кроме того не обеспечивается защита от вирей собирающих списки хороших мыл (Sobig например формировал такие листы)

НО, как мне кажется, защита есть - фильтрация по Бейетсу (http://klirik.narod.ru/usefuls/bayesyan.htm) дает неплохие результаты 99,7%. к томуже несуществует ниодной полнофункциональной проги работающей по этому алгоритму, просто технология очень новая, но оч перспективная. кроме того фильтрация должна идти по заголовку, по теме, по размеру картинок (по мере накопления данных она будет учится). на серваке можно организовать базу на каждый адрес, и предоставить разную степень фильтрации (за разную плату), т.е. большая степень защиты - больше рассматриваемых токенов - больше цена.

предлагаю следующий план реализации:
1. пробная прога на основе аутглюк или бат (с целью - не писать поддержку смтп, поп, телнет и проч., а сосредоточится на проге) с целью установить точность данного алгоритма, особенности работы, уровень точности (может вообще проводиться локально на основании текстовых\смешаных файлов, или иметь две базищи - одна хорошие другая плохие письма).
2. написание пробный сервера\плагина к серверу который будет все письма фильтровать и производить какоето действие (скалывать в папку, фильтровать повторно с повышеной точностью и т.д.). с целью - замер скорости, объема БД, эффективности от изменения точности.
3. уточнение состава задач, состава операций\функций, разработка общей модели взаимодействия\передачи.
4. определение состава требований к тех. средствам передачи данных. определение структуры системы передачи данных (пакетный диалоговый ...), определение предоставляемых сервисов (например 500 токенов - 1р, 1000 - 3р ...., 2000 токенов + фильтрация по размерам картинок - 10р.)

P.S. хотел сам написать но времени не имею sad.gif , а алгоритм бейетса хорошая штуковина, и проблемы
с т ра н но на пи сан ых с л о в в ней решаются автоматически, как и лингвистический анализатор, как и анализ скрытого текста, но проблема трафика не решается естесна smile.gif т.к. чтоб анализировать письмо нужно получить.
P.P.S. ИМХО за статическим анализом будущее.
  Вверх
dr.ZmeY
Дата 15.12.2003, 22:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Политолог
****


Профиль
Группа: Участник Клуба
Сообщений: 3892
Регистрация: 26.3.2002
Где: ..::STALINGRAD::. .

Репутация: нет
Всего: 60



Про 99,7% ты конечно загнул, но процентов 90 - это правда... Помимо лингвистического анализа, плагин создаёт словарь, на основе "спамовых" писем, который постепенно расширяется, и письма с похожим содержанием уже не доходят, они удаляются ещё на сервере..., правда это у них несколько криво реализовано...
Так вот, мне кажется программа должна состоять из двух модулей, один из них находится на сервере, а другой у клиента, клиент составляет подобный словарь... и отправляет его на сервер (точнее не весь, это может быть много... Словарь клиента растёт, а на сервер отправляется обновление)... вторая часть плагина, на сервере отсеивает спам по обновлённому словарю и отправляет остальные "здоровые письма" клиенту, а спам удаляет... Если спам просочился, клиент его помечает, и информация в словаре обновляется... в следующий раз письмо подобного содержания уже не дойдёт... Параллельно идёт и лингвистический анализ... В итоге получаем систему, которая и трафик уменьшает...


--------------------
PM MAIL WWW ICQ Skype   Вверх
PAC-MAN
Дата 16.12.2003, 23:17 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 15
Регистрация: 12.12.2003

Репутация: нет
Всего: нет



уху, тока шняга может получиться, надо же гарантировать что нужное письмо не убьется -> мож на серваке грохать только то что помечено как стопудовый спам, а об остальном хотябы извещать получателя?
99.7% - это експирименть, такой - 2000 писем спамных и 2000 нормальных, ну воть и получили эти 99.7%, хстати на серваке можно вести объединеную статистику - по всем спамным письмам всех ясчиков
PM MAIL   Вверх
MuToGeN
Дата 17.12.2003, 10:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Лесник
****


Профиль
Группа: Модератор
Сообщений: 4379
Регистрация: 15.8.2002
Где: Москва

Репутация: нет
Всего: 32



Насчет проверки обратного адреса... Еще в SMTP существует такая фишка, как VRFY. Только не все сервера ее поддерживают.


--------------------
Three pings for the token rings,
Five pings for the UNIX machines,
Hundred pings for the broken links,
One special ping to check them all
Through Simple Network Management Protocol!
PM MAIL ICQ   Вверх
dr.ZmeY
Дата 18.12.2003, 21:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Политолог
****


Профиль
Группа: Участник Клуба
Сообщений: 3892
Регистрация: 26.3.2002
Где: ..::STALINGRAD::. .

Репутация: нет
Всего: 60



Цитата
мож на серваке грохать только то что помечено как стопудовый спам, а об остальном хотябы извещать получателя?

Разумеется, рейтинговать письма по "СПАМНОСТИ", письма с рейтингом ~90% - убиваются прям на серваке, остальные пересылаются юзверю... Если среди них есть спам и он его метит (как в the Bat, отправляет в папку "спам"), то эти письма анализируются по разным параметрам: лингвистическому, скриптовому, прикреплённым файлам, сабжу и т.д... Данные заносятся в словарь и при следующем коннекте обновление словаря отправляется на сервер...

Очень важно, чтобы пользователь сам решал, что для него является спамом, а что нет... Может кому-то нравится получать рассылки с адульт-сайтов и потирая мозолистые ручонки тыкать по ссылочкам... smile.gif

Цитата
Насчет проверки обратного адреса...

Этого не надо делать... Представь, ты мне отправил с винградовского сервера мыло, и вдруг, какая-нибудь фигня в Германии, наводнение, гроза... сервер на пару часов в ауте, ответа мой сервер не получил... я не получаю этого письма и мыльник твой заносится в базу спамерских...

Мыльник вообще нельзя в словарь плагина вводить, т.к. многие спамеры используют чужие мыльники для рассылок... Сам так делал, и MuToGeN, вроде тоже... wink.gif


--------------------
PM MAIL WWW ICQ Skype   Вверх
podval
Дата 30.12.2003, 20:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 1
Всего: 62



Цитата
Спамеры ежедневно отсылают десятки миллионов е-мейлов ничего не подозревающим пользователям, используя любые методы для обмана фильтров почтовых программ. Группа исследователей из корпорации Microsoft полагает, что они нашли решение проблемы.


http://www.webplanet.ru/news/internet/2003...osoft_spam.html
PM WWW ICQ   Вверх
Ответ в темуСоздание новой темы Создание опроса
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Методы борьбы со спамом | Следующая тема »


 




[ Время генерации скрипта: 0.2185 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.