Модераторы: skyboy, MoLeX, Aliance, ksnk
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Борьба со спамом, Внесите свой вклад в борьбу со спамом! 
:(
    Опции темы
Wowa
Дата 28.12.2002, 19:54 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
Group Icon


Профиль
Группа: Админ
Сообщений: 15017
Регистрация: 14.9.2000
Где: Винград

Репутация: 1
Всего: 290



Все прекрасно знают, откуда происходит наполнение спаммерских баз Email'ов: из скаченных и отсканированных веб-страниц, из логов мелких продажных хостинг-провайдеров, из ICQ и т.д. Есть просто способ испортить роботов, которые сканируют интернет и вырезают с веб-страниц почтовые адреса.
Программа ниже генерирует старницу, содержащую множество ссылок на несуществующие Email. Если на такую станичку попадер спам-робот, то база спаммера пополниться 500 левыми и заведомо не работающими адресами. Кроме самих адресов на странице будет содержаться ссылки на мнимые страницы, которые робот ломанется скачивать, что в свою очередь будет каждый раз выдавать все новые и новые горы неработающих почтовых адресов (но такое зацикливание не вечно, а ограничено до 1000 страниц).

Чтобы на такие страницы не попали роботы поисковых машин, стоит META тег запрещающих индексирование. Это сделано потому, что, вероятно, спам-робот не обратит вниамние на META, а честный робот поисковика не будет индексировать генерируемый мусор.

Чтобы запустить эту программу, скачайте файл, переименуйте его в какое-нибудь безобидное название, типа userlist.php, и поставьте с главной страницы вашего сайта (или других мест) невидимую ссылку на эту программу. Примерно, поместите такой код:

<a href="имя_скрипта.php" style='text-decoration: none'><font color=white>.</font></a>

Особо скрывать ссылку не нужно, пользователи сайта все равно не будут по такой программе ползать - не интересно. Ссылочкой заинтересуются лишь роботы.
Программа очень простая. В начале генерит в среднем 5 ссылок для дальнейших заходов роботом, и ниже выдает в среднем 500 адресов email. Ссылки на саму себя программа выдает в зависимости от текущего дня. Т.е. если сегодня спам-робот выкачает все, то завтра ссылки станут уже другими и робот пойдет по новой. Всего, в течении дня, робот выкачает около 1000 страниц (500 000 адресов за раз).

Примите участие в коллективной атаке спаммерских баз email - разместите скрипт у себя на сайте!

Текст программы:

Код

<?

################################################################################
#
# fake_mail.php
#
# version 1.0, 2002-12-15
#
# (c) Dmitry Borodin, http://php.spb.ru/php/fake_mail.php
#
################################################################################

ini_set("display_errors",1);

// создать согласную
function s() {
  $word="qwrtypsdfghjklzxcvbnm";
  return $word[mt_rand(0,strlen($word)-1)];
}
// создать гласную
function g() {
  $word="euioam";
  return $word[mt_rand(0,strlen($word)-1)];
}

// разные последовательности гласных/согласных, которые дают человеко-подобные слова
function name0() {   return s().g().s();                        }
function name1() {   return s().g().s().g();                    }
function name2() {   return s().g().g().s();                    }
function name3() {   return s().s().g().s().g();                }
function name4() {   return g().s().g().s().g();                }
function name5() {   return g().g().s().g().s();                }
function name6() {   return g().s().s().g().s();                }
function name7() {   return s().g().g().s().g();                }
function name8() {   return s().g().s().g().g();                }
function name9() {   return s().g().s().g().s().g();            }

// эти "клевые" числа люди любят использовать в адресах email
$cool=array(1,2,5,10,99,100,111,666,1999,2000,2001,2002,2003);

// создать случайное слово
function randword() {
  global $cool;
  $func="name".mt_rand(0,9);
  $func2="name".mt_rand(0,9);
  switch (mt_rand(0,10)) {
     case 0: return $func().mt_rand(1,99);
     case 1: return $func()."-".$func2();
     case 2: return $func().$cool[mt_rand(0,count($cool)-1)];
     case 3:
     case 4: return randpass(mt_rand(3,12));
     default: return $func();
  }
}

// тоже, но заданной долины из совершенно случайных букв
function randpass($len) {
  $word="qwertyuiopasdfghjklzxcvbnm1234567890";
  $s="";
  for ($i=0; $i<$len; $i++) {
     $s.=$word[mt_rand(0,strlen($word)-1)];
  }
  return $s;
}

// в 33% случаях брать домен из этого списка (случайный домен)
$domain1=array("hotmail.com","microsoft.com","mail.com","imail.com","microsoft.ru");
$d1c=count($domain1);

// в 66% случаях генерить домено случайным образом
$domain2=explode(" ","gs ac af al dz as ad ao ai aq ag ar am aw au at az bs bh bd bb by be bz bj bm bt bo ba bw bv br io bn bg bf bi by kh cm ca cv ky cf td cl cn cx cc co km cg ck cr ci hr hr cu cy cs dk dj dm do tp ec eg sv gq ee et fk fk fo fj fi fr gf pf tf ga gm ge de de gh gi gr gl gd gp gu gt gn gw gy ht hm hn hk hu is in id ir iq ie il it jm jp jo kz ke ki kp kr kw kg la lv lb ls lr ly li lt lu mo mk mg mw my mv ml mt mh mq mr mu mx fm md mc mn ms ma mz mm na nr np nl an nt nc nz ni ne ng nu nf mp no om pk pw pa pg py pe ph pn pl pt pr qa re ro ru rw kn lc vc ws sm st sa sn sc sl sg si sb so za es lk sh pm sd sr sj sz se ch ch sy tw tj tz th tg tk to tt tn tr tm tc tv ug ua ae uk gb us um uy su uz vu va ve vn vi vg wf eh ye yu zr zm zw com edu net mil org gov kp kr la su sk cz");
$d2c=count($domain2);

// Пометка для роботов поисковых машин, что эту страницу нельзя индексировать
echo "<html><head><META NAME='robots' CONTENT='NONE'></head><body>\n\n";

// Имя текущего скрипта
$fn=getenv("SCRIPT_NAME");

// выдать 0-10 ссылок (примерно 5 за раз)
$cnt=mt_rand(0,10);
for ($i=0; $i<$cnt; $i++) {
  $rnd=randpass(mt_rand(1,3));
  $day=date("d_m");
  echo "<li><a href=$fn/$day/$rnd.html>Cool Link! Click here -- $rnd</a> \n";
}

echo "<P>\n\n\n";

// выдать 0-1000 email'ов (примерно 500 за раз)
$cnt=mt_rand(0,1000);
for ($i=0; $i<$cnt; $i++) {
  $u=randword();
  if (mt_rand(0,2)==0) $d=$domain1[mt_rand(0,$d1c-1)];
  else $d=randword().".".$domain2[mt_rand(0,$d2c-1)];
  echo " <a href=mailto:$u@$d>$u@$d</a> \n";
}


?>


Примеры запущенных скриптов:

http://vingrad.ru/display.php
http://php.spb.ru/php/fake_mail_demo.php
http://bot.net.ru/CnaMMePy.php
Я прекрасно понимаю, что программа весьма примитивна и можно написать лучше. Да, и спаммеры могут создавать защиту от явной накрутки их баз. Но, мне кажется, это будет очень эффективно в первое, достаточно длительное, время.


Источник: http://php.spb.ru/php/fake_mail.php


PM WWW   Вверх
MuToGeN
Дата 28.12.2002, 21:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Лесник
****


Профиль
Группа: Модератор
Сообщений: 4379
Регистрация: 15.8.2002
Где: Москва

Репутация: 7
Всего: 32



вещь конечно хорошая... только уж больно легко подредактировать исходник емаил-граббера, чтобы он игнорировал такие страницы. и еще - все адреса после сборки со страниц обычно провераются через shell на почтовых серверах. эта процедура займет больше времени, а останутся только реальные адреса. так что пользы от такой вещи на самом деле гораздо меньше, чем предполагается
Цитата
но такое зацикливание не вечно, а ограничено до 1000 страниц
обычно роботы глубже чем на 10-15 ступеней не спускаются




--------------------
Three pings for the token rings,
Five pings for the UNIX machines,
Hundred pings for the broken links,
One special ping to check them all
Through Simple Network Management Protocol!
PM MAIL ICQ   Вверх
NightGoblin
Дата 31.12.2002, 15:42 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Участник Клуба
Сообщений: 1021
Регистрация: 24.11.2002
Где: 127.0.0.1

Репутация: нет
Всего: 11



А вообще по-моему, проще всего настроить фильтр в мейлере, который будет письма с неизвестных адресов ИГНОРИРОВАТЬ, то есть не получать, а удалять прямо с сервера... проблем меньше будет :) Правда это только к клиентам относится, провайдеры как страдали, так и будут...

ЗЫ: например stuphead (клон sylpheed) так умеет :))


--------------------
Kernel panic: /dev/null overflow!
GCS/IT/MU/O d-@ s: a- C++$>++++$ ULSB(+++) P+++ L+++>++++ !E W++(-) N o? K w-- O? M>+ V? PS+ PE Y+ PGP+>+++ t- 5 X+ R- !tv b+ DI+ D+ G e++ h--- r++ y?
B4F1 54B6 8738 26CD 5125 0581 B923 9273 FE59 1981
PM MAIL WWW ICQ   Вверх
Misha
Дата 4.1.2003, 10:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 226
Регистрация: 2.4.2002
Где: Ульяновск

Репутация: нет
Всего: нет



Прикольно. Надо попробовать.
--------------------
Даешь интернет б....       гр. Ленинград
PM MAIL WWW   Вверх
jeka
Дата 4.1.2003, 14:04 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 41
Регистрация: 19.12.2002

Репутация: нет
Всего: нет



Тебе админ лижбо напакастить...
Но ты не думаешь какая от этого может быть польза и вред...
Я тебя теперь понял...
PM MAIL   Вверх
Wowa
Дата 5.1.2003, 08:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
Group Icon


Профиль
Группа: Админ
Сообщений: 15017
Регистрация: 14.9.2000
Где: Винград

Репутация: 1
Всего: 290



Цитата
Тебе админ лижбо напакастить...
Но ты не думаешь какая от этого может быть польза и вред...
Я тебя теперь понял...


Вред? Какой вред нормальным людям от этой технологии? А спамеров надо давить.
PM WWW   Вверх
Cepera
Дата 6.1.2003, 22:49 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


PHPexp
****


Профиль
Группа: Экс. модератор
Сообщений: 2146
Регистрация: 25.3.2002
Где: Russia, Samara

Репутация: 1
Всего: 7



imho смысла нет


--------------------
I know it is heavy for reading, but I know you will read it anyway...
PM MAIL WWW ICQ   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "PHP"
Aliance
IZ@TOP
skyboy
SamDark
MoLeX

Новичкам:

  • PHP редакторы собираются и обсуждаются здесь
  • Электронные книги по PHP, документацию можно найти здесь
  • Интерпретатор PHP, полную документацию можно скачать на PHP.NET

Важно:

  • Не брезгуйте пользоваться тегами [code=php]КОД[/code] для повышения читабельности текста/кода.
  • Перед созданием новой темы воспользуйтесь поиском и загляните в FAQ
  • Действия модераторов можно обсудить здесь

Внимание:

  • Темы "ищу скрипт", "подскажите скрипт" и т.п. будут переноситься в форум "Web-технологии"
  • Темы с именами: "Срочно", "помогите", "не знаю как делать" будут УДАЛЯТЬСЯ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PHP: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0922 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.