Модераторы: korob2001, ginnie
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> защита от граббинга, какие бывают и как обойти 
:(
    Опции темы
burakov
Дата 13.4.2011, 23:23 (ссылка)    | (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 554
Регистрация: 28.7.2006

Репутация: нет
Всего: нет



Добрый день, 

хочу спросить кто какие защиты от граббинга встречал и как их обойти

1. Защита, когда блокирует "жадно присосавшийся" грабер решается путем выставления задержки.
2. Если блокирует по IP используют ряд прокси серверов или купленный у провайдера некоторое количество IP
3. Бывает что меню на Jscript - тогда смотрят снифером (в принципе не страшно - меню большим не делают)
4. Бывает проверяют заголовки - понятно как их подделать
5. Недавно делал скачку файлов, там их защитили jscript, но выставили метки типа id=, проанализировав http заголовки - вычислил ссылки на реальные файлы (classon.ru).

и вот вопрос, 
а можно ли так навертеть Jscript, что вообще не сграбить ??? толи я чего не пойму?
вот пример, который прямо поставил меня в тупик.

http://999.md/Board/All.aspx?catId=659
получаю через get - В тексте только какие то Скрипты и все... никаких ID= ничего.
То есть через снифер (тампер дата) я вижу куда с этой страницы идет ссылка, но как ее найти на странице
http://999.md/Board/All.aspx?catId=659 или хотя бы как нибудь вычислить?

Или бывают такие вот защищенные сайты , что никак их не сграбишь?
как еще можно подойти?

причем в файрфоксе если нажать "исходный код" - то тоже одни джава скрипты, а если выделить фрагмент и нажать "исходный код выделенного фрагмента" - то все показывает нормально и текст виден и ссылки... В чем тут секрет?




--------------------
Нотный архив http://libnote.ru скачать ноты бесплатно
PM MAIL   Вверх
KSURi
Дата 14.4.2011, 13:00 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 887
Регистрация: 8.6.2006
Где: Russia

Репутация: 2
Всего: 27



Какое это отношение имеет к перлу?


--------------------
Died at Life.pl line 21
PM Jabber   Вверх
burakov
Дата 14.4.2011, 13:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 554
Регистрация: 28.7.2006

Репутация: нет
Всего: нет



я пишу на нем грабер smile


--------------------
Нотный архив http://libnote.ru скачать ноты бесплатно
PM MAIL   Вверх
Marlik
Дата 30.6.2011, 17:34 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 212
Регистрация: 25.2.2007
Где: Рязань

Репутация: нет
Всего: нет



Есть вариант старинный, сам не пробовал, да и нагрузка на отдачу будет большая. 

Решение: 

Отдавать все страницы сайта в виде картинок, создавать скриптом картинку и пихать туда страницы. Но еще надо будет туда их напихать без html тегов, вот где засада.
PM WWW Skype   Вверх
Technic
Дата 22.7.2011, 14:02 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 2
Регистрация: 22.7.2011

Репутация: нет
Всего: нет



Цитата

Отдавать все страницы сайта в виде картинок


И как поисковые системы все это будут индексировать?
PM MAIL WWW   Вверх
Marlik
Дата 22.7.2011, 20:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 212
Регистрация: 25.2.2007
Где: Рязань

Репутация: нет
Всего: нет



Вопрос пока стоит о защите данных. К примеру человек написал книгу и хочет выложить в сеть, что-бы эту книгу не скопипастили этот вариант вполне приемлем. Но этого мало, надо еще доработать этот вариант. 
PM WWW Skype   Вверх
Pilat66
Дата 9.8.2011, 08:29 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 37
Регистрация: 27.1.2009

Репутация: нет
Всего: 1



Цитата(Technic @ 22.7.2011,  14:02)
Цитата

Отдавать все страницы сайта в виде картинок


И как поисковые системы все это будут индексировать?

Очень просто. Текстовую часть отдавать в составе страницы, но тщательно перемешанную - например телефоны отдельно, фирмы отдельно, чтобы смысла грабить не было.
PM MAIL   Вверх
warlock000
Дата 25.8.2011, 08:28 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 43
Регистрация: 2.8.2011

Репутация: нет
Всего: нет



Как вариант сделать привязку к PHP сесии, или с помощью java как к примеру тут http://www.vestum.ru/items/2, также можно телефонный номер или другой, сделать картинкой, ну или кусочек текста, также можно сделать капчу при частом обращении к странице 
PM MAIL   Вверх
aleron
Дата 25.8.2011, 14:39 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 15
Регистрация: 24.8.2011

Репутация: нет
Всего: нет



>Отдавать все страницы сайта в виде картинок,
если очень надо - будут грабить картинки и распознавать их)
PM MAIL   Вверх
Marlik
Дата 26.8.2011, 06:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 212
Регистрация: 25.2.2007
Где: Рязань

Репутация: нет
Всего: нет



Цитата(aleron @ 25.8.2011,  14:39)
>Отдавать все страницы сайта в виде картинок,
если очень надо - будут грабить картинки и распознавать их)

Пробовал распознавать картинки?
PM WWW Skype   Вверх
warlock000
Дата 26.8.2011, 09:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 43
Регистрация: 2.8.2011

Репутация: нет
Всего: нет



Цитата(Marlik @  26.8.2011,  06:52 Найти цитируемый пост)
Пробовал распознавать картинки? 


Ничего в этом особо сложного нет, если там просто текст будет, на томже перле можно написать обработчик
PM MAIL   Вверх
infarch
Дата 26.8.2011, 10:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 526
Регистрация: 13.3.2009

Репутация: нет
Всего: 1



На самом деле защиты не существует - выкачать можно все. Владелец оценивает важность данных и тратится на сообразную защиту. Жулик прикидывает рентабельность обхода оной защиты. Вот и все что тут можно сказать.

К вопросу о защите: можно совместить защиту по ip с привязкой отдаваемых данных к ip. Например сложная древовидная структура данных может менять положение своих нод в зависимости от ip. Это в определенной степени защитит от использования прокси. Еще можно иногда делать закольцовку - дочерняя нода ссылается на родителя. Человек это воспримет как баг, обновит страницу и все. А автоматический парсер зависнет.

Это сообщение отредактировал(а) infarch - 26.8.2011, 10:27
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Perl: CGI программирование"
korob2001
sharq
  • В этом разделе обсуждаются вопросы относящиеся только к CGI программированию
  • Если ваш вопрос не относится к системному или CGI программированию, задавайте его в общем разделе
  • Если ваш вопрос относится к системному программированию, задавайте его здесь
  • Интерпретатор Perl можно скачать здесь ActiveState, O'REILLY, The source for Perl
  • Справочное руководство "Установка perl-модулей", качать здесь


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Perl: разработка для Web | Следующая тема »


 




[ Время генерации скрипта: 0.1179 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.