Модераторы: skyboy, MoLeX, Aliance, ksnk
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Не получается сделать сканирование сайта 
:(
    Опции темы
TilSeier
Дата 4.4.2016, 16:05 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 8
Регистрация: 21.3.2016

Репутация: нет
Всего: нет



Всем привет
Есть такая задача не понимаю как ее сделать
Нужно написать скрипт, который может просканировать любой сайт на наличие папок. Например, если я напишу http://forum.vingrad.ru/ мне должно выдать результат примерно такой:
Код

http://forum.vingrad.ru/image
http://forum.vingrad.ru/css
http://forum.vingrad.ru/js
и т.д.
или
такой 
image
css
js
и т.д.


То есть скрипт должен сканировать другие сервера.
Например, я ввел site.com мне должно показать какиие у них есть папки и также поддомены.
файлы не нужны.

В интернете нашел функцию scandir () но вряд ли это то, что нужно.
Помогите мне пожалуйста. Как это можно реализовать?


Это сообщение отредактировал(а) TilSeier - 4.4.2016, 16:16
PM MAIL   Вверх
ksnk
Дата 4.4.2016, 18:25 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


прохожий
****


Профиль
Группа: Комодератор
Сообщений: 6855
Регистрация: 13.4.2007
Где: СПб

Репутация: 96
Всего: 386



Цитата(TilSeier @  4.4.2016,  16:05 Найти цитируемый пост)
Есть такая задача не понимаю как ее сделать

Нужно ответить себе на вопросы.
Кто ее поставил? Зачем ее поставили, с какой целью?

После ответа, почитать в гугле про `web spider`, `Web crawler`и убедится, что задача совсем не так проста.


--------------------
Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! user posted image
PM MAIL WWW Skype   Вверх
cia
Дата 7.4.2016, 15:02 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 207
Регистрация: 15.1.2007

Репутация: 4
Всего: 4



Если ответить кратко: никак.
"/images/", "/css/", "/js/" - это не папки, а части URL. И на самом деле на сервере они могут быть расположены совсем в другом месте или даже вообще все ссылаться на один скрипт, который генерирует запрошенный контент.
Из веба нет возможнсоти однозначно утвердить, что тот или иной адрес соответствует директорию на сервере.

Что делать? Загружать главную страницу сайта и собирать все ссылки из исходного HTML. Затем переходить пр этим ссылкам и собирать ссылки с этих страниц. Когда остановиться - это решать вам. Далее анализировать собранные адреса. К примеру, если есть куча css-файлов, расположеных в каком-то директории css, то скорее всего на сервере действительно такой директорий существует.
PM WWW ICQ   Вверх
TilSeier
Дата 7.4.2016, 16:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 8
Регистрация: 21.3.2016

Репутация: нет
Всего: нет



В любом всем спасибо за то, что помогли мне разобраться с этим
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "PHP"
Aliance
IZ@TOP
skyboy
SamDark
MoLeX

Новичкам:

  • PHP редакторы собираются и обсуждаются здесь
  • Электронные книги по PHP, документацию можно найти здесь
  • Интерпретатор PHP, полную документацию можно скачать на PHP.NET

Важно:

  • Не брезгуйте пользоваться тегами [code=php]КОД[/code] для повышения читабельности текста/кода.
  • Перед созданием новой темы воспользуйтесь поиском и загляните в FAQ
  • Действия модераторов можно обсудить здесь

Внимание:

  • Темы "ищу скрипт", "подскажите скрипт" и т.п. будут переноситься в форум "Web-технологии"
  • Темы с именами: "Срочно", "помогите", "не знаю как делать" будут УДАЛЯТЬСЯ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PHP: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0570 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.