![]() |
Модераторы: skyboy, MoLeX, Aliance, ksnk |
![]() ![]() ![]() |
|
nepster |
|
||||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 300 Регистрация: 26.4.2009 Репутация: нет Всего: нет |
Решил попрактиковаться и написать собственный парсер. Собственно сделал половину работы, вот хочу услышать комментарии:
Итак пока задача простая, обойти все ссылки (пока что 1 страницы) и получить массив, где будет показаны все ссылки сайта со статусом.
Вызов:
Пока еще сыровато, но уже что то делает. Под сыровато подразумеваю работу с поддоменами, словарем ссылок и парсинга всех ссылок любой вложенности. Собственно следующий этап собрать ссылки всего сайта в массив. А далее можно будет увидеть например все битые ссылки на сайте. В общем интересует ваше мнение по коду Это сообщение отредактировал(а) nepster - 19.10.2013, 00:16 |
||||
|
|||||
Platon |
|
||||||||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1801 Регистрация: 25.4.2006 Репутация: нет Всего: 40 |
Раз нет никаких вопросов по существу, это развязывает руки.
Здесь должна быть фотка Микки Рурка из Железного Человека 2 *шутка*. Без чётко поставленного вопроса: "как лучше реализовать разбор Урла" или "какое регулярное выражение учтёт все случаи?" особо нечего рекомендовать. Единственное: определись со стилем кода. у тебя всё намешано.
не гоже программисту менять своё настроение. стиль должен быть один. Это сообщение отредактировал(а) Platon - 19.10.2013, 15:21 |
||||||||
|
|||||||||
nepster |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 300 Регистрация: 26.4.2009 Репутация: нет Всего: нет |
Вас понял сер, уже исправляю. Результат в скором времени выложу
|
|||
|
||||
Platon |
|
||||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1801 Регистрация: 25.4.2006 Репутация: нет Всего: 40 |
Лично я предпочитаю Java-стиль. да и многие проекты придерживаются его.
в основном это различия в написании классов, методов и переменных. Java-style
против C-style
Это сообщение отредактировал(а) Platon - 19.10.2013, 19:54 |
||||
|
|||||
Sanchezzz |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1670 Регистрация: 19.11.2006 Где: Voronezh Репутация: 41 Всего: 60 |
Есть специальные стандарты введения кода PSR 0, 1, 2, 3
-------------------- Понравился ответ "+" по репе, не забываем закрывать тему, заказы в LS. |
|||
|
||||
nepster |
|
||||||||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 300 Регистрация: 26.4.2009 Репутация: нет Всего: нет |
Sanchezzz, у Вас случайно нет хорошего отечественного источника, где можно почитать про PSR 0 ?
Если что то забыл, для удобства выкладываю все в архиве. Теперь мы умеем идти на сайт, собирать кол-во ссылок с сайта, считать изображения, обпередлять код страницы и все это записывать в файл. Снова жду ваших комментариев и продолжаю работать над обходом всего сайта Итак обновляем данне:
parse.php
patterns.php
statFile.php
Это сообщение отредактировал(а) nepster - 19.10.2013, 23:12 Присоединённый файл ( Кол-во скачиваний: 0 ) ![]() |
||||||||
|
|||||||||
Sanchezzz |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1670 Регистрация: 19.11.2006 Где: Voronezh Репутация: 41 Всего: 60 |
0 - это авто загрузка классов
1 и 2 - стиль ведения кода Из русского можно почитать на сайте зенда http://www.zendframework.com/manual/1.12/r...ding-style.html https://github.com/php-fig/fig-standards/tr...master/accepted -------------------- Понравился ответ "+" по репе, не забываем закрывать тему, заказы в LS. |
|||
|
||||
nepster |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 300 Регистрация: 26.4.2009 Репутация: нет Всего: нет |
Это вот этот вот магический метод !? Я это реализовал у себя вот таким вот простейшим способом! А что вы в общем можете сказать по коду ? |
|||
|
||||
Sanchezzz |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1670 Регистрация: 19.11.2006 Где: Voronezh Репутация: 41 Всего: 60 |
spl_autoload_register явно лучше задать чем функции с особым названием __autoload использовать. Причем авто-загрузчиков можно регистрировать несколько.
Например для расширения фреймворка приvер приведу laravel его систему пекеджей с фасадами. По коду: Половина функций названо с начальной большой буквы. Если вы и придерживаетесь JS/java именования функции то это нужно соблюдать. Первое слово в название функции должно писаться с нижнем регистре. Плохо
Хорошо public function actionIndex() { //... } [/code] Прочитайте полностью стандарт зенда. -------------------- Понравился ответ "+" по репе, не забываем закрывать тему, заказы в LS. |
|||
|
||||
nepster |
|
||||||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 300 Регистрация: 26.4.2009 Репутация: нет Всего: нет |
Собственно обновляю:
run.php
parse.php не влез на форум, приложил в архиве getLink.php
Собственно уже, что то да получается. Бот обходит весь сайт, вытавляет статус страницы и считает кол-во кратинок. можно указать уровень вложенности и тп. Однако еще есть несколько моментов, один из которых очень важный, не могу правильно составить полный URL страницы максимально корректно: Подскажите подалуйста как можно функцию обновить как следует, что бы она с любого url составляла полный адрес к ссылки
я заметил, что на 4 - 5 вложенности, появляются вот такие вот ссылки: http://nodejs.org/docs/v0.10.21/api/tls.html/all.html Присоединённый файл ( Кол-во скачиваний: 0 ) ![]() |
||||||
|
|||||||
nepster |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 300 Регистрация: 26.4.2009 Репутация: нет Всего: нет |
Назовем это версией 0.1
Очень жду Ваших комментариев Это сообщение отредактировал(а) nepster - 22.10.2013, 06:45 Присоединённый файл ( Кол-во скачиваний: 0 ) ![]() |
|||
|
||||
![]() ![]() ![]() |
Правила форума "PHP" | |
|
Новичкам:
Важно:
Внимание:
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | PHP: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |