![]() |
|
![]() ![]() ![]() |
|
Mal Hack |
|
||||||||||||
![]() Мудрый... ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 9926 Регистрация: 15.2.2004 Репутация: 15 Всего: 261 |
Данный модуль веб-сервера Apache предназначен для преобразования исходных URL'ов. Его возможности - колоссальны, но зачастую он используется для создания ЧПУ (Человеко Понятный УРЛ). Что это значит. Вместо http://example.com/index.phtml?year=2005&a...&news=theme использовать http://example.com/2005/12/31/theme.html. Такой механизм очень часто применяется на новостных сайтах. В тоже время это плюс для безопасности. Пользователи не видят, к какому файлу (скрипту) реально идет обращение.
Ниже рассмотрим несколько вопросов: 1. Как включить mod_rewrite на Apache? 2. Немножко теории. Как работает mod_rewrite. 3. Простой пример. 4. Что надо сделать в скрипте? 5. Что дает данный подход и mod_rewrite в целом? 6. Возможные ошибки. 7. Альма-Матер дл изучения mod_rewrite 1. Как включить mod_rewrite на Apache? Для включения mod_rewrite на веб-сервере Apache необходимо отредактировать файл httpd.conf. Для этого открываем файл httpd.conf, ищем строчку:
И убираем комментарий
После чего перезапускаем веб-сервер. 2. Немножко теории. Как работает mod_rewrite. Как правило, только что столкнувшиеся с mod_rewrite, программисты не понимают до конца как работает данный механизм. Из-за этого долгое время ломают голову над «детскими ошибами. Итак. Как мы знаем есть, так называемый GET запрос, т.е. http://example.com/2005/12/31/theme.html, который «приходит» на веб-сервер (в нашем примере - Apache). Что делает сервер. Первым делом он смотрит настройки данного хоста. После чего уже принимает решение, что делать дальше. Либо отправить пользователю обратно содержимое заглавной страницы (index.html, к примеру) или отправить на интерпретацию код заглавного скрипта index.php или вернуть ошибку 404 и т.д. и т.п.. Предположим, что у нас дальше пойдет работа с index.phtml. Что будет дальше вы уже наверняка знаете. Мы же остановимся на том моменте, когда сервер смотрит настройки хоста. Их может быть большое множество. Но в обязательном порядке сервер пытается найти в корне файл .htaccess. (файл конфигурации Apache «на лету»). Вот именно в этом файле находятся правила преобразования mod_rewrite (они могут находиться и в httpd.conf). Т.е. я все веду к тому, что преобразование URL’ов ведется ДО работы скриптов. Алгоритм следующий: 1. Сервер получает GET запрос: http://example.com/2005/12/31/theme.html 2. Находит в .htaccess правила преобразования mod_rewrite. 3. Преобразовывает. 4. Перенаправляет на index.phtml согласно правилам преобразования. 5. Скрипт начинает работать. 3. Простой пример. Многие из вас видели такую вещь: http://example.com/2005/12/31/theme.html . Такие адреса часто используют новостные сайты. Естественно у них нет всех этих папок и html файлов. Все данные обрабатывает скрипт. Ниже мы рассмотрим один из вариантов такого преобразования. Скажу сразу. Вариантов уйма я лишь беру один частный случай, которым сам пользуюсь и считаю его наиболее универсальным.
Рассмотрим все по порядку. Два подряд RewriteCond это условия, между которыми стоит И. Т.е. Если запрашиваемый адрес не является реально существующим файлом или каталогом перекидываем на index.phtml. Т.е. таким образом мы реализовали то, что у нас запросы http://example.com/2005/12/31/theme.html будут обрабатываться скриптом index.phtml. Теперь весь вопрос, как нам узнать в скрипте что пользователь запрашивает /2005/12/31/theme.html. Тут лирическое отклонение. Несколько слов о RewrtiterRule. Директива рассматривает параметра. Первый (в нашем случае: ^(.*)$) – строка регулярного выражения, которая проверяет, удовлетворяет ли запрашиваемый адрес (в нашем случае: /2005/12/31/theme.html) паттерну (в нашем случае да, т.к. паттерн гласит: «любой символ 0 и более раз» от начала и до конца строки - ^(.*)$). В случае удовлетворения паттерну, mod_rewrite перенаправляет запрос на файл, указанный во втором параметре (в нашем случае: index.phtml). Теперь весь вопрос в том, как скрипт узнает о «/2005/12/31/theme.html». Есть два варианта. Первый:
Есть переменная сервера (к которым скрипты имеют доступ) REQUEST_URI в котором всегда содержится GET запрос («/2005/12/31/theme.html»). Итак, если мы перенаправляем на index.phtml, то REQUEST_URI должен получить значение index.phtml, НО ключ QSA заменяет его НА «/2005/12/31/theme.html». Т.е. мы физически перенаправляем на index.phtml, а логически показываем скрипту, что пользователь обращался к «/2005/12/31/theme.html». 4. Делаем скрипт Теперь мы уже работаем с index.phtml, скриптом, на который мы произвели перенаправление. Говорю сразу, код на PHP, т.к. другими языками под веб владею плохо.
Вот так все просто. Теперь вы можете оперировать с данным массивом. Дабы было еще понятнее. Приведу аналогию. Предположим такой адрес: http://example.com/index.phtml?year=2005&a...&news=theme. Как мы знаем, что в скрипте данные параметры будут доступны через массив $_GET. так вот, $_GET[‘year’] то же, что и $arr[1], $_GET[‘month’] то же, что и $arr[2], $_GET[‘day’] то же, что и $arr[3], $_GET[‘theme’] то же, что и $arr[4] (только надо будет еще отрезать «.html»). 5. Что дает данный подход и mod_rewrite в целом? Во-первых для поисковых систем намного приятнее URL вида: http://example.com/?/2005/12/31/theme.html, нежели http://example.com/index.phtml?year=2005&a...&news=theme, да и для пользователей, согласитесь тоже. Второй момент. При mod_rewrite практически на «нет» сводится возможность XSS нападения, т.к. include-баг практически перекрывается. На данном примере это не так видно, но поверьте на слово, это так. НО в любом случае все зависит от вашей головы !!! Третий момент, это скрытие реально используемой технологии. отчасти это усложняет взлом сайта, но это лишь верхняя граница, как тина на застоявшемся пруду. 6. Возможные ошибки Как правило могут возникнуть следующие ошибки: 404 – документ не найден. Причина: правила RewriteRule не срабатывают. 403 – Forbidden – доступ запрещен. Правила реврайта содержат логическую ошибку, которая возникает из-за попытки редиректа на файл, куда нет доступа (/index.php – выдаст именно это, т.к. / в UNIX системах означает путь от корневого каталога СЕРВЕРА, куда само собой у вас доступа не будет). 500 – Internal Server Error. Причина в синтаксической ошибке в файле .htaccess. 7. Альма-Матер дл изучения mod_rewrite Лично мне эта статья очень помогла. Вот ее аннотация, а ниже я прикрепляю ZIP файл. В нем - эта статья в RTF формате,
http://forum.vingrad.ru/index.php?act=modu...&attachid=1 |
||||||||||||
|
|||||||||||||
![]() ![]() ![]() |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Администрирование Web серверов и Web служб | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |