|
|
|
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
Делаю рейтинг, меня сейчас больше волнует вопрос о содержательности статистики и размера хранимой информации.
Итак: 1) Данные хранятся в MySQL 1 Таблица: ip - В ней хранятся внутренний, внешний IP посетителя. ID ресурса и соответвенно дата. 2 Таблица: page - просмотренные страницы, в виде: id|page|count|day| count отображает сколько раз данная страница просматривалась 3 Таблица: Переходы (referers) в таком же виде 4 Таблица: Поисковые демоны, опять по такому же принципу 5 Таблица: Бразеры 6 Общая инфа по ресурсу (Обновляется только дата и показатели счетчика) Хочется сделать ещё инфу по ОС, Разрешениях и цветах (16 бит, 32 бит). Получить данную информацию труда не составит, а вот вопрос её хранения меня и интересует. Варианты выхода: 1) По аналогии ввести дополнительные таблицы для каждого вида настроек 2) Создать из нескольких таблиц(browser|os|ip|px|color) одну единую: visitor: browser|os|ip|px|color И в ней кучней хранить инфу по 1 посетителю. + Есть ли какие нибудь возможности по уменьшению "веса" хранимой информации? например сделать своеобразный архив, по прошедшим дням. Тем самым попытаться уменьшить объем хранимой информации. Приму любой критерий по организации данного "проекта". Так же пожелания. |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
У меня только одно замечание - зачем изобретать велосипед? Есть куча бесплатных и платных анализаторов которые все это прекрасно делают и красиво рисуют. Причем многие из них OpenSource и ты можешь их менять или писать дополнительный код, расширяющий их возможности.
-------------------- Account removed |
|||
|
||||
GoodBoy |
|
|||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Sun
Ну а если хочется человеку??? Нужно же учиться чему-то!!!! |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Тем более если учиться. Изучение чужих решений и исходников как ничто другое способствует обучению. -------------------- Account removed |
|||
|
||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
Sun
Не, мне больше нравится писать самому. Когда берешь чей то скрипт, не знаешь, какие сложности вставали на том или ином участке... Вообщем своё ближе. + Когда пишешь четко под свои нужны знаешь, что не будет ничего лишнего.... Это моя точка зрения. ИМХО ))) |
|||
|
||||
GoodBoy |
|
|||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Sun
Вот, целиком и полностью поддерживаю:
:-))))))))))))) |
|||
|
||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
имхо... ну может прет меня самому писать?
|
|||
|
||||
Sun |
|
||||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Каким образом ты собираешься получать внутренний IP?
Обычно сохраняют не запрошенные страницы, а запрошенныее файлы и уже отдельными запросами выделяют из них либо странички, либо файлы по расширению. -------------------- Account removed |
||||
|
|||||
Opik |
|
||||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
$_SERVER['HTTP_X_FORWARDED_FOR'] - если не ошибаюсь...
ну у меня он и считывает запрощенные "файлы"... gallery.p news.p и так далее, без QUERY_STRING |
||||
|
|||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Я просто думал что ты собираешься анализировать access_log, и по нему строить статистику, а ты хочешь через обращение к твоему скрипту через броузер. Но такой подход не совсем удобен, так как ты реально будешь фиксировать лишь обращения к скрипту, и если я запрошу обычный файл, не через твой скрипт, то ты этого не отловишь. Хотя если у тебы весь доступ к файлам организован через твой скрипт (как например во всяких системах управления контентом), то такой вариант наверно пойдет.
-------------------- Account removed |
|||
|
||||
GoodBoy |
|
||||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Sun
Обрати внимание та это:
|
||||
|
|||||
Sun |
|
||||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Ну и получишь рейтинг обращения к скрипту. Я об этом и говорю. -------------------- Account removed |
||||
|
|||||
GoodBoy |
|
|||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Не к скрипту, а к какой-то странице.... Точно так же как при использовании счетчиков типа Рамблер, СпайЛог, ХотЛог и т.д... |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Вот код вызова счетчика Рамблера с нашего форума
Здесь вызывается скрипт top100.cnt. Если я буду обращатся к странице, которая не содержит этот вызов, то этот скрипт об этом никогда не узнает. Но я не уверен что в скрипте при таком вызове будет доступна информация, которую хочет получать Opr. -------------------- Account removed |
|||
|
||||
GoodBoy |
|
||||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
При таком вызове - только часть из того, что он хочет!!! А вот вызов счётчика СпайЛог, и при нем можно получить даже больше!!! :-))))
|
||||
|
|||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
вызываю: <img src="http://.../top.php?xid=1"> top.php: IP: - $_SERVER['remote_addr']; Браузер, ОС: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) Это средставми PHP. + Что мешает сделать так: <script> d=document;a='';a+=';r='+escape(d.referrer) a+=';j='+navigator.javaEnabled() s=screen;a+=';s='+s.width+'*'+s.height a+=';d='+(s.colorDepth?s.colorDepth:s.pixelDepth) document.write('<img src="http://.../top.php?xid=1&a='+a+'">'); </script> |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Здесь разные подходы. Могу сказать какой минус у вашего. Ваш подход требует вызова приведеного вами кода в каждой странице, по которой мы хотим собирать статистику. Информация о клиенте частично собирается через JavaScript на клиенте и передается в виде параметров. При отключеном JavaScript эта информация будет недоступна.
Я бы, все-таки анализировал лог файл, парсил его и вытягивал нужную информацию. Тогда статистика получится более точная. -------------------- Account removed |
|||
|
||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
Sun
Мне статистика нужна не только моего сайта. Тема ведь называется: Рейтинг визитов (сайтов) |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Тогда однозначно надо делать анализ логов. Иначе ты никак не узнаешь кто к каким сайтам доступался. -------------------- Account removed |
|||
|
||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
И как ты мне предлагаешь организовывать доступ к логам не своих серверов?
Добавлено @ 15:58 Вопрос был поставлен не как получать инфу, а как её хранить, вернемся к теме? |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Очень просто. Ты в любом случае размещаешь свою программу на сервере клиента. Тебе нужно лишь указать ей местонахождение лог файла на сервере. При этом ты не связываешь руки владельцу сайта, требуя от него вставлять в каждую страничку вызов твоего скрипта. Насчет хранения данных, то думаю такая структура которую ты предложил вполне нормальная. -------------------- Account removed |
|||
|
||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
1 или 2? Т.е для каждого куска инфы своя таблица, или всё в одну по 1 посетителю? в смысле: id|ip|localip|browser|os|...etc... Добавлено @ 16:18 Моя программа - скрипт как картинка, мой сервак http://bk.balthost.ee/school к примеру,.. получи что нить из лог-файла...? ты мне ставишь аналогичную задачу... |
|||
|
||||
GoodBoy |
|
|||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Здрасьте, с какого это перепуга???? Что, те же самыё Рамблер или СпайЛог что-нибудь размещают на тех серверах, где стоят их счетчики????? Что-то ты не то говоришь... |
|||
|
||||
Sun |
|
||||||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Рамблер и СпайЛог - нет. Системы сбора вэб-статистики - да.
Посетители могут зайти с одной IP, с разных броузеров и разных ОС. Соответственно должна быть таблица со списком броузеров, со списком ОС и эти таблицы должны быть связаны с таблицей посещений, в которой будет время, IP, ОС ID, броузер ID. -------------------- Account removed |
||||||
|
|||||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
os: win98 win2000 winXP etc... browser: MSIE Opera etc... visitor: ip|localip|day|browser|os и заполняю, допустим: ***.***.***.***|***.***.***.***|10.24.2004|3|1 Если я зашёл сначала под IE, потом под Operой, ид то не устраивает... или я что то не так понял? |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
-------------------- Account removed |
|||
|
||||
GoodBoy |
|
||||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Опять возвращаемся к самому началу:
Добавлено @ 17:07 Тот же СпайЛог позволяет узнать статистику и по браузерам и по ОС и по разрешению экрана и по чёрти чему ещё!!!!! |
||||
|
|||||
Sun |
|
||||||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
GoodBoy, я просто предложил для определения рейтинга использовать анализ лога. Этот подход ничем не хуже, а может и лучше чем используют Рамблер или СпайЛог. Не знаю чем вызвано твое возмущение. -------------------- Account removed |
||||||
|
|||||||
Opik |
|
|||
Эксперт Профиль Группа: Vingrad developer Сообщений: 1918 Регистрация: 6.10.2004 Где: Рига Репутация: нет Всего: 55 |
Sun
Вот что я хотел услышать ) спасибо... |
|||
|
||||
GoodBoy |
|
||||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Это не возмущение! :-))))
Да, но он тербует размещения скрипта на КАЖДОМ рейтингуемом сайте!!!! И тогда у администратора системы либо нет вообще возможности узнавать какую-то общую статистику по работе системы в целом, либо нужно писать ещё какой-то общий скрипт, который будет забирать инфу у ВСЕХ скриптов статистики, находящихся на сайтах клиентов и обрабатывать и складывать её в общую базу данных... |
||||
|
|||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
GoodBoy, а кто говорил что будет просто Кстати говоря такие системы есть. Они могут собирать логи через ftp/http или другой какой удобный транспортный протокол с любого узла Internet.
-------------------- Account removed |
|||
|
||||
GoodBoy |
|
|||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Дай-ка мне ссылочку на такую систему??? 1. Для ftp доступа нужен логин/пароль, и такие вещи всем подряд не раздаются!!! 2. Через http на НОРМАЛЬНОМ сервере access.log НИКОГДА не доступен!!! Вывод: система, которая собирает статистику с ЛЮБОГО узла Internet существовать не может!!! |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Одна из них: http://www.urchin.com/
Для доступа к логам через ftp или http используется авторизация через логин/пароль -------------------- Account removed |
|||
|
||||
GoodBoy |
|
|||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Sun
Но опять же именно ИСПОЛЬЗУЯ АВТОРИЗАЦИЮ... :-)))))) Т. е. собирать логи с ЛЮБОГО узла они не могут... |
|||
|
||||
Sun |
|
|||
Account removed Профиль Группа: Экс. модератор Сообщений: 1611 Регистрация: 14.8.2002 Репутация: 2 Всего: 48 |
Рамблер и SpyLog тоже не может, пока ты не вставишь вызов ихнего скрипта в свою страницу. Это все вопросы доверия. Людям свойственно доверять другим людям, тем более что нанести вред владельцу сайта здесь достаточно проблематично. -------------------- Account removed |
|||
|
||||
GoodBoy |
|
|||
Главный джедай Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Ну, извини меня, это совершенно разные вещи!!!! Одно дело вставить себе на страницу вызов картинки с другого сайта, и совершенно другое дело давать кому-то свои ФТПшные логин и пароль... Безопасность тут ЯВНО хромает..... |
|||
|
||||
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Администрирование Web серверов и Web служб | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |