![]() |
Модераторы: korob2001, ginnie |
![]() ![]() ![]() |
|
Nab |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 582 Регистрация: 25.3.2006 Где: Kiev Репутация: 26 Всего: 37 |
MDM, если дело именно так обстоит, то думаю лучше всего обойтись внешним поисковиком... Тут в большей степени играет роль, какова структура вашей библиотеки. И она публична, то есть доступна из инета? Может сразу URL подкинете... По поводу теории, то надо не готовый искать, а скорее всего прийдется потрудиться и скомпилировать из разных статей, потому как поисковые системы сильно меняются, и каждый свою хвалит ![]() -------------------- Чтобы правильно задать вопрос нужно знать больше половины ответа... Perl Community FREESCO in Ukraine |
|||
|
||||
nitr |
|
|||
![]() Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 2543 Регистрация: 10.2.2006 Где: Россия :) Репутация: 37 Всего: 84 |
Nab, я знаю твою теорию по поисковикам
![]() ![]() ![]() Короче, гугль ![]() Это ж курсовик ;) |
|||
|
||||
Nab |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 582 Регистрация: 25.3.2006 Где: Kiev Репутация: 26 Всего: 37 |
Ха, в том то и дело, что уже не просто курсовик ![]() Под внешней системой я больше имел ввиду сервисы предоставляемые грандами типа Google но лучше Яндекс для поиска по конкретному сайту, и только по нему... Это самый простой и надежный способ, хотя и не очень эффективный... потому как они долго индексировать сайт ваш будут... А вообще опять же вариантов море, и лучше исходить из текущего состояния сырого материала, который нужно проиндексировать и упорядочить... -------------------- Чтобы правильно задать вопрос нужно знать больше половины ответа... Perl Community FREESCO in Ukraine |
|||
|
||||
MDM |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 16.3.2007 Где: г. Нальчик Репутация: нет Всего: 4 |
Теорию можно можно взять из других курсовиков! Но код я сам должен написать, или хотя бы суметь им обяснить его алгоритм, и разобрать каждый фрагмент кода.
http://ktims.kbsu.ru/ - на этом сайте я буду делать поисковик! Это сайт-болванка, его, можно сказать, собрали такие новички, как и я! Зато научились! Там видно кнопку поиск, вот её я и должен заставить работать! Мне ещё придется этот код на сервак самому поставить, поэтому я и спрашивал, как связать формы HTML и Perl... Nab, внешний поисковик отпадает, потому что кода не видно... В последствии этот поисковик будет модернизироваться... мне так сказали, но мне все-равно, лишь курсовик сдать! Хотя вполне возможно, что мне придётся его доделовать, я не против,... пока интерес есть!... Ещё один ньюанс: сервер слабый. Этот поисковик не должен его сильно нагружать... Хотя, думаю что с таким сайтом его сильно и не нагрузят... ![]() Это сообщение отредактировал(а) MDM - 26.3.2007, 15:09 |
|||
|
||||
Str!pe |
|
|||
профиль удален ![]() ![]() ![]() ![]() Профиль Группа: Участник Сообщений: 2426 Регистрация: 12.6.2005 Где: На земле. Репутация: нет Всего: 152 |
Так качни и привинти ее им ![]() ![]() -------------------- Со мной можно связаться по скайпу или по аське. Занимаюсь продвижением сайтов - самой таргетированной рекламой. |
|||
|
||||
MDM |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 16.3.2007 Где: г. Нальчик Репутация: нет Всего: 4 |
Спасибо Str!pe! Всем вам спасибо!
... Осталось только "привинтить"! Ещё один скриптик нашел в интернете http://www.codenet.ru/webmast/search/newbee/, только он вроде на PHP, зато теорию можно использовать... |
|||
|
||||
tishaishii |
|
|||
![]() Создатель ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1262 Регистрация: 14.2.2006 Где: Москва Репутация: 4 Всего: 8 |
![]() Ну БД mysql с полнотекстовыми индексами и баста! |
|||
|
||||
Str!pe |
|
|||
профиль удален ![]() ![]() ![]() ![]() Профиль Группа: Участник Сообщений: 2426 Регистрация: 12.6.2005 Где: На земле. Репутация: нет Всего: 152 |
MDM,
Лучше вместо спасибо, как напишешь, выложи в тему итоги работы ![]() ![]() Это сообщение отредактировал(а) Str!pe - 11.4.2007, 23:54 -------------------- Со мной можно связаться по скайпу или по аське. Занимаюсь продвижением сайтов - самой таргетированной рекламой. |
|||
|
||||
MDM |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 16.3.2007 Где: г. Нальчик Репутация: нет Всего: 4 |
Это само собой! Правда, не думаю, что там будет что-то путёвое... Но со временем, надеюсь, как научусь, доработаю.... |
|||
|
||||
GoDleSS |
|
||||
Шустрый ![]() Профиль Группа: Участник Сообщений: 105 Регистрация: 11.2.2007 Где: Пироговский Репутация: 2 Всего: 2 |
Эхх, народ, развели флуда, а по делу помогли мало
![]() Может накатаем что-либо простенькое человеку? Понимаю, что у всех дела и прочее, да и за "заказной" программинг обычно деньги платят... MDM, не уверен, что буду объснять сильно грамотно, т.к. хоть и есть несколько своих реализаций поисковиков не сложных, тем не менее похвастаться добротными механизмами не могу. И так для начала немного теории: Существуют поисковые системы внутрисайтовые, которые генерируют индексы(индекс - результат анализа текста, по готорому удаляется все лишнее и остается лишь то содержание, что минимально необходимо для грамотного поиска, это позвояет значительно ускорить обработку запросов) читая файлы вывода или данные из базы данных, которую использует сайт. Состоит, как правило, такой механизм из 2-х частей: 1. Анализатор файлов/данных БД, который состовляет индекс. 2. Непосредственно поисковик, ищущий совпадения запроса и содержания индекса. + подсистема вывода результатов(иногда бывают навороченные - с сортировками, с выделением найденного в тексте и т.д.) А так же интересны для вашей темы поисковые системы внешние, состоят из: 1. Системы, делающей внешний запрос документа, используя tcp подключение: 1.1 Подсистемы, вытягивающей из сурса страницы, урлы. Сохраняет их в БД. 1.2 Подсистемы, вытягивающей из сурса нужный текст. 1.3 Построитель индексов на основе текста. Сохраняет индексы в БД. 2. Непосредственно анализатора индексов(или поисковика). В грамотной реализации очень много всего написано, но тут уж лучше не меня слушать, а хорошую статью прочитать. В чем различия? 1. 1-й вариант ищет внутри, тогда как 2-й качает документы извне. 2. Вытекает из пункта один. Внешние индексеры собирают данные по многим ресурсам, тогда как внутренние по одному. *3. Внешние поисковые системы обычно много "мощнее"(функциональнее, "умнее" и т.д.) Хорош ли выбор языка perl для реализации? Да, выбор достойный. Давайте попробуем что-нибудь написать. Модель делаю упрощенной, т.к. ни изучать сейчас мануалы, ни долго думать времени нет. Для начала упрощенный внутренний поисковик по обычным HTML-ам. С кодировками и сложными комментариями разбираться не буду. Будем считать, что сложных комментов нет и работает все в cp1251. Пусть есть несколько HTML документов. Приводить примеры не стоит - открываем любой сурс и смотрим. Код формы запроса:
Код индексера:
Как-нибудь накидаю простой поисковик по индексу. --------------------
It's a nice day to die my friend! |
||||
|
|||||
MDM |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 16.3.2007 Где: г. Нальчик Репутация: нет Всего: 4 |
Ура!!! Наконец-то! Вот и есть код для разбора!
Я завтра-послезавтра постараюсь его заставить работать на моём локальном сайте, возникнут вопросы... Спасибо GoDleSS!!! Я скачал один из готовых бесплатных кодов с http://www.webscript.ru/scripts/Perl/Poisk/ ссылку на который дал мне дал Str!pe, но он мне подходит только тем, что делался специально под сервер Denwer, которым я пользуюсь, а вот 2 основных минуса: 1). Сложный для нашего сайта (релевантность, фильтрация поиска, слишком подробный вывод результатов, поиск в найденом и т. д.), все эти навороты на таком сайте будут выглядить смешно. Как может идти речь о релевантности, если, например, поиковик найдет по запросу 5-10 ссылок; 2). Человек который написал этот посковик не сможет отвечать на мои "глупые" вопросы. Уж очень большой, наверное, поток вопросов к нему от людей разбирающихся... А Вы мне сможете отвечать на мои "глупые" вопросы, даже?! ![]() Вот мой очередной "глупый" вопрос: Без баз данных можно обойтись?! Читал где-то писать поиковик не используя базы данных - {цитата} странное занятие. Ух как же я не люблю эти базы данных, замучился с этим FOXPro, ещё и SQL. Но если надо, так надо... что поделаешь... Информация о сайте:
GoDleSS
А то, что Вы здесь написали код не пойдёт??? Почему? |
|||
|
||||
GoDleSS |
|
|||
Шустрый ![]() Профиль Группа: Участник Сообщений: 105 Регистрация: 11.2.2007 Где: Пироговский Репутация: 2 Всего: 2 |
Это сборщик индекса, да и то по одной папке и не слишком "умный" - так для начального примера. Сам поисковик будет работать отталкиваясь от индекса. Это сообщение отредактировал(а) GoDleSS - 7.4.2007, 00:35 --------------------
It's a nice day to die my friend! |
|||
|
||||
MDM |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 16.3.2007 Где: г. Нальчик Репутация: нет Всего: 4 |
Главное чтобы работал, я же не умею его запускать на локалке, не говоря уже о том, как я его буду запускать на сервере. Попробую на нем научится...
Вчера делал первые попытки,... что-то делаю неправильно,... ошибка! Ну жить мне осталось мало... около 25-ти дней,... в мае защищать уже надо готовую работу... Вы форумчане моя последняя надежда... |
|||
|
||||
MDM |
|
||||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 16.3.2007 Где: г. Нальчик Репутация: нет Всего: 4 |
Вот как я пытаюсь заставить работать поисковик GoDleSS'а (безрезультатно):
Копирую несколько html-страниц в одну папку C:\WebServers\home\Site. В этих страничках я буду искать! Копирую HTML-код GoDleSS’а. В нем меняю action=”home/cgi-glob/search.pl”. Сам файл HTML-формы сохраняю в C:\WebServers search.pl создам в директории C:\WebServers\home\cgi-glob\search.pl ![]() Копирую код Perl GoDleSS’а в блокнот. В этом коде меняю:
на
Теперь жму поиск на форме. Результат – ErroR :( ![]() Как??? Этот файл находится же там… Наверное я допустил кучу ошибок, что одному человеку мне это все объяснить, равносильно тому, что переписать книгу. Разъясните хотя бы часть, или хотя бы дайте ссылку, где мне можно это прочитать… НЕПОНИМАЮ… |
||||
|
|||||
nitr |
|
|||
![]() Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 2543 Регистрация: 10.2.2006 Где: Россия :) Репутация: 37 Всего: 84 |
если верно (т.е. по стандартам и как указано на картинках) настроен сервер, то надо так:
action="/cgi-bin/search.pl" у тебя должен в конфиге Альяс стоять /cgi-bin/ на папку/home/cgi-glob , думаю у тебя так и есть... Добавлено через 28 секунд используются НЕлокальные пути в формах ![]() Добавлено через 4 минуты и 30 секунд настрой Виртуальный хост (если умеешь, обычно так проще ![]() |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Perl" | |
|
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Perl: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |