Модераторы: korob2001, ginnie

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> [Perl] Поисково-справочные системы 
:(
    Опции темы
MDM
Дата 18.3.2007, 22:14 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 264
Регистрация: 16.3.2007
Где: г. Нальчик

Репутация: нет
Всего: 4



Пишу курсовую "Поисково-Справочные системы".

Результатом курсовой должно стать: 
1) Использованная литература, примерно на 2 листах;
2) Преимущество одних языков программирования перед другими при создании поисковых систем;
3) Код исходной программы;
4) И т. д. ()

Литературу я бы и сам мог бы придумать, но думаю для начала надо ниписать работу... Просто, если не трудно, пишите авторов книг, которые "научили" вас тому, чему научите меня вы!

Облазил пол города в поисках нужной литературы, быстрым взглядом решил, что Perl для этих целей подходит больше всего. Купил "Программирование на Perl" (авт. Уолл, Кристиансен, Орвант). Я правильный сделал выбор? 

Впринципе не обязательно использовать имено Perl, просто желательно, потому что я к нему привык (хотя бы коды могу запускать!). Есть ещё книжка по ASP.Net (авт. Дино Эспозито), она может быть тоже пригодится. В ASP.Net я вообще 0, круглее чем он здесь получился!...

Программировать пока не умею, только учусь! Думаю что нашел себе нового учителя!!! Такой раздел с множетвом ответов на форуме, это уже о многом говорит!


Вопрос: Как написать поисково справочную систему по большому сайту. В чем отличаются посиково-справочные системы по сайту о поисково-справочных систем по интернету? Какое преимущество одних языков программирования перед другими при создании п-с сист.? Лучший ли мой выбор (Perl) для их создания, или надо программировать на (-?-) ???
Спасибо за поправку nitr!!!


Это сообщение отредактировал(а) MDM - 18.3.2007, 22:54
PM ICQ Skype   Вверх
nitr
Дата 18.3.2007, 22:20 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник Клуба
Сообщений: 2543
Регистрация: 10.2.2006
Где: Россия :)

Репутация: 37
Всего: 84



MDM, что-то неясно, а где вопрос ?? Вы правила читали? Это надо было в подфорум "Флейм" кидать...


--------------------
PM   Вверх
MDM
Дата 18.3.2007, 22:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 264
Регистрация: 16.3.2007
Где: г. Нальчик

Репутация: нет
Всего: 4



Вопрос такой: какими языками программирования лучше создавать поисковики.
Где можно посмотерть инфу на эту тему (ссылки), если кто знает.
Пример какого-нибудь кода на обсуждение...
Please!

Извените, что все так расплывчато...
PM ICQ Skype   Вверх
nitr
Дата 18.3.2007, 23:22 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник Клуба
Сообщений: 2543
Регистрация: 10.2.2006
Где: Россия :)

Репутация: 37
Всего: 84



MDM, изучай SEO


--------------------
PM   Вверх
MDM
Дата 19.3.2007, 00:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 264
Регистрация: 16.3.2007
Где: г. Нальчик

Репутация: нет
Всего: 4



В чем SEO лучше чем Perl?
Мне до мая надо курсовую здать! Успею я написать код на SEO если найду хорошую литературу, с нуля?
Где мне можно найти готовый код для поисковика? А на Perl есть где достать?

Это сообщение отредактировал(а) MDM - 19.3.2007, 00:13
PM ICQ Skype   Вверх
Nab
Дата 19.3.2007, 02:05 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 582
Регистрация: 25.3.2006
Где: Kiev

Репутация: 26
Всего: 37



Смешно smile
С таким объемом знаний курсовую врядли до мая....
SEO это (Serach Engine Optimization) и к делу в принципе отношения не имеет, а имеет к делу к примеру такой документ:
Сравнение свободных поисковых движков...
http://www.searchtools.com/analysis/free-s...comparison.html

Я весь документ не читал меня интересовала только таблица, но даже из нее видно что языками реализации являются как правило Си и Perl, или их смесь...

А перл подходит для этого очень хорошо, потому как в нем реализованы великолепные механизмы поиска по тексту, и вообще он для работы с текстом заточен...

Литературы по поисковикам вы врядли много найдете лучше пользоваться интернетом для этого...
И возможно вот это пригодиться
http://www.dataparksearch.org/


Это сообщение отредактировал(а) Nab - 21.3.2007, 12:42


--------------------
 Чтобы правильно задать вопрос нужно знать больше половины ответа...
Perl Community 
FREESCO in Ukraine 
PM MAIL   Вверх
nitr
Дата 19.3.2007, 11:42 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник Клуба
Сообщений: 2543
Регистрация: 10.2.2006
Где: Россия :)

Репутация: 37
Всего: 84



Nab, совсем не имеет? smile
ну ладно...

MDM, тебе точно не на эту ветку форума... Погугли...
Вот вроде неплохой ресурс http://www.searchengines.ru/ smile


--------------------
PM   Вверх
Nab
Дата 19.3.2007, 12:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 582
Регистрация: 25.3.2006
Где: Kiev

Репутация: 26
Всего: 37



Цитата(nitr @  19.3.2007,  11:42 Найти цитируемый пост)
Nab, совсем не имеет? smileну ладно...

smile 

Имеет конечно, но думаю не к тому как вопрос поставлен, а к теме курсовой вообще...

Просто оптимизация, это заточка сайтов под поисковые системы, а не сама поисковая система, хотя изучение и этого вопроса, позволит раскрыть тему "глубжее" и "ширее" smile


--------------------
 Чтобы правильно задать вопрос нужно знать больше половины ответа...
Perl Community 
FREESCO in Ukraine 
PM MAIL   Вверх
MDM
Дата 19.3.2007, 14:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 264
Регистрация: 16.3.2007
Где: г. Нальчик

Репутация: нет
Всего: 4



Nab
Цитата

Чтобы правильно задать вопрос нужно знать больше половины ответа...

- Точно! Вот в этом то и проблема! Ну я до того не знаю этот вопрос, что не могу задавать нормальные вопросы. Дело в том, что я учусь на микроэлектронике (физика), и в группе более менее лучше разбираюсь в компьютерах (работать с готовыми программами могу, а сам написать программу - наврядли). Вот и дали мне эту тему... Это какое-то недоразумение, я считаю,... но что поделаешь, шеф сказал - делай!
nitr,
http://www.searchengines.ru/ - Ресурс неплохой, но меня там не принимают, к вам перенаправили. Типа студентам тут помогают, а там мне делать нечего. Я смотрел там обсуждаемые вопросы, ничего подходящего не нашел. На том форуме zweruwka пишет дипломную на такую же тему как и у меня курсовая. Хотел с ним связаться, а там нет его контактной инф-ции,... пытался через админов, не помогают. Этот форум лучше, здесь хоть хотят помочь!
Nab
Спасибо за твои ссылки, думаю http://www.searchtools.com/analysis/free-s...comparison.html очень пригодится! http://www.dataparksearch.org/ ещё посмотрю!
Оптимизацию сайта я тоже буду рассматривать. Это тоже относиться к моей теме! В интернете этого добра к счастью хватает!... Но ваши ссылки я думаю не помешают тоже, если есть!

CPAN - никогда им не пользовался ещё, и не знаю как им пользоваться. Как можно попробывать там отыскать готовый пример поисковика?

Вопрос, связанный с интеграцией Perl в формах:

Код

<FORM ACTION="http://www.dima.ru/cgi-glob/try.pl" METHOD=GET NAME="TestForm">

    Город:
    <INPUT TYPE="text" name="lastname" SIZE="20" VALUE="City"><br>
    <INPUT TYPE="submit" VALUE="Искать!">
</FORM>


Код

#!/usr/bin/perl -w
    print "Content-Type: text/html\n\n";

if ($city eq "Moscow") {
    print "New York. \n";
}
elsif ($city eq "Nalchik") {
    print "Nalchik. \n";
}
elsif ($city eq "Kiev") {
    print "Kiev. \n";
}
else {
    print "Я не знаю города $city ! \n";
}


Как мне зделать так, что бы при написании в поле формы - город, скажем слова Kiev, у меня выводился результат Kiev, согласно кода Perl? 
Я попробывал просто сахранить файл Pl с этим кодом, а форма ссылается у меня на него 
Код

<FORM ACTION="http://www.dima.ru/cgi-glob/try.pl" METHOD=GET NAME="TestForm">

Результат всегда: "Я не знаю города !".
Спасибо!


PM ICQ Skype   Вверх
amg
Дата 19.3.2007, 16:50 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1145
Регистрация: 3.8.2006
Где: Новосибирск

Репутация: 38
Всего: 50



Цитата(MDM @ 19.3.2007,  14:23)
Код

if ($city eq "Moscow") {
    print "New York. \n";
}
elsif ($city eq "Nalchik") {
    print "Nalchik. \n";
}
elsif ($city eq "Kiev") {
    print "Kiev. \n";
}
else {
    print "Я не знаю города $city ! \n";
}

Что касается CGI, надеюсь, кто-нибудь поможет.
Я по поводу оптимизации этого кода. Удобнее сделать через хэш: 
Код

%cities = map {$_=>1} qw(Moscow Nalchik Kiev);
$cities{Moscow} = 'New York';
if (exists $cities{$city}) {
  print "$cities{$city}. \n";
else {
  print "Я не знаю города $city ! \n";
}


Это сообщение отредактировал(а) amg - 19.3.2007, 16:55
PM MAIL   Вверх
Nab
Дата 20.3.2007, 10:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 582
Регистрация: 25.3.2006
Где: Kiev

Репутация: 26
Всего: 37



MDM, тут этот вопрос не игнорируют просто потому, что редко какой проект обходиться без поиска по сайту. И эти вопросы интересуют многих, хотя и не в том разрезе что у Вас...

Достаточно простые сайты с линейной аргитектурой, которую могут проиндексировать внешние поисковики их и используют, яндекс, google или еще что... А когда к некоторым документам просто не доберешься напрямую, но при поисковой индексации они были указаны, то тут как правило используют свои поисковые машины. Не обязательно самописные, берут готовые...
Ну а если хочется иметь полный контроль и актуальность индексации то тут без своей локальной поисковой машины не обойтись, не зависимо от объема проекта... 

Я кстати, не особенно понимаю что имеется ввиду под понятием справочная... Подозреваю что тема курсовой была придумана достаточно взрослым человеком или осталась от старых курсов обучения в вашем вузе smile Потому как это раньше поиск по большим объемам информации можно было вести только с помощью катологизаторов(справочников) разного вида и отсортированных по разным признакам... Вспоминаем какой объем полезного места занимают каталоги с карточками в библиотеках.... Ну а произвольный поиск можно было вести только с помошью памяти библиотекаря smile Или тетеньки которая сидела в справочной городской... и днями перелистывала толстые справочники города...

Сейчас благодаря скорости анализа информации поиск производиться как правило по сырому тексту, и по полному объему, и нужда во внешних справочникак для этого отпала. Как правило каждый механизм поиска информации ведет свои справочники (индексы), проиндексированных данных. для более быстрого поиска. Ну и зачастую сами механизмы хранения информации, такие как базы данных хранят данные минимум в отсортированном виде, а иногда и проиндексированы по нескольктим ключам.

Хотя для человека, как и раньше, подача структурированой информации более пригодна... Поэтому и присутствуют на сайтах всякие вложенные меню, и т.д. 

Теперь о самих поисковых движках: 

Как правило они состоят минимум из двух независимых частей, индексатора и собственно поисковой машины, которая ищет уже по сформированному индексу(справочнику)... Индексатора может и не быть в чистом виде, его роль может выполнять само хранилище данных, где данные храняться в упорядоченном виде. То есть поиск вегда может производиться по сырым данным, как правило, это реализуют для простых линейных баз данных, где есть возможность использовать к примеру встроенный оператор сравнения LIKE. 

Для более сложных случаев сначала данные нужно проиндексировать, то есть запустить по ним индексатор и состаить индекс(справочник) для более быстрого доступа и поиска . Как правило он запускаеться редко на локальном сайте, к примеру после масоввого дополнения сайта данными, статьями или другой полезной информацией.

Для интерактивных сайтов, к примеру с объявлениями, с гостевыми, форумами, или если у сайта несколько авторов активно заполняющих его статьями, то тут индексацию нужно производить чаще, как правило по мере поступления информации..
Тут может использовать третья часть поисковой машины, вернее подчасть индексатора - это поисковые боты, роботы, пауки(spiders) разные названия есть. 

Это программы которые сами проходят по ссылкам и находят вновь появившиеся или изменившиеся документы и передают их на индексацию индексатору... Боты используются и внутри проектов и для для прохода по внешним ссылкам, но наибольшая их известность, это индексирование интернета... smile "Весь Интернет не закачаешь", но они стараются smile Они сами находят ссылки и добавляют их в свою очередь индексации, уровень интеллекта у них у всех разный, все зависит от назначения и требуемого результата...

Поискать на CPAN http://search.cpan.org/search?query=search&mode=all примеры некоторых реализаций, но учтите что там врядли вы найдете готовую к применению, всеже там больше представлены модули... И они предназначены для интеграции с вашими решениями, а не как самостоятельный продукт...

Знаю тут ребята делали простые реализации поисковиков на основе LIKE, мож кто поделиться простеньким скриптом... ну и поиск по форуму может сильно помочь...

--------------------------
Ну вот все сказанное это IMHO, так-что  кто думает иначе, пусть выскажется, и будет набросок к курсовой smile


--------------------
 Чтобы правильно задать вопрос нужно знать больше половины ответа...
Perl Community 
FREESCO in Ukraine 
PM MAIL   Вверх
tishaishii
Дата 20.3.2007, 15:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Создатель
***


Профиль
Группа: Завсегдатай
Сообщений: 1262
Регистрация: 14.2.2006
Где: Москва

Репутация: 4
Всего: 8



Для сайта я сделал павук, который загоняет заголовок, ключевые слова, описание (TITLE, META) текст страниц того сайта в mysql, полнотекстовые индексы. При неудачном поиске выдаются ссылки для поиска по похожим словам.
PM MAIL ICQ Skype   Вверх
MDM
Дата 23.3.2007, 01:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 264
Регистрация: 16.3.2007
Где: г. Нальчик

Репутация: нет
Всего: 4



Извините за паузу, у меня трафик закончился...

Nab, Вы как всегда в точку! Преподователи действительно достаточно пожилы. Мало того, они и сами не понимают, что от меня хотят. Такой случай я встречаю у нас в университете впервые. Моя тема вообще называется не "Поисково-Справочные системы", а "Поисково-Справочные системы на гипертекстах", но я не понимаю как это могут быть они на гипертекстах, поэтому гипертекст "откинул". Справочные - ещё как-то понять можно, но на гипертекстах, это мне совсем не под силу понять. Поиск можно организовать изпользуя гипертекст, но не как на самом гипертексте. Я же прав?!... Завтра у нас собеседование, я попробую этот вопрос выяснить...  smile Мне кажется, что им от меня только индекс и нужен, наверное чью-нибудь методичку надо будет оформить на сайте, с удобной навигацией.
В любом случае, этот вопрос я помечу как решенный! Т. е. доведу до конца! Мне уже это интересно!

amg, спасибо за оптимизацию, теперь буду иметь в виду, кто у нас здесь профи по оптимизации кода на Perl! Спасибо!
PM ICQ Skype   Вверх
tishaishii
Дата 23.3.2007, 22:34 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Создатель
***


Профиль
Группа: Завсегдатай
Сообщений: 1262
Регистрация: 14.2.2006
Где: Москва

Репутация: 4
Всего: 8



Ну раз такой у тебя плохой ЫУЗ, качни статью в инете где ни будь. Например, с яндека про их дела и будь спокоен за курсовую, переживай за себя.
PM MAIL ICQ Skype   Вверх
MDM
Дата 25.3.2007, 00:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 264
Регистрация: 16.3.2007
Где: г. Нальчик

Репутация: нет
Всего: 4



tishaishii, я не писал, что в нашем ВУЗе плохо обучают. Я даже подчеркнул, что такой случай у нас встречаю впервые. В нашем ВУЗе обучают очень даже не плохо. Программирование не моя специализация, и судя по всему не моего руководителя тоже! Моя специализация - инженер микроэлектронщик. Проблема в том, что преподователям нужная поисковая система на нашем сайте, но они не знают как её сделать, вот и придумали, дать кому-нибудь курсовую... Сайт очень простенький, один HTML.

Сегодня я обсудил этот вопрос со своим руководителем, обяснил ему, что название курсовой неправильно. Выяснил в чем состоит моя задача, поконкретней. Итого: моя тема теперь называется "Поисковые системы". Задача: мне нужно сделать поисковик, самый простой, для эл. библиотеки. Неважно, я сам его напишу, или воспользуюсь готовым кодом, главное результат. Поиск будет производится по содержанию книг, авторам, названиям... Ещё нужна теория, на страниц 30...

tishaishii, я пробовал искать готовую курсовую, или дипломную (ещё лучше), статьи какие-то на эту тему... не могу хорошего материала. Может быть я искать не умею, если Вы дадите мне какую-нибудь ссылочку, буду весьма признателен! А можно и на мыло скинуть, вообще хорошо!

Люди добрые! Если у кого есть готовые поисковики (желательно на Perl, но не обязательно), самые простые, PLEASE, скинте мне! Хорошо будет, если они будут с комментариями!...
PM ICQ Skype   Вверх
Страницы: (3) Все [1] 2 3 
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Perl"
korob2001
sharq
  • В этом разделе обсуждаются общие вопросы по языку Perl
  • Если ваш вопрос относится к системному программированию, задавайте его здесь
  • Если ваш вопрос относится к CGI программированию, задавайте его здесь
  • Интерпретатор Perl можно скачать здесь ActiveState, O'REILLY, The source for Perl
  • Справочное руководство "Установка perl-модулей", можно скачать здесь


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Perl: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.1288 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.