![]() |
|
![]() ![]() ![]() |
|
Fearless |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 2.9.2004 Где: Питер Репутация: нет Всего: 4 |
хотел вот такой шттукой поинтересоваться .... никогда раньше не делал поиск по сайту ... допустим есть 10 страничек чел вводит слово в edit нажимает баттон и его выбрасывает на те страницы где это слово встречается ... посоветуйте как это лучше сделать
|
|||
|
||||
Sardar |
|
|||
![]() Бегун ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 6986 Регистрация: 19.4.2002 Где: Нидерланды, Groni ngen Репутация: 4 Всего: 317 |
Можно:
1) зайти на www.google.com/apis/ , взять бесплатный ключь и юзать гугловую машину для поиска, оченьудобно. Достаешь еще софт(везде навалом) на PHP достающий результаты через SOAP. 2) зайти на www.hotscripts.net, находишь PHPDig и подобные поисковые движки, ставишь. 3) написать поиск самому -------------------- Опыт - сын ошибок трудных © А. С. Пушкин Процесс написания своего велосипеда повышает профессиональный уровень программиста. © Opik Оценить мои качества можно тут. |
|||
|
||||
Secandr |
|
|||
![]() Связист ![]() ![]() ![]() ![]() Профиль Группа: Экс. модератор Сообщений: 4043 Регистрация: 3.8.2003 Где: Russia, Volgograd Репутация: 2 Всего: 39 |
Fearless google - оптимальный вариант. ИМХО.
|
|||
|
||||
Fearless |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 264 Регистрация: 2.9.2004 Где: Питер Репутация: нет Всего: 4 |
забавно ... спасибо ... я тоже думал о google ... я просто думал чё нить сам написать и поэтому решил посоветоваться что просто лучше каждый файл парсить или просто сделать хеш ключевых слов ... а вы все на google послали меня
![]() |
|||
|
||||
Sardar |
|
|||
![]() Бегун ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 6986 Регистрация: 19.4.2002 Где: Нидерланды, Groni ngen Репутация: 4 Всего: 317 |
Смотря сколько поисковых запросов будет. Если мало, то полный перебор файлов не плох, естественно ручками создаем файл с приоритетами каждой страницы, дабы эффективней искать.
Если частый поиск то индексируем все страницы, создаем инвертированные файлы(слово -> встречается в...) Обновляем индекс регулярно, при поиске грузим и ищем. Способ очень быстрый с минимальными нагрузками на сервак, небольшая только когда индексируем страницы. Но писать не мало ![]() -------------------- Опыт - сын ошибок трудных © А. С. Пушкин Процесс написания своего велосипеда повышает профессиональный уровень программиста. © Opik Оценить мои качества можно тут. |
|||
|
||||
GoodBoy |
|
|||
![]() Главный джедай ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 3886 Регистрация: 8.1.2003 Где: КМВ Репутация: 1 Всего: 83 |
Как вариант:
Полностью динамический сайт, где всё его содержимое находится в БД. Тогда весь поиск сводится к селекту по нужным таблицам... |
|||
|
||||
skalex |
|
|||
![]() Хороший человек ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 895 Регистрация: 2.4.2004 Репутация: 1 Всего: 23 |
||||
|
||||
neverman |
|
|||
Unregistered |
А никто не подскажет какие существуют программы для индексирования инетрнета. Желательно что бы было расписание, по которому запускается индексирование сайтов.
|
|||
|
||||
Sardar |
|
|||
![]() Бегун ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 6986 Регистрация: 19.4.2002 Где: Нидерланды, Groni ngen Репутация: 4 Всего: 317 |
Для этого нужны большие(читай офигенные) машиные ресурсы. На простеньком сервере не сделаешь, и вообще зачем это тебе нужно? Гугл, яндекс, меил.ру же есть... ![]() -------------------- Опыт - сын ошибок трудных © А. С. Пушкин Процесс написания своего велосипеда повышает профессиональный уровень программиста. © Opik Оценить мои качества можно тут. |
|||
|
||||
fara |
|
||||
![]() Бывалый ![]() Профиль Группа: Участник Сообщений: 166 Регистрация: 15.3.2004 Где: С.-Петербург Репутация: нет Всего: 2 |
GoodBoy
то же но реализовано на файлах (т.е. обработка файлов)
Sardar можно поподробней описанную тобой технологию индексирования (по пункам вкратце, только принцип). Буду благодарен --------------------
Крыша хлопает в ладоши -Спасибо всем за план хороший! |
||||
|
|||||
Sardar |
|
|||
![]() Бегун ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 6986 Регистрация: 19.4.2002 Где: Нидерланды, Groni ngen Репутация: 4 Всего: 317 |
Ну если всерьёз хочешь подобное написать, то читай это: http://algolist.manual.ru/download.php?pat...ree.zip&pspdf=1 Там и про инверсные файлы и бинарные деревья есть + оценки производительнсти. Сама StringBTree на их фоне почти идеальна ![]() Тебе же нужно не индексировать всё содержимое, а только слова. Следовательно будешь хранить за место строк слова + суффиксы. Выдавать поиск будет пары: (слово, [указатели где слово встречается + позиция]). Затем по позиции определяешь чёткий, не чёткий поиск, суффиксы эффективно найдут слова в различных наколнениях. Указателем может быть что угодно, например на запись в отдельной БД, уже на простых Б деревьях+Patricia Tree, где описывается сайт, документ,. что угодно. Работы как видишь на мало ![]() -------------------- Опыт - сын ошибок трудных © А. С. Пушкин Процесс написания своего велосипеда повышает профессиональный уровень программиста. © Opik Оценить мои качества можно тут. |
|||
|
||||
fara |
|
|||
![]() Бывалый ![]() Профиль Группа: Участник Сообщений: 166 Регистрация: 15.3.2004 Где: С.-Петербург Репутация: нет Всего: 2 |
Sardar
Спасибо. Глаза боятся, руки делают ![]() --------------------
Крыша хлопает в ладоши -Спасибо всем за план хороший! |
|||
|
||||
Qangster |
|
|||
![]() Шустрый ![]() Профиль Группа: Участник Сообщений: 99 Регистрация: 25.12.2004 Где: Баку Репутация: нет Всего: 2 |
||||
|
||||
Qangster |
|
|||
![]() Шустрый ![]() Профиль Группа: Участник Сообщений: 99 Регистрация: 25.12.2004 Где: Баку Репутация: нет Всего: 2 |
Sardar ya skacal eto a potom cto delat
|
|||
|
||||
![]() ![]() ![]() |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Продвижение и оптимизация сайтов | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |