Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Запустался. Не могу разобраться с пауком. 
V
    Опции темы
dEEp
  Дата 29.8.2014, 17:25 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 58
Регистрация: 9.5.2007

Репутация: нет
Всего: нет



Приветы

Я тут уже заработался и хочу спать, а потому не могу решить банальную задачу. Но мне очень хочется решить проблему сегодня, поэтому если не против, помогите логикой - голова уже не варит.

У меня есть crawler, который достаёт из базы URL адрес до медицинской карточки, идёт собственно туда, делает что делает и на этом всё. И вот тут две тонкости:
а) ресурс с картотекой должен принимать не более 1 запроса в 2 секунды.
б) каждая карточка (запись в БД с URL и т.д.) имеет некий рейтинг: 1 и 2

Так воооттт... Crawler каждые 2 секунды шлёт 1 запрос. Берёт из БД запись и пошёл. Когда закончил - делает отметку, что счётчик проверки данной записи увеличился на 1. 

Что хочу сделать.. Мне хочется, чтобы те карточки, которые имели высший рейтинг - проверялись парсером чаще. Ну например чтобы за 10 секунд 3 раза проверились записи с рейтингом 1, а 2 раза чтобы с 2. Или как-то так.

Штука ещё в том, что записей с рейтингом 1 около 100 штук, а записей с рейтингом 2 - около 1000. 


Я думал на тему того, чтобы запускать отдельный crawler для каждого рейтинга, но тогда сложно их синхронизировать. Т.е. чтобы учитывалось требование об одном запросе в две секунды. 

Есть у вас какие-то мысли? С радостью обдумаю все варианты, потому что сам уже что-то не але(


Это сообщение отредактировал(а) dEEp - 29.8.2014, 17:26
PM MAIL   Вверх
ksnk
Дата 29.8.2014, 19:27 (ссылка) |    (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


прохожий
****


Профиль
Группа: Комодератор
Сообщений: 6855
Регистрация: 13.4.2007
Где: СПб

Репутация: 7
Всего: 386



Отдельная таблица - очередь.
Выковыриваешь все записи с рейтингом 1 и с рейтингом 2.
перебираешь записи с рейтингом 1 по кругу. выбрать 3 записи первого рейтинга и 2 второго, вставить все 5 в таблицу заданий, и так далее, пока не кончатся все задания 2 рейтинга. По исчерпании очереди - повторить.


--------------------
Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! user posted image
PM MAIL WWW Skype   Вверх
dEEp
Дата 29.8.2014, 19:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 58
Регистрация: 9.5.2007

Репутация: нет
Всего: нет



Хмм... Согласен, как вариант использовать доп.таблицу. Если честно, то даже не рассматривал такой вариант. Тысяча записей не много, но тыркать их каждые 2 секунды не хотелось. Но да, если сделать таблицу с заданиями, то это вполне решает проблему.

Это сообщение отредактировал(а) dEEp - 30.8.2014, 08:24
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.1053 ]   [ Использовано запросов: 20 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.