|
|
|
dEEp |
|
|||
Шустрый Профиль Группа: Участник Сообщений: 58 Регистрация: 9.5.2007 Репутация: нет Всего: нет |
Приветы
Я тут уже заработался и хочу спать, а потому не могу решить банальную задачу. Но мне очень хочется решить проблему сегодня, поэтому если не против, помогите логикой - голова уже не варит. У меня есть crawler, который достаёт из базы URL адрес до медицинской карточки, идёт собственно туда, делает что делает и на этом всё. И вот тут две тонкости: а) ресурс с картотекой должен принимать не более 1 запроса в 2 секунды. б) каждая карточка (запись в БД с URL и т.д.) имеет некий рейтинг: 1 и 2 Так воооттт... Crawler каждые 2 секунды шлёт 1 запрос. Берёт из БД запись и пошёл. Когда закончил - делает отметку, что счётчик проверки данной записи увеличился на 1. Что хочу сделать.. Мне хочется, чтобы те карточки, которые имели высший рейтинг - проверялись парсером чаще. Ну например чтобы за 10 секунд 3 раза проверились записи с рейтингом 1, а 2 раза чтобы с 2. Или как-то так. Штука ещё в том, что записей с рейтингом 1 около 100 штук, а записей с рейтингом 2 - около 1000. Я думал на тему того, чтобы запускать отдельный crawler для каждого рейтинга, но тогда сложно их синхронизировать. Т.е. чтобы учитывалось требование об одном запросе в две секунды. Есть у вас какие-то мысли? С радостью обдумаю все варианты, потому что сам уже что-то не але( Это сообщение отредактировал(а) dEEp - 29.8.2014, 17:26 |
|||
|
||||
ksnk |
|
|||
прохожий Профиль Группа: Комодератор Сообщений: 6855 Регистрация: 13.4.2007 Где: СПб Репутация: 7 Всего: 386 |
Отдельная таблица - очередь.
Выковыриваешь все записи с рейтингом 1 и с рейтингом 2. перебираешь записи с рейтингом 1 по кругу. выбрать 3 записи первого рейтинга и 2 второго, вставить все 5 в таблицу заданий, и так далее, пока не кончатся все задания 2 рейтинга. По исчерпании очереди - повторить. -------------------- Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! |
|||
|
||||
dEEp |
|
|||
Шустрый Профиль Группа: Участник Сообщений: 58 Регистрация: 9.5.2007 Репутация: нет Всего: нет |
Хмм... Согласен, как вариант использовать доп.таблицу. Если честно, то даже не рассматривал такой вариант. Тысяча записей не много, но тыркать их каждые 2 секунды не хотелось. Но да, если сделать таблицу с заданиями, то это вполне решает проблему.
Это сообщение отредактировал(а) dEEp - 30.8.2014, 08:24 |
|||
|
||||
Правила форума "Алгоритмы" | |
|
Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Алгоритмы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |