Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Поиск по дереву методом Монте-Карло, формула UCB 
:(
    Опции темы
serega721
Дата 15.7.2020, 11:47 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 68
Регистрация: 15.5.2010

Репутация: нет
Всего: нет



Добрый день.
Для поиска в дереве ходов использую модифицированную формулы UCB:
user posted image
Здесь wi это количество побед i-го узла. ni — количество посещений i-го узла, а n количество посещений всех соседних узлов. c это константа, используемая для установки нужного баланса между шириной и глубиной поиска. Чем она больше, тем более глубокий будет поиск.

Эта формула хорошо работает, когда награда в конце находится в диапазоне от 0 до 1. В моём же случае награда может достигать десятки, сотни, а то и тысячи очков, также в случае проигрыша, игрок теряет очки, соответственно подобрать одинаково С константу для всех случаев нереально. Можно было бы масштабировать максимально возможную оценку (сквошение в [0, 1] диапазоне), но к сожалению у меня нет возможности определить максимально возможный выигрыш для конкретного случая. Подскажите пожалуйста как правильно подобрать награду и С константу для моего случая?  Буду признателен за любые идеи к моей проблеме.
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.0970 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.