2ответов 14 Оптимальное значение epsilon (ϵ-greedy) machine-learning q-learning reinforcement-learning
5ответов 17 Обобщение Q-обучение работе с непрерывным* действием * пространством algorithm language-agnostic machine-learning q-learning reinforcement-learning
5ответов 35 В чем разница между Q-learning и SARSA? artificial-intelligence q-learning reinforcement-learning sarsa