1ответов 6 OpenAI Gym: понимание обозначения «пространство действий»(пространства.Коробка) openai-gym reinforcement-learning
2ответов 14 Оптимальное значение epsilon (ϵ-greedy) machine-learning q-learning reinforcement-learning
3ответов 14 Каков способ понять алгоритм оптимизации проксимальной политики в RL? machine-learning reinforcement-learning
5ответов 17 Обобщение Q-обучение работе с непрерывным* действием * пространством algorithm language-agnostic machine-learning q-learning reinforcement-learning
5ответов 35 В чем разница между Q-learning и SARSA? artificial-intelligence q-learning reinforcement-learning sarsa