reinforcement-learning

1
ответов

6

OpenAI Gym: понимание обозначения «пространство действий»(пространства.Коробка)

openai-gym reinforcement-learning

2
ответов

14

Оптимальное значение epsilon (ϵ-greedy)

machine-learning q-learning reinforcement-learning

3
ответов

14

Каков способ понять алгоритм оптимизации проксимальной политики в RL?

machine-learning reinforcement-learning

5
ответов

17

Обобщение Q-обучение работе с непрерывным* действием * пространством

algorithm language-agnostic machine-learning q-learning reinforcement-learning

5
ответов

35

В чем разница между Q-learning и SARSA?

artificial-intelligence q-learning reinforcement-learning sarsa