课程列表
简介
Q-learning
Sarsa
Deep Q Network
- 什么是 DQN
- DQN 算法更新 (Tensorflow)
- DQN 神经网络 (Tensorflow)
- DQN 思维决策 (Tensorflow)
- OpenAI gym 环境库
- Double DQN (Tensorflow)
- Prioritized Experience Replay (DQN) (Tensorflow)
- Dueling DQN (Tensorflow)
Policy Gradient
Actor Critic
- 什么是 Actor Critic
- Actor Critic (Tensorflow)
- 什么是 Deep Deterministic Policy Gradient (DDPG)
- Deep Deterministic Policy Gradient (DDPG) (Tensorflow)
- 什么是 Asynchronous Advantage Actor-Critic (A3C)
- Asynchronous Advantage Actor-Critic (A3C) (Tensorflow)
- Distributed Proximal Policy Optimization (DPPO) (Tensorflow)
课程介绍
强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验.