pytorch实现强化学习算法

pytorch实现强化学习算法

这段时间一直在看莫凡python关于强化学习的教程,因为教程都是tensorflow写的,tensorflow用的少,所以用pytorch替换了其中的网络部分

莫凡的教程结合了代码、图示讲解,比较通俗一些,不过没有讲特别细致,建议结合李宏毅教授的课程。

强化学习 Reinforcement Learning (莫烦 Python 教程)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili​www.bilibili.compytorch实现强化学习算法_第1张图片李宏毅深度强化学习(国语)课程(2018)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili​www.bilibili.compytorch实现强化学习算法_第2张图片

主要是模型的替换,其余代码不变。训练仿真环境用的是gym里的例子。

包括:

  1. DQN

https://github.com/belowthetree/ReinforceLearning/tree/master/DQLearing​github.com

 

 

  1. PolicyGradient

https://github.com/belowthetree/ReinforceLearning/tree/master/PolicyGradient​github.com

 

pytorch实现强化学习算法_第3张图片

你可能感兴趣的:(深度学习,pytorch,人工智能)