强化学习入门资料整理

先整理一些参考资料,后面再补充具体内容。

参考资料
[1] 强化学习基本概念
[2] 怎么理解强化学习中状态价值和动作价值?
[3] 强化学习丨时序差分算法TD(0)及相关编程仿真
[4] 强化学习——Q-Learning算法原理
[5] 强化学习 – 深度Q网络(DQN)
[6] 强化学习(五)用时序差分法(TD)求解

你可能感兴趣的:(机器学习)