深度强化学习研究笔记(2)——Q-learning(Q-learning问题描述,Q-table方法,一个Python小例子)
文章目录1.Q-learning问题描述2.Q-learning的一种典型实现方法及示例(Q-table查表法)3.利用Q-learning得到的Q-table进行验证(让agent独立行走)4.代码实现(Python2和Python3均支持)5.小结1.Q-learning问题描述Q-learning是一种典型的基于价值(Value)函数的强化学习方法,其中的Q是一个数值(可以理解为价值valu