【强化学习】用pandas 与 numpy 分别实现 q-learning, saras, saras(lambda)算法
本文作者:hhh5460本文地址:https://www.cnblogs.com/hhh5460/p/10159331.html特别感谢:本文的三幅图皆来自莫凡的教程https://morvanzhou.github.io/pandas是基于numpy的,但是两者之间的操作有区别,故在实现上述算法时的细节有出入。故记录之几点说明:1).为了更好的说明问题,采用最简单的例一。2).分离了环境与个体,