深度学习中的sarsa(lambda)和 Q(lambda)算法

这个没什么好说的,因为在莫烦python中出现了,可能会引起一些疑惑,普通的sarsa 和q-learning就是普通的时序差分(TD)的实现,sarsa(lambda) 和 Q(lambda)算法 就是TD(lambda)的实现。

你可能感兴趣的:(机器学习,增强学习,算法,时序差分)