2020.01.19 fjy
学习Sarsa
这两天先看了看莫烦大佬的视频,又找了几篇博客在头两天啊安装好的环境里尝试着学习了一下Sarsa。
Q-learning是说到不一定做到的类型所以是off-policy,Sarsa是说道一定做到类型所以是on-policy。
Sarsa的的take action直接走和choose action从Q表中选择中间没有加东西,就是走了这步先不更新Q表直接走下一步,然后再更新Q表。
莫烦大佬的宝藏游戏
接下来可以通过莫烦大佬视频里给我们举例的那个走迷宫的小游戏来认识一下Sarsa算法的奇妙之处。
大致了解了Sarsa是怎么工作的。
接下来会接着学习DQN。