2019-03-08派森学习第110天

今天继续观看强化学习的视频,并且把源程序自己下载下来,并且做了修改。

强化学习迷宫的游戏,让机器自己学会找到黄色目标。

刚开始运行是这样的:

刚开始

经过一段时间的学习之后:

强化学习_迷宫

把observation_打印出来方便观察,

observation_

其中用到的Q-Learning算法:

Q-Learning

你可能感兴趣的:(2019-03-08派森学习第110天)