Q-learning实战(二)——二维迷宫

黄色的是宝藏,走到就会得到reward=1

黑色是黑洞,走到就会reward=-1

Q-learning实战(二)——二维迷宫_第1张图片

 

maz_env.py是整个迷宫环境的程序,用的tkinter

 

代码见https://github.com/skyerhxx/Q-learning-maze

 

项目结构

Q-learning实战(二)——二维迷宫_第2张图片

 

 

参考借鉴:

莫烦python

你可能感兴趣的:(Q-learning,强化学习,python)