强化学习: 继续看 Q-Learning + FrozenLake, 解决更大的地图 8x8, 10x10
引子古之成大事者,规模远大与综理密微,二者缺一不可。不管天气好坏,坚持每天前进大概30公里。起初店里的生意比较惨淡,他们有大把的时间来编写程序。起因,目的:8x8的地图很容易失败,这个问题,我之前讲过。如何解决,一句话,根据距离来修改奖励.过程:1.先让ChatGPT推荐几种方法聊天记录ChatGPT推荐了5种方法,我试了,都不行。失败率还是很高。再推荐几种方法,还是不行。比如DQN,我试了,失败