1 导语
这个实验是14年上半年在公司实习做的,很多都已经忘记了,就基本参考以前的总结写在这。用机器学习去玩游戏最牛掰的当属google deep mind的DRL[1]系列,这个是完全图像输入,我等也只能膜拜的份。博主这个实验是用的是人工特征,因此与DRL不可同日而语,效果也不是很好,不过个人觉得这个实验还是挺有趣的,又没有license的问题,所以在这里分享给大家。这里面的思想很简单,就是得到鸟的位置然后送入到CRBM网络去学习当前适合是否要点击屏幕。
2 数据采集
大家都知道flappy bird特别难,那要怎么采集学习数据呢。2014年初的时候有两哥们做了一个机械臂去玩flappy bird[2], 博主的这部分工作比他们晚点,但技术上是独立的。我也做了一个状态机去玩flappy bird来采数据,效果还挺好,最高能到200多分。
(1) 限制波尔兹曼机
5 实验结果
