Hello,大家好呀,喵小DI又来了~最近大家是不是都在玩《羊了个羊》?
喵小DI也尝试了下,本来想着凭借本喵超高的智商,过第二关简直易如反掌,结果还是,惨败:(
喵小DI又尝试了N+1下,本来想着再凭借本喵超高的智商,过第二关还不易如反掌,结果还是,惨败:(
本喵只是运气不好而已,哼!
是时候秀一秀本喵的智商了!
本喵知道有很多朋友正在经历:
吃饭在打
带薪蹲坑在打
睡前在打
梦里都在打
......
但就是过不去第二关是怎么肥事
所以本喵和 OpenDILab 的小伙伴们连夜打造了DI-sheep,尝试用深度强化学习来玩这个游戏。
欢迎大家体验DI-sheep:
https://github.com/opendilab/DI-sheep
滑到文章最后有彩蛋哦
这里给大家介绍下 DI-sheep 的几种特色玩法,大家可以去 repo 里尝试下。
(请注意,试玩 DI-sheep AI 是需要自己部署开源代码哦,后续我们会搭建 AI 助力版在线网页小游戏,敬请期待)
大家可以看到我们的主界面右下方的功能: AI 速通流。
如果一直点这个功能键,你会发现 AI 还是有两下子,面前的小方块被 AI 自动消除得如此丝滑,nice!
部署好代码后,你会发现每走一步,都会有 AI 提示下一步应该选哪张牌。你也可以试试就不听 AI 的提示,绝对不点 AI 提示的每一张牌。和 AI 杠一杠,看看能否在“和 AI 对着干” 的玩法下闯过关卡。
这种玩法中,你也可以把 AI 当成自己的军师,想自己选牌的时候就自己选,在需要 AI 帮助的时候就选择听取它的建议。
DI-sheep原理示意图
看到这里,相信会有很多朋友会迫切地想知道 DI-sheep 背后的算法原理了,其实这还是深度强化学习 + 游戏的又一结晶,要想教好一个强化学习智能体完这种三消小游戏,其实掌握以下几步就够了:
在理清逻辑之后,我们就可以使用现代深度学习的经典模型 MLP、Transformer 等模块来方便地抽表征啦~
而在 DI-sheep 的背后,也有着开源决策智能平台 OpenDILab 的支持。通过其中的决策智能引擎DI-engine, 来一键创建和调用经典的神经网络和强化学习算法即可实现,因此 DI-sheep 的代码也十分的简单,欢迎尝鲜:
环境定义代码:
https://github.com/opendilab/DI-sheep/blob/master/service/sheep_env.py
神经网络定义:
https://github.com/opendilab/DI-sheep/blob/master/service/sheep_model.py
训练主入口:
https://github.com/opendilab/DI-sheep/blob/master/service/sheep_ppo_main.py
当然, DI-engine 还有完整的算法支持、友好的用户接口以及弹性的拓展能力等诸多特性,期待开发者们解锁 AI + X 的各种可能性。
DI-sheep 项目还在不断开发中,将会在后续一个月内上线各种有趣玩法和 AI 在游戏上的原理解析,具体信息可以参考下方网址,也欢迎各种技术爱好者来提建议和加功能,让开源拥抱未来。
网址:
https://github.com/opendilab/DI-sheep#%E6%9B%B4%E6%96%B0%E8%AE%A1%E5%88%92
都滑到这里了,给 DI-engine 点一个 star ⭐️吧~github.com/opendilab/DI-engine
而 DI-engine 的拓展能力则利用了框架内集成的消息组件和事件编程接口,让用户可以灵活地将基础研究工作拓展到工业级大规模集群当中。在游戏领域,别说《羊了个羊》,《星际争霸II》也不在话下!
欢迎大家来体验《星际争霸II》的智能体 DI-star:github.com/opendilab/DI-star
DI-sheep 版 羊了个羊