AI已经能在桌游中骗人了? |
文/托马斯之颅
最近,一款叫做《轮到你了揭秘篇》的微信创意小游戏,颠覆了我对小游戏的认知。
它的玩法类似不用说话的《狼人杀》,要求5名玩家根据彼此的行为推断身份,做出决策,整个游戏过程充满了复杂的博弈推理和欺骗,非常烧脑,和那些超休闲游戏的简单体验完全不同。
然而仔细一查,它的研发商:超参数科技却不是一家游戏公司。它的主业是AI在游戏领域的应用,创始人刘永升是腾讯AI Lab之前的总经理,团队曾负责围棋AI“绝艺”,《王者荣耀》AI“绝悟”的研发。2019年初,他们还获得了晨兴资本、高榕资本千万美元的A轮投资。
据超参数所说,在零买量,零推广的情况下,上线2个月,《轮到你了》的用户量超过30万,DAU超过了3万,并且仍在快速增长。
他们是怎么做到的?这个品类还有多少机会?
《轮到你了》是一款怎样的游戏?
去年10月,超参数希望做一款能展现AI高级功能的产品。为了节约资源,他们打算做一款非数值玩法,以复杂博弈为核心乐趣的小游戏。
团队最先想到的是《狼人杀》这种身份隐藏类的桌游:它上手简单又不乏深度,易懂难精。在翻遍海外桌游论坛上Top 100的游戏之后,大家确定了《狼人杀》《阿瓦隆》《政变》《魔城马车》《矮人矿工》等几个原型备选。
很巧的是,当时AI负责人李宏亮也在MIT的一篇论文中看到了一个实验,用AI在《阿瓦隆》游戏中取得了不错的成果。于是团队最终以《阿瓦隆》为基础,砍掉了复杂的角色设计和发言环节,又借用了都市悬疑推理日剧《轮到你了》的包装,用1个月的时间研发出了玩法原型:
(1)5名玩家会共度5个夜晚,其中“好人方”包括2位住民、1位目击者;“坏人方”包括2位捣乱者;
(2)所有玩家每晚需轮流提案要监控哪些人。住民和被监控的捣乱者在夜晚无法行动,未被监控的捣乱者可以选择是否恶作剧;
(3)在5天中,出现3晚恶作剧则捣乱者获胜;出现3晚平安夜,且目击者没被捣乱者找出,则“好人”获胜。
在整局游戏中,玩家无需发言,只要根据投票记录做出推理即可,单局游戏时长大概是4分钟。为了进一步降低门槛,团队还把新手视频从2分10秒砍到了1分5秒,把这个阶段的流失率从50%降低到了20%左右(被评为创意小游戏后流失率为10%)。
解决了桌游玩法高门槛的问题,接下来就要轮到AI出马了。
如何用2个月打造一套AI?
为了训练AI,团队先找到100名测试玩家,积累了2000多局的对战数据,让AI模仿学习这些样本。这类似AlphaGo当年的第一步:研究数百万人类围棋专家的棋谱。
当AI对游戏有了一些理解,已经能够欺骗其他玩家之后,团队开始引入强化学习——这也是AlphaGo的主要算法框架。简单解释,就是让AI自己和自己竞技,以胜利为目标,积累经验,总结规律。
然而问题出现了:跑了几个小时,打了整整几百万把,团队却发现AI的水平依旧很菜,远远达不到人类的正常程度。
仔细分析之后,团队发现和围棋、斗地主、德州等传统棋牌游戏不同,在《轮到你了》中,玩家还要在不知道彼此身份的情况下,形成动态的竞争合作关系。在之前的强化学习框架中,AI固然会复盘每个操作对胜率的影响,但更重要的是要随时预测其他人的身份,并尝试影响他们的的行为。
于是团队重新梳理了学习逻辑,在强化学习中又加入了预测学习的算法,让AI模拟人类的思维,不断推理其他玩家身份的概率分布——例如根据投票记录,A是目击者的概率有80%。果然,AI的操作变得聪明了许多。
但新的问题又出现了。《轮到你了》的AI和AlphaGo的目的不同,它不需要追求水平的极限,而是要尽量伪装成人类,这对它提出了更多要求:
(1)高拟人性。这要求AI大部分的操作都比较常规(不能蠢得毫无逻辑),同时偶尔也会出现低级失误,或者十分精妙的操作。
(2)差异化段位。玩家段位越高,匹配到的AI水平就要越高。比如低级AI的逻辑链应该更简单,更容易失误;而高级AI的套路更多,推理/反推理能力更强。
(3)差异化风格。人类玩家的性格各不相同,因此在相同局面下,AI要能采取截然不同的行动。同样抽到捣乱者的身份,冲锋型AI可能开局直接捣乱,力图快攻取胜;而猥琐型AI则可能连续潜水两个晚上,到最后三轮再连续捣乱。
这些要求怎么满足?AI负责人李宏亮打了一个比方:先找100个人,让他们不断随机匹配,进行5人一局的对战,同时给每个人设立不同的目标。例如张三的目标,就是不断提升和李四、王二麻子对局的胜率。
这100个人最开始都是一张白纸,但因为对局经历不同,大家都会对游戏形成自己的理解。而为了打败李四和王二麻子,张三会努力分析他们的风格,找到一套克制的思路,从而形成自己的风格。
而在100个人都形成了自己的风格之后,只要再组织一场积分循环赛,自然就可以列一个排名清单,并在每个段位中选出风格不一样的选手。
在AI领域,这种学习方法叫做“基于种群的多智能体强化”。至此,经历了小样本模仿学习、强化学习+预测学习、基于种群的多智能体强化三个步骤,花费2个月的时间,团队终于打造出了一套合格的AI。
战略负责人陈昭翰说,在对反应时间、头像等都做了随机化设计之后,这套AI基本达到了真假难辨的程度。“我们自己测试的时候,有时候会说AI是不是出问题了,打得这么傻。结果一查后台数据,其实那个不是AI,是其他玩家出现了失误。”
根据测试数据,制作人高远也摸索出了一套AI的调用流程:
(1)先给新手分配3场对局,分别让玩家扮演捣乱者、目击者和住民,方便他们理解规则。
(2)在接下来的8-9局中,玩家会与行为树脚本匹配(即没有经历过深度学习的AI),强化对游戏的理解。同时每玩3局,在第4局插入一场深度学习AI,缓和与行为树脚本对战的枯燥体验。
(3)之后伴随玩家的段位提升,不断调整AI的比例,既保证中低玩家的游戏体验,又保证高段位的玩家的匹配不用等待太久。
经历了几轮测试和调优,加入了段位和成就等系统之后,《轮到你了》于1月正式上线。工作室负责人黄军说,最开始产品次留超过40%,被评选为微信创意小游戏后他们又获得了26万多名用户,次留也能达到25%左右,而且每天的人均游戏时间有1000多秒。
目前《轮到你了》已经与乐逗达成了发行合作,正在考虑加入赛季、付费等外围系统。不过战略负责人陈昭翰称,赚钱不是他们的目的,证明AI的价值才是核心,未来的盈利也会用到产品的调优和推广当中。
陈昭翰也表示,为了尊重版权,之后他们也会更换和日剧《轮到你了》过度类似的美术素材,甚至更改游戏的名字。
桌游小游戏与AI游戏的未来
那么在《轮到你了》之后,还会出现更多以桌游玩法为核心的小游戏吗?在葡萄君看来,这个品类需要3个要素:
(1)一个合适的玩法。《轮到你了》的玩法脱胎于已经被验证的《阿瓦隆》,而且在改动之后,不需要语音也可以获得博弈的乐趣。这大幅度降低了游戏的单局时长,也更符合小游戏的场景。
(2)解决冷启动和前期的匹配难问题。但以博弈,而非数值养成为核心的桌游玩法既不适合做内购,也不容易设计广告,前期的买量投入很容易打水漂,仅靠口碑传播又很难快速吸引用户,保证种子用户的留存。
(3)或者和超参数一样,用AI解决问题,不过这个门槛就更高了。黄军称,行为树很难处理这种复杂的博弈,必须引入深度学习的算法。为了跑通AI,他们花了2个月和几十万的计算资源。“如果你没做过,可能半年都跑不出来。”
因此,《轮到你了》不一定能引领桌游小游戏的发展。但在制作人高远看来,它证明了AI在去数值化的,策略博弈类玩法中的应用价值,而策略博弈正是许多品类的核心乐趣。
不过黄军说,现在AI在游戏中的应用还不够多,很多游戏在研发阶段也不会考虑AI的环境。“比如我想做一款FPS,那我不会从服务器端关注玩家的视角,只需要在客户端做就好了。但如果想训练AI,服务器端也要有类似的逻辑。”
黄军说,未来他们工作室还会继续探索以AI为核心乐趣的玩法,看看能不能改变游戏公司对AI的认知,一起创造一个叫做“AI Game”的全新品类。“什么时候AI和虚幻4一样,可以成为游戏的卖点,我们的使命就完成了。”
推荐阅读
最新的游戏专业书上架啦!点击下方小程序即可获取