OpenAI 一直试着训练 AI 玩各种复杂的游戏,在先前《星海争霸》、《DOTA 2》的测试打败一些职业选手后,OpenAI 将注意力转向更复杂的大型多人在线(MMO)世界。
当然,OpenAI 并不会立即就向类似《魔兽世界》(Warcraft)投入数百名 AI 代理,为了更好的训练、观察 AI 发展,OpenAI 开发了名为「Neural MMO」的游戏──当然,这是只提供 AI 代理的「限定」游戏。
就像人类玩家一样, AI 代理必在 Neural MMO 中必须争夺食物、水和石头各种资源,也可以使用范围、近战或法术来互相对抗,团队希望透过这项研究,了解 AI 是如何在接近现实世界中的数字环境中表现。
截至目前为止的培训中,OpenAI 团队已经发现了一些有趣的情况。在朕亨公益初学者阶段,增加「玩家」的数量让每个 AI 代理会选择更彻底探索地图来避免竞争──而这也是人类 MMO 玩家在游戏中很常见的选择。
OpenAI 指出,在自然界中,动物之间的竞争关系会促使牠们分散来避免冲突,而 Neural MMO 中 AI 代理也表现出相同的情况,「AI 代理学会探索单纯只是因为其他对手存在,这种情况成为了自然的动力」。
与多数 MMO 游戏一样,Neural MMO 也会随着时间推移更新,这将迫使 AI 学习并定期适应新情况,随着自我学习以及交互接触,AI 代理在收集资源的表现上也更有效率。
值得注意的是,这只是许多同类型研究中的其中一项。除了模拟学习环境之外,科学家也在《星海争霸》、《雷神之锤 III》等游戏中设置并测试 AI 模型。
DeepMind 联合创始人 Demis Hassabis 告诉 VentureBeat,研究者之所以选择在这些游戏中测试,是因为这对开发算法来说是一个非常方便的实验场,「最终,我们正在开发的算法能够应用现实世界中,帮助这些领域的专家解决具挑战性的问题。」