Science Alert December 7, 2017 Peter Dockrill
国际象棋不是一个简单的游戏,按照人类的标准。但是对于一个强大的,几乎是外星人的思维驱动的人工智能,可以在几个小时轻松掌握。
在一篇新的论文中,Google的研究人员详细介绍了他们的最新人工智能发展AlphaZero如何在国际象棋中表现出“超人的表现”,在彻底碾压世界冠军国际象棋程序“干鱼”之前,其只花了四个小时来学习规则。
换句话说,只要用从纽约赶到华盛顿特区的时间,人类的已有的所有象棋知识(甚至更多)就被人工智能全部掌握和超越。
经过编程只有国际象棋的规则(没有战略),在短短四个小时内,AlphaZero已经掌握了这个游戏的程度,以至于它能够最好的评价最高的国际象棋程序干鱼。
在一系列对干鱼的100场比赛中,AlphaZero持白(先发优势)赢得了25场比赛,持黑赢3场比赛。剩下的比赛都是平局,干鱼中比赛没有任何胜绩,AlphaZero没有任何败绩。
国际象棋科学网站Chessable的首席执行官国际象棋研究员大卫·克拉马利(David Kramaley)说:“我们现在知道我们的新霸主是谁了。”
“毫无疑问,这个算法对国际象棋是革命性的,但是想想如何在国际象棋以外使用这个算法。这个算法可以运行于城市,大陆,宇宙。
由Google的DeepMind AI实验室开发的AlphaZero是一个经过改进的,更通用的新版的AlphaGo Zero Go。AlphaGo Zero Go专注于围棋。
DeepMind多年来一直致力于这个AI,在这个过程中,在不屈不挠的“神似”的神经网络之前,一系列人类冠军像多米诺骨牌被击败。
这一胜利在10月份更取得了惊人的突破,一个新的完全独立的人工智能,只有通过下棋中自我学习,而不是向人类学习,就能击败所有的对手。
相比之下,AlphaGo Zero的前辈是通过部分地学习了人类玩家的动作来学习的。
实际上,这一努力旨在帮助刚刚起步的人工智能学习策略,似乎可能存在一个障碍。因为AlphaGo Zero的自主学习,在一对一的比赛中被证明更有效。
麻省理工学院的计算机科学家尼克·海因斯(Nick Hynes)在十月份告诉“Gizmodo”说:“这就像是一个外星文明发明了自己数学。”
“我们在这里看到的是一个没有人类偏见和假设的模型。它可以学到任何它认为是最优的东西,这可能确实比我们自己的概念更细致。“但是,这个领域的发展是非常快的,到十月份的这个成就可能就已经过时了。
在他们的新论文中,团队概述了最新的AlphaZero AI如何发挥自我激励的依赖 - 称为强化学习 - 并将其应用于一个更广泛的连贯性,使其更加关注解决问题。
更广泛的视角意味着AlphaZero不只是下棋。它也玩Shogi(又名日本象棋),如同AlphaGo Zero Go。 不出所料的话,对于二者来说分别也就花上两和八小时就能掌握这些游戏。
目前,Google和DeepMind的计算机科学家并没有公开评论这项新研究,新研究尚未经过同行们评议。
但是从目前我们看到的是,这个算法令人眼花缭乱的人造智能还远远没有发挥出全部潜能,就连国际象棋大师们都被眼前的奇观所困惑。
国际象棋大师Peter Heine Nielsen告诉BBC记者“我一直希望,可以有高等智慧来到在地球上,并告诉我们他们是怎么下棋的。” “现在我已经看到了。”