DeepMind的最新版AlphaZero4小时统治了国际象棋界

DeepMind的最新版本棋类AI——AlphaZero从零开始自学国际象棋知识，仅用4小时就击败了国际象棋顶级程序Stockfish。

令人惊叹的是AlphaZero还提出了全新的战略，现在国际象棋大师们正在分析它的新策略。

当年，IBM的超级计算机“深蓝”之所以能击败国际象棋大师加里·卡斯帕罗夫（Gary Kasparov），是因为提前被灌输了最好的棋步。但是，AlphaZero只是了解下棋规则，其他都是靠自己学习的。

深蓝大战加里卡斯帕罗夫

英国国际象棋大师西蒙·威廉姆斯( Simon Williams)说，这一成就可以载入史册了。“2017年12月6日，AlphaZero统治了国际象棋界。”

国际象棋教育网站Chessable的David Kramaley补充说：“我们现在知道我们的新霸主是谁了。

“AlphaZero所玩的游戏表明，它可以计算出一些令人难以置信的创造性之举，其意义远远高于人类或国际象棋程序所提供的任何东西。

“毫无疑问，这个AI将会带来革命性的变化，接下来要思考的就是它如何在国际象棋之外发挥作用。让这一最新算法用于城市，各大洲，甚至宇宙。”

AlphaGo Master大战柯洁

挪威国际象棋大师约恩·卢德维格·哈默尔( Jon ludvig hammer)将AlphaZero的策略描述为“疯狂地攻击国际象棋”，并且每一步都走得意义深远。

除了在国际象棋界大展神威外，AlphaZero还顺便统治了将棋界，用了不到2小时击败了世界顶级将棋程序Elmo。

智能观上次还报道了DeepMind的AlphaGo Zero击败哥哥们AlphaGo、AlphaGo Master的事件，如果你认为这一次的Zero和上一次的Zero是一个品种，那就大错特错了！

最新版本的Zero使用了全新的算法，更接近“通用AI”，并且此次仅用了8小时就完败了当年打败李世乭的AlphaGo。当然，单纯地从名字看，新Zero比老Zero少了一个Go，不知道这算不算是它要脱离“狗狗家族”，摆脱只能下棋的命运，走向“通用AI”的标志。

此外，从技术角度看，新老两版Zero有4点不同：

1.AlphaGo Zero是在假设结果为赢/输二元的情况下，对获胜概率进行估计和优化；AlphaZero会将平局或其他潜在结果纳入考虑，对结果进行估计和优化。

2.AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强，而AlphaZero不会。

3.AlphaZero只维护单一的一个神经网络，这个神经网络不断更新，而不是等待迭代。

4.AlphaZero中，所有对弈都重复使用相同的超参数，因此无需针对某种特定的游戏进行调整。

最后，保持初心，DeepMind团队还是希望使用该算法来解决严重的健康问题。他们认为，这项计划可以在几天或几周内为重大疾病提供治疗方案（一般这样的方案要花费数百年才能找到）。

该公司已经开始使用AlphaZero来研究蛋白质折叠（错误折叠的蛋白质会导致许多破坏性疾病，包括阿尔茨海默病、帕金森病和囊性纤维化），并表示将很快发布新的研究结果。

我们，拭目以待！

附 DeepMind的AlphaZero最新论文：

https://arxiv.org/pdf/1712.01815.pdf

参考 The Telegraph，DeepMind论文，网易智能

—完—

想知道AI加教育领域有哪些最新研究成果？

想要AI领域更多的干货？

想了解更多专家的“智能观”？

请在对话界面点击“找找看”，去获取你想要的内容吧。