DeepMind的最新版AlphaZero4小时统治了国际象棋界

DeepMind的最新版本棋类AI——AlphaZero从零开始自学国际象棋知识,仅用4小时就击败了国际象棋顶级程序Stockfish。

令人惊叹的是AlphaZero还提出了全新的战略,现在国际象棋大师们正在分析它的新策略。

当年,IBM的超级计算机“深蓝”之所以能击败国际象棋大师加里·卡斯帕罗夫(Gary Kasparov),是因为提前被灌输了最好的棋步。但是,AlphaZero只是了解下棋规则,其他都是靠自己学习的。

DeepMind的最新版AlphaZero4小时统治了国际象棋界_第1张图片
深蓝大战加里卡斯帕罗夫

英国国际象棋大师西蒙·威廉姆斯( Simon Williams)说,这一成就可以载入史册了。“2017年12月6日,AlphaZero统治了国际象棋界。”

国际象棋教育网站Chessable的David Kramaley补充说:“我们现在知道我们的新霸主是谁了。

“AlphaZero所玩的游戏表明,它可以计算出一些令人难以置信的创造性之举,其意义远远高于人类或国际象棋程序所提供的任何东西。

“毫无疑问,这个AI将会带来革命性的变化,接下来要思考的就是它如何在国际象棋之外发挥作用。让这一最新算法用于城市,各大洲,甚至宇宙。”

DeepMind的最新版AlphaZero4小时统治了国际象棋界_第2张图片
AlphaGo Master大战柯洁

挪威国际象棋大师约恩·卢德维格·哈默尔( Jon ludvig hammer)将AlphaZero的策略描述为“疯狂地攻击国际象棋”,并且每一步都走得意义深远。

除了在国际象棋界大展神威外,AlphaZero还顺便统治了将棋界,用了不到2小时击败了世界顶级将棋程序Elmo。

DeepMind的最新版AlphaZero4小时统治了国际象棋界_第3张图片

智能观上次还报道了DeepMind的AlphaGo Zero击败哥哥们AlphaGo、AlphaGo Master的事件,如果你认为这一次的Zero和上一次的Zero是一个品种,那就大错特错了!

最新版本的Zero使用了全新的算法,更接近“通用AI”,并且此次仅用了8小时就完败了当年打败李世乭的AlphaGo。当然,单纯地从名字看,新Zero比老Zero少了一个Go,不知道这算不算是它要脱离“狗狗家族”,摆脱只能下棋的命运,走向“通用AI”的标志。

此外,从技术角度看,新老两版Zero有4点不同:

1.AlphaGo Zero是在假设结果为赢/输二元的情况下,对获胜概率进行估计和优化;AlphaZero会将平局或其他潜在结果纳入考虑,对结果进行估计和优化。

2.AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强,而AlphaZero不会。

3.AlphaZero只维护单一的一个神经网络,这个神经网络不断更新,而不是等待迭代。

4.AlphaZero中,所有对弈都重复使用相同的超参数,因此无需针对某种特定的游戏进行调整。

最后,保持初心,DeepMind团队还是希望使用该算法来解决严重的健康问题。他们认为,这项计划可以在几天或几周内为重大疾病提供治疗方案(一般这样的方案要花费数百年才能找到)。

该公司已经开始使用AlphaZero来研究蛋白质折叠(错误折叠的蛋白质会导致许多破坏性疾病,包括阿尔茨海默病、帕金森病和囊性纤维化),并表示将很快发布新的研究结果。

我们,拭目以待!

附 DeepMind的AlphaZero最新论文:

https://arxiv.org/pdf/1712.01815.pdf

参考 The Telegraph,DeepMind论文,网易智能

—完—

想知道AI加教育领域有哪些最新研究成果?

想要AI领域更多的干货?

想了解更多专家的“智能观”?

请在对话界面点击“找找看”,去获取你想要的内容吧。


DeepMind的最新版AlphaZero4小时统治了国际象棋界_第4张图片

你可能感兴趣的:(DeepMind的最新版AlphaZero4小时统治了国际象棋界)