DeepMind的最新版本棋类AI——AlphaZero从零开始自学国际象棋知识,仅用4小时就击败了国际象棋顶级程序Stockfish。
令人惊叹的是AlphaZero还提出了全新的战略,现在国际象棋大师们正在分析它的新策略。
当年,IBM的超级计算机“深蓝”之所以能击败国际象棋大师加里·卡斯帕罗夫(Gary Kasparov),是因为提前被灌输了最好的棋步。但是,AlphaZero只是了解下棋规则,其他都是靠自己学习的。
英国国际象棋大师西蒙·威廉姆斯( Simon Williams)说,这一成就可以载入史册了。“2017年12月6日,AlphaZero统治了国际象棋界。”
国际象棋教育网站Chessable的David Kramaley补充说:“我们现在知道我们的新霸主是谁了。
“AlphaZero所玩的游戏表明,它可以计算出一些令人难以置信的创造性之举,其意义远远高于人类或国际象棋程序所提供的任何东西。
“毫无疑问,这个AI将会带来革命性的变化,接下来要思考的就是它如何在国际象棋之外发挥作用。让这一最新算法用于城市,各大洲,甚至宇宙。”
挪威国际象棋大师约恩·卢德维格·哈默尔( Jon ludvig hammer)将AlphaZero的策略描述为“疯狂地攻击国际象棋”,并且每一步都走得意义深远。
除了在国际象棋界大展神威外,AlphaZero还顺便统治了将棋界,用了不到2小时击败了世界顶级将棋程序Elmo。
智能观上次还报道了DeepMind的AlphaGo Zero击败哥哥们AlphaGo、AlphaGo Master的事件,如果你认为这一次的Zero和上一次的Zero是一个品种,那就大错特错了!
最新版本的Zero使用了全新的算法,更接近“通用AI”,并且此次仅用了8小时就完败了当年打败李世乭的AlphaGo。当然,单纯地从名字看,新Zero比老Zero少了一个Go,不知道这算不算是它要脱离“狗狗家族”,摆脱只能下棋的命运,走向“通用AI”的标志。
此外,从技术角度看,新老两版Zero有4点不同:
1.AlphaGo Zero是在假设结果为赢/输二元的情况下,对获胜概率进行估计和优化;AlphaZero会将平局或其他潜在结果纳入考虑,对结果进行估计和优化。
2.AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强,而AlphaZero不会。
3.AlphaZero只维护单一的一个神经网络,这个神经网络不断更新,而不是等待迭代。
4.AlphaZero中,所有对弈都重复使用相同的超参数,因此无需针对某种特定的游戏进行调整。
最后,保持初心,DeepMind团队还是希望使用该算法来解决严重的健康问题。他们认为,这项计划可以在几天或几周内为重大疾病提供治疗方案(一般这样的方案要花费数百年才能找到)。
该公司已经开始使用AlphaZero来研究蛋白质折叠(错误折叠的蛋白质会导致许多破坏性疾病,包括阿尔茨海默病、帕金森病和囊性纤维化),并表示将很快发布新的研究结果。
我们,拭目以待!
附 DeepMind的AlphaZero最新论文:
https://arxiv.org/pdf/1712.01815.pdf
参考 The Telegraph,DeepMind论文,网易智能
—完—
想知道AI加教育领域有哪些最新研究成果?
想要AI领域更多的干货?
想了解更多专家的“智能观”?
请在对话界面点击“找找看”,去获取你想要的内容吧。