导论1/3-人人都应该了解的人工智能进化论

点击收听课程音频

从进化论的角度来观察人工智能的发展，将会给大家带来全新视角来更加容易的理解人工智能未来发展趋势。这个观点是产生是我受到了AlphaGo和AlphaGozero的启发，AlphaGo谷歌deepmind团队开发的人工智能程序，我们知道去年10月AlphaGo运用监督学习算法，用上千盘人类棋手的棋谱进行训练并战胜了世界围棋冠军李世石。而zero走的是不同的路径，仅仅输入基础规则，完全不依赖人类棋手的经验，从它从一张白纸开始胡乱下棋，在不断自我对弈过程中学习。它很快超过了人类水平，并且对战前代AlphaGo取得了100：0的不败战绩。在这案例上面我们看到了机器学习展现出的巨大潜力，不断自我升级出来AlphaGozero超过人类训练和调教的AlphaGo，那是不是可以认为机器已经具有更强的学习能力了呢？在这里先不下结论，在后面会专门内容来讨论这个问题。

再说回来Zero 用了3天时间，通过数百万盘自我对弈提升战斗力，就像是它在计算机里面完成了人类千年的围棋进化历史，并探索出了不少人类棋手前所未闻招法。zero在更短的时间内学习训练，轻松战胜了前辈AlphaGo，这个训练对弈棋局数量级的远远超过人类生理极限的，这种数量级差异也带来了结果的巨大差异。可以预见以后的棋手都会把向AI学习作为一种基本训练方法，融合到自己的棋局里面，借此来的提升棋力。这就是AI改变了一个行业的学习方式的例子，而人类棋手也通过人工智能提升了自己的视野。

如果把AlphaGozero看成一种生物的话，这个学习的过程就是自我进化的演进历程，只是进化和迭代的过程都在硬件里面以电子的速度进行。AlphaGo Zero为什么可以自学成才，是应用了强化学习的新模式。系统从一个对围棋一无所知的神经网络加上一个强力搜索算法，二者结合，进行自我对弈。在对弈过程中，神经网络不断调整、升级，预测每一步落子和最终的胜利者。升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero再进行自我迭代，往复循环。每过一轮循环，系统的表现就提高了一点，自我对弈的质量也提高了一点。神经网络越来越准确，AlphaGo Zero的版本也越来越强。这个过程充分体现了进化论“物竞天择，适者生存”的原理。

最令人震惊的的是这个模型训练和深度学习的机制，是具有通用型的，也就是说不仅仅可以用于机器学习下围棋，也可以迁移应用于解决其他复杂问题。想象一下，机器学习仅用几天的时间就超越人类千年的积累，带来一个问题：人类积累下来的经验和技能在人工智能时代的究竟有多大的价值？

人类文明所有的设计和创造物，这一切的源头就是人类的想象。那些能够被人类想象出来的东西，最终都会被实现。

了解更多课程内容点击加入圈子，或者vx搜索"知识星球"小程序，在里面搜索订阅“人工智能进化论”课程，加入圈子讨论。或者加wx:AI61825

加入圈子

导论1/3-人人都应该了解的人工智能进化论

你可能感兴趣的:(导论1/3-人人都应该了解的人工智能进化论)