深度学习tensorflow----初步说说阿法狗

         真的让人工智能火起来的事件就是李世石和阿法狗对战了。最后结果是阿法狗胜利。后来柯洁也去对战了,也输了。结果不说了。我就顺便描述一下,阿法狗吧。

         第一版的阿法狗,是通过学习人类的棋谱,学了很多之后,它就大概知道人会怎么下去了。简单的说法就是因为它已经学会了人类的一些优秀的棋谱了,记在大脑里面。之后,你在下棋的时候,它就对照之前人类的棋谱,找到最合适的下法。属于人类里面的集大成者,而且它不会忘记,不会出错。但是人类不一样,总是会忘记。必定阿法狗是学习人类遗留下来的棋谱,那么如果人类棋手下了一些之前没有的怪招,就很可能照成阿法狗的出错。

         到了第二版本的阿法狗,就不需要人类棋谱了。而且能力更强了。为何呢??

         人在学习的时候,是有路径依赖的。都是通过其他人的记录和方法去学习的。而且人对推理思考的距离是有限的,也就只能思考3--5步而已。按照数学的说法是,仅仅是当前局势情况下,3--5步以内的最优解,而且有可能是局部最优解。人和人之间的博弈,是没有办法去找到20--30步以内的最优解的。而阿法狗不一样,它在自我博弈的时候,它不会局限3--5步以内的最优解。所以,在后来的柯洁对弈中,表现出来的下棋方法就更没办法让人理解了。脱离了人类下棋的轨迹。

          

         

你可能感兴趣的:(深度学习tensorflow)