人机棋王赛,究竟谁第一?

Google旗下英国人工智慧公司Google DeepMind所开发的AlphaGo,对战世界围棋冠军李世乭取得三连胜。 李世乭公开道歉了,而整个韩国似乎认为应该道歉的是Google。

李世乭表示,很对不起大家,认为自己应该有更好的表现,很可惜不能满足大家的期望,而且感到无力。回看第一场比赛,他认为不能胜出的原因是自己误判了Alphago的能力,而第二场自己则错过了几次的机会。而第三场,他说即使自己有很多比赛经验,但从来无这样巨大的压力感,原因之一是仍然未能调整与机器对决的心理质素。

而韩国资讯科技专业律师田石镇早在上个月就认为这是一场骗局,李世乭5盘全输已成定局。他说,AlphaGo通过互联网随时无限收集和利用相关信息,意味它拥有无数的”指教者”。他更称,AlphaGo动用”BF算法”下棋,即分析未来可能发生的所有情况。因此,他认为Google须要向李世乭及整个围棋界道歉。

实际上,李世乭却赢了第四场。这又是为什么呢?

这样看来,决定李世乭输赢的是心理因素而非棋艺。在韩国的科技兼法律专家看来,李世乭根本不具备赢的棋艺。他的逻辑是,把全世界顶尖围棋高手联合起来,就必然能战胜李世乭。 阿尔法狗(AlphaGo)自己也不必会下棋,只不过是把众多高手联合起来而已。

在”人机大战”中究竟哪一方比较有优势?早在1950年,信息理论之父Claude Shannon(克劳德·香农)就给出了答案,指出电脑和人脑各自具备的四项优势。

电脑优势:

1. 思考速度非常快且循规蹈矩、按部就班。

2. 不会临场犯错,如果有任何错误都是设计错误,可通过调整设计来修改。

3. 不会偷懒,一定会考虑到所有的可能性。

4. 既不会因为乐观而放松警惕,也不会因为悲观而放弃努力。

人脑优势:

1. 思考有弹性,会根据当前情况改变策略使用的优先顺序,不会死守一个顺序逐个尝试每一套策略。

2. 具有根据原有策略推理出新策略的能力。

3. 具有学习能力,可随时从别人甚至对手那里学习新的策略。

4. 具有创造能力,会凭空创造出新的策略。

从技术上看,电脑和人脑的主要差异之一是,在一秒钟之内,电脑可以对数亿种棋局进行评估,而人脑只能对两三个棋局做出评估。请你想像一下,这是怎样的差异啊!

电脑下棋的原理是,它记住了许多肯定会赢的棋局,不管人脑走出怎样的一步,它都用自己的下一步来调整,以确保棋局处于自己会赢的状态,这样最终它就会赢。

同样道理,人脑也可以这么做。只可惜,人脑的能够记住的棋局数量终究比不过电脑。这还只是对比记忆能力,更残酷的对比在于运算能力。记住的棋局越多,要从其中找出会让自己赢的那一步就需要越多的时间。拼搜索速度,也就是运算速度,人脑跟电脑比就更差了。

如果全部可走的棋局只有几亿种,那人脑每走一步,电脑立刻就能在这几十亿个棋局中找出最有利的一步,让人脑几无胜算可能。

不过,一旦当前棋局不在电脑记忆并且搜索到的赢局之内,它就只好随便走一步。这就如同在黑夜里蒙着眼睛走路,会不会落入陷阱,也就是让人脑赢的棋局,全凭运气了。 就算是电脑每秒评估几十亿个棋局,只要人脑走出一步,不在它能够搜索的那几十亿个棋局之内,它就没有什么优势了。

总之,对弈双方每走一步,都要力求逃出让对方赢的棋局,落入让自己赢的棋局,这样就会一步一步走向胜利。问题是,电脑记忆的赢局远远多于人脑,搜索速度也远远快于人脑,以致人脑很容易落入电脑的赢局,而万一电脑落入人脑的赢局,人脑也很容易因为疏忽而没发现。例如,IBM的深蓝电脑曾经与国际象棋棋王卡斯帕罗夫对弈,在整个赛程的中段,深蓝只要二十秒就可以评估41亿种可能的棋局,但卡斯帕罗夫做完同样的评估需要43年,而且不能吃饭、睡觉和上厕所。

所幸的是,可供对弈者选择的棋局数量超过宇宙中原子数的总和。与国际象棋相比,围棋的棋局数量更是惊人。所以,从整体上看,相对于几乎无限多种可走的棋局数量,几十亿和两三个相比,也不是什么大不了的优势。 这就像是,人与人相比,能力差异非常大,但把任何两个人一同放在上帝面前,他们之间的差异就没那么大了!

更重要的是,电脑的搜索速度和存储空间肯定是有限的,而且是按部就班地进行,而人脑是不设限的,不仅很可能走出电脑根本没记忆的棋局,而且会跳跃式地思考。最致命的是,电脑必须设定有限计算的步数,因为每增加计算一步都会带来运算量的急剧增加,很快就超过宇宙的总粒子数,而人脑随便想思考走几步都可以,虽然不一定保证最终选择的是赢局。

当一盘棋进入中段,因为棋局变化太多,电脑就算记忆的赢局比较多,但也很可能并没有记录当前的棋局。在这种情况下,电脑和人脑都在蒙着眼睛走路。此时,人脑的直觉,也就是某种意义上的战略思维,比较容易发挥作用。正如巴菲特所说,人脑此时可能占有着模模糊糊的正确,而电脑很可能只拥有精准的错误。人脑跑得慢,但知道大概方向。电脑跑得快,却可能完全跑错方向。

随着棋局的发展,棋盘上的空间越来越少,结局会逐渐明朗化。这跟开局时段有所不同,甚至跟中段也有所不同。在开局或者中段,如果你走错一步,还有比较多的机会修正回来。越靠近结局,你的每一步就更关键,非常可能因为一步错误而满盘皆输。可以说,前面时段竞争的焦点在于广度,拼的是你走出的棋局能不能跳出对方记忆里的赢局,而接近结局的时候竞争的焦点在于深度,拼的是你能不能保证在多少步之内不走错任何一步。

在紧要关头,你走出了奇怪的一步,如果你是高手而且赢了,人们多半会猜想你在出奇制胜。如果你是新手而且赢了,人们多半会猜想你是瞎猫碰上死耗子。 李世乭在连输三局之后的神来之笔,能够让阿尔法狗惊呆,应该就是神来之比,跳出了阿尔发狗所记录的赢局范围。

如果下棋的电脑走出了奇怪的一步,人们会猜想它是设计个错误,因为它每一步都应该在设计程序的计划之中,不管棋局的结果是输还是赢。人们对电脑的期待,只应该限于正确与错误,不应该在意棋局的输赢。电脑能做的,仅止于不犯战术错误,而几乎很难有战略思考。输赢结果如何,它都不会开心或者不开心。

阿尔法狗只不过是Google派出的一个工具,背后的赢家必然是Google,与这场棋局的输赢无关。

可见,在战略层面,电脑是不值得讨论的。在战术层面,电脑与人脑的差异会导致在整个棋赛的不同阶段各自具备不同的优劣势对比。实际上,几乎任何比赛都存在开始、中段和决战三个阶段,每一阶段都是对资源、实力和心理素质的不同测试。

其实,你把任何一件事情,例如商业上的一个产品、一个项目、一个订单,乃至于一个人的一生,都看作是一盘棋。开始的时候,你应该多一些创意,尽量做些出人意料的事。中段的时候,你应该保持耐心,不要放弃,等待决胜时刻。接近结局的时候,你应该紧紧锁定目标,减少失误。

至于人机大战的输赢结局,不一定要看得那么重。机器永远都只是个工具,它既不会背叛人类,也谈不上忠诚,它的目标是被人类设计的。

好的机器最多就是“不犯错”,它决不会有自己的目标和梦想。而身为一个人,不犯错、也没有梦想,怎么会有幸福感!


     

你可能感兴趣的:(人机棋王赛,究竟谁第一?)