相关性知识成就了Alpha Go Zero

原创

相关性知识成就了Alpha Go Zero

 

赵明达

 

摘要:本文从波普尔“三个世界”的认识论观点出发,以Alpha Go Zero用以战胜人类棋手的围棋对弈知识为主要对象,就相关性和因果性两种思维方式,从知识的创造发现和运用需求两个角度,通过对知识在语义、语法、语用三个信息层面上体现出的价值,以及知识创造的代价进行了分析、比较,阐述了人工智能作为人类的认知工具,其相关性知识不仅是人类知识体系的补充,而且是人工智能系统自身建立和进化的基础。

关键词:相关性  因果性 知识 Alpha Go Zero

 

2017年10月19日,Deepmind公司在《Nature》杂志上发表论文,报告了新版围棋程序Alpha Go Zero在无任何人类棋谱输入的条件下,从零经验开始,经过40天490万盘的自我对弈学习,击败了曾经多次战胜人类顶尖棋手的Alpha Go Lee、Alpha Go Master等“前辈”,这在人工智能科学领域、哲学领域,特别是知识论方面,引起了不小的震动。

人在实践中获得知识,又在实践中应用这些知识,以解决所碰到的问题,“对科学家来说,……他向自己提出问题,并且去解决这些问题。对这些问题的解决便构成了知识。”(【1】P16)。借助人类的知识,在某些单一、狭窄的领域,人工智能表现出比人类更强的能力,已经不是新闻。但这次,Alpha Go Zero却不拥有任何人类的围棋对弈知识,它的知识是它自己发现、创造、总结并加以运用的。

麦卡锡指出,若想理解智能行为,就应研究在背后支持智能行为的知识,以及这些知识是如何影响智能进行决策的。我们要理解Alpha Go Zero,无疑就要了解它掌握的知识。所以,本文不在技术的或者人工智能科学的角度,而是在知识论的角度,主要基于波普尔“三个世界”的认识论思想,对Alpha Go Zero的围棋知识进行分析,以期对人工智能有进一步的理解。

 

一、Alpha Go Zero的围棋对弈知识

波普尔批判地继承了柏拉图理念世界的思想,在其著作《客观知识》中,将我们所处的世界分作三个“次世界”,分别称作世界1(物理世界)、世界2(精神世界)和世界3(观念世界)(【2】P164)。人类创造出的非物质产品,比如科学理论、音乐、绘画、法律、甚至宗教教义等等,包括各种知识,都是存在于世界3的实体。波普尔在书中分析了世界3的客观性和自主性(【2】P166),认为虽然世界3的实体是人创造出来的,但它可以独立于创造它的主体,具备客观性;同时,作为客观存在于世界3中的实体,知识有其自身的成长、进化规律,不完全由主体支配,具备自主性。

世界3由人类创造,并通过人类,对三个世界产生作用。知识的价值就体现在它与主体之间的互动当中。①、主体作用于世界3:主体创造知识,生成或修改世界3的实体;②、世界3作用于主体:主体接受知识并在主体间传承,使之运用到对世界1、世界2的改造当中。“第三世界的自主性,第三世界对第二世界甚至对第一世界的反馈作用,是知识发展中最重要的事实”。(【2】P128)。因此,对知识的分析就可以集中在两个方面,一是知识的创造、发现,二是知识的学习、运用。世界3对世界1的作用必须通过主体的精神世界,除了世界1,人的情绪、经验、意志、信仰的变化都可能是世界3引起的,所以,世界3仅仅与世界2存在直接作用。“掌握知识,并利用知识对自身行为施加影响,是构成人类行为的本质”(【3】 P39)。

一方面,Alpha Go Zero没有输入人类的任何棋谱或行棋知识,它在自我对弈中,发现并使用了众多人类棋手千年以来总结的“定式”、“手筋”等围棋对弈知识,也“创造”了人类没有的走法。Alpha Go Zero将这些下法积累、固化,并运用在对弈当中,从而赢得了局部的优势或全局的胜利。从行棋上看,Alpha Go Zero已经明显掌握了这些围棋概念的属性,并据此对自己的落子做出判断。AlphaGo 的首席研究员 David Silver 说:“我们已经突破了人类认知的障碍,因为Alpha Go Zero自己能够创造知识”。如同人类的知识一样,Alpha Go Zero创造的围棋对弈知识,也是世界3的客观存在,它们不再“依附于”Alpha Go Zero,可以接受其他主体的评判、使用和发展。Alpha Go Zero做到的已经不仅是人类围棋知识的集成,而且是围棋知识的发现、创造。

另一方面,Alpha Go Zero的围棋对弈知识,也被人类棋手学习、分析、研究、运用。它自己也如它的前辈Alpha Go Li、Alpha Go Master一样,可以学习、掌握人类和其它围棋程序的棋局(棋谱)输入,并将这些围棋知识应用到对弈当中。棋手运用哪个(哪些)围棋知识只与他们的目的(赢棋、局部获利、局部安定等)有关,棋手们没有,也不需要判定某个定式是人工智能发现的还是人类棋手发现的,不需要区分也难以区分创造这些知识的主体,不需要在世界3中进行知识的 “图灵测试”!

总之,Alpha Go Zero为世界3创造了产品,丰富了世界3的内容,同时,又能够运用世界3的产品,用它的围棋理论,来指导自己下好每一着棋。

 

二、知识的相关性与因果性

围棋可能的棋局总数在理论上是有限的,即一副盘面下可能的“走法”是有限的。按照策梅洛定理“有限步内结束的完全信息博弈存在不败策略”,如果规则严格禁止全局同型反复,则围棋存在必胜策略。当然,“存在”并不意味着我们现在可以找到这一策略,无论是人还是人工智能的计算能力,目前还没办法确定某一走法是否是现在盘面下的“最优走法”,它们仅仅是棋手估算的最优,是一种“似真”。也就是说,现有围棋对弈知识,包括Alpha Go Zero所创造的那些知识的真理性目前是不能判定的,这种无法判定是由于主体的信息、知识、认知能力等不足造成的。因此,Alpha Go Zero是将每一步走法看做随机变量,来计算并探讨该走法“正确”(最大获利、提高胜率)的概率,然后选择胜率最大的下法,这是Alpha Go Zero神经网络算法的立足点。如果有朝一日计算机(人工智能)能够计算出(发现)必胜走法,那样的围棋知识才是真理。提供给世界3什么样的知识,是和我们的目标以及我们能够拥有产生知识的条件有关的。

这样,Alpha Go Zero的算法只是获得了围棋下法与赢棋的相关程度大小的值,其围棋知识本质上是一种相关性知识。这种知识基于统计方法,表述了事物间的相关关系。相对应的,我们还有许多知识表述了事物间的因果关系,称为因果性知识。现在的人工智能科学,大都是按照知识的获取方式进行分类的,比如“关联规则挖掘”,“人工神经网络”,“决策树”等等。关联规则挖掘,就是发现数据项之间相关性知识过程,比如总结出陈述“眼底病变产生失明的概率是30%”,而我们所说因果性知识是类似 “某人失明的原因是眼底病变”的陈述,它阐释了一个事物是导致另一个事物发生的原因。

以牛顿力学为代表的近代科学,通过归纳方法,极大地拓展了人类探索事物运动变化原因的途径,从而在获取因果性知识的方面,取得了辉煌的成就,使得因果性思维是如此根深蒂固地存在于我们对事物的认知当中。就因果性知识而言,在其知识的创立阶段,我们提出一个理论或假说,创立一个前提(原因)和推论(结果)之间的逻辑演绎系统;而知识的运用阶段,我们由初始条件(原因)经过系统演绎出结论(结果)。我们自始至终认为,知其然必须知其所以然,只有找到了事物发展的原因,才发现了事物的规律,才获得了知识,因果性成为现代科学知识的基石。

但是,很显然,因果性知识不是我们创造和运用的唯一一种知识。比如,古代气象学提供的知识更多的是“朝霞不出门,晚霞行千里”,“西风急,雨打壁”等等的谚语;医学,哪怕是现代医学等等的学科,许多知识还是建立在大数据之上的相关性统计理论。在现代人看来,引领西方众多学科1500年的托勒密《天文学大成》,不过是用“本轮”、“均轮”对观察到的天体运行轨迹进行的拟合,它在描述、预测天体的运动时,并没有指出形成这种轨迹的原因,托勒密的天文学更应该被看成是一种相关性知识。

从天圆地方的观念,或亚里士多德的水晶球体系,到托勒密的《天文学大成》,哥白尼的《天体运行论》,开普勒的行星运动三大定律,再到牛顿的万有引力理论,到广义相对论,知识发展到哪一层次才是对天体运行进行的因果关系的描述?哪一种知识才揭示了天体运行之间的因果性呢?即,哪一种是因果性的知识,而哪一种只是各天体运行关系的相关性描述?人类的知识,是从初始的“相关性”和粗略的因果性开始的,随着“因”不断地接近事物的本质,知识才得到不断地丰富、发展和完善,这是人类认知体系运转的普遍规律。因果性和相关性是我们对事物达到不同层面的认识结果,表征我们由事物的相关性,到因果性,再到更深层次的因果性的不断深化的探索过程。牛顿的万有引力定律在一定的层面上,阐释了物体运动的原因——引力,但天体运行更为根本的原因却是广义相对论揭示的时空弯曲。爱因斯坦明确指出:相对论将来会被更完善的理论所代替。所以,因果性和相关性之间并没有一条泾渭分明的界限,随着人们认知的发展,后面更深入的因果性理论,可以发现先前知识的更深层次原因。相关性知识是因果性知识的“先行”知识,是我们进一步发现的基础,它揭示的是事物的最表面上的“因”,几乎所有的知识都是由相关性走向因果性的。

人类擅长基于逻辑的因果性思维,认知的目的在于阐释事物间的因果关系,发现经验事实背后的规律。现阶段的人工智能还不能对事物间的关系作出因果性的判断和推测,而只能计算事物间存在的相关性的大小,因此,我们称其只具备相关性思维,或者说只具备获得相关性知识的能力。相关性知识绕开了关于事物本质的讨论,但它切实解决了人类实践中的许多问题,并且充当了进一步发现因果性知识的基础。

其实,对因果性、相关性两种知识的开发,都是人工智能研究的方向。符号主义学派注重知识的表达和因果推理,它是从模仿人类的思维起始的。这样的人工智能现在被称为经典人工智能GOFAI(Good Old-fashioned AI),专家系统、机器证明等就是其成果。但是,基于符号主义的人工智能必须在非常特定的场景中应用算法,目前其进展遇到了极大的障碍。与之相对应的是,归属于联结主义派别的自适应机器学习AML(Adaptive machine learning)的快速发展和突破,特别是深度学习神经网络的出现,使得机器在获取一些领域相关性知识的能力方面超过了人类,比如图像识别、机器翻译,智能游戏等等。

符号主义学派和联结主义学派分别被认为是基于逻辑驱动和基于数据驱动的,对应人类的现象规律研究和现象表现研究两个方面,两个派别对机器学习的看法不同。逻辑层面上看,符号主义自顶向下,是一种由规律到结论的演绎过程,主要的研究方向是因果性知识的运用;而联结主义自底向上,同时关注由现象归纳出结论和对结论的直接运用,主要的研究方向是知识的创造,最成功的便是特定领域相关性知识的发现。

比较两种知识,分析相关性知识在知识体系中的地位,对促进人工智能的发展,提高人类的认知能力有着重要的作用。

 

三、因果性和相关性知识的价值比较

对比相关性知识,为什么我们更为青睐因果性知识呢?或者说,因果性知识是不是比相关性知识更有价值呢?现代知识论认为,科学知识不过是确认度达到某个概率值的理论、猜想或假说。笔者在拙作《理论的竞争——信息科学视角下的休谟问题》中,对科学知识(理论)的价值进行了分析和比较,认为知识能够给予主体的,只能是它所提供的信息,因此,主体对知识价值的比较,就只能按照信息科学理论,在知识的三个信息层面上,即语义信息层面、语法信息层面、语用信息层面上进行。作为世界3的实体,知识的语义信息,表征知识所述的内容,体现知识的客观性;知识的语法信息,表征知识所述内容为真的概率,体现知识的真理性;知识的语用信息,表征知识所述内容的效用,它与认知主体的认知目的紧密相关,更多地体现知识的主观性。简单地说,理论的语义信息“让我知晓”,语法信息“使我相信”,语用信息“为我可用”(【6】P9)。主体所能掌握的,就是知识在上述三个信息层面上展现出的,知识的内容多少、知识的概率高低、知识的效用大小。所以,主体对知识价值的评估、比较就只能在知识的内容、概率、效用三个层面上进行。

1、知识的内容多少

因果性知识是由前提到结论的一个逻辑演绎系统,提供给主体的不仅仅是主体经验到的,或者正在考察的事物,它包括的是整个理论系统和该系统可能演绎出的所有结论。这种将知识覆盖到主体经验的事物以外,甚至无限客观世界的能力,是相关性知识所不具备的。相关性知识仅仅只能给出主体所经验到的“那种”事物的知识,而不能“由此及彼”地推论到其它。开普勒三大定律很好地“拟合”了太阳系行星的运动轨迹,但它不具备对系外天体或其它事物的描述;而牛顿的万有引力定律,由于其对天体运动的原因——引力的阐述,解释、预测了宇宙间所有物体的运动现象。利用作为因果性知识的万有引力定律,可以推算出海王星的存在,从而进一步增加天文学知识的内容。我们可以想象,在同样的场景(天王星的轨迹异常)之下,托勒密体系就不可能作出存在新的行星的预测,而是只会通过增加“本轮”,来修正对天王星轨道的拟合。对于同一事物对象,相关性知识没有逻辑推理的余地,所以其内容的量远远低于因果性知识,也就是相关性知识的语义信息量较因果性知识低。

2、知识为真的概率大小

自从休谟提出了“休谟问题”,也就是“因果性问题”和“归纳问题”以后,认识论就受到了理性前所未有的挑战。休谟认为:①、被认定为事物间存在的因果关系,不过是事物发展的“恒常汇合”,这种认定缺乏理性依据;②、即便事物间的因果关系存在,通过归纳方法获得这种因果关系,不过是人的认识习惯,这种方法也缺乏理性依据。休谟说:“根据经验来的一切推论都是习惯的结果,而不是理性的结果”(【4】P42)。康德也说:“经验的因果归纳没有合法性”。现代科学,特别是量子力学的发展,也在本体论意义上为休谟对因果性的质疑提供了注脚。

因此,在相关性的知识面前,我们说它们没有反映事物的因果性;而在因果性知识面前,我们亦不敢确定,它们反映了事物的因果性,甚至我们都不敢断定事物存在因果性。理性不能肯定我们对事物的因果性解释,不能肯定我们的知识正确反映了事物本身的规律。正因为如此,康德说:“我们的理智并不是从自然界引出规律,而是把规律强加给自然界”,尼尔斯.玻尔也说:“没有量子世界,只有抽象的物理描述,认为物理学的任务是发现自然究竟是什么的观点是错误的,物理学关心的是,对于自然我们能说什么……”。这样,我们获得的是因果性知识还是相关性知识,要看我们创造、发明并“强加”给观察事物的知识是因果性的还是相关性的。我们的认知目的是在世界3中创造出多个假说,并在其中选择、认定最好的一个,以合理的置信度,将选择的理论“强加”给世界。牛顿说,他并不真正知道光、知道时空、知道力的本身,但这不妨碍他给出描述这些事物运动规律的辉煌理论。与其说我们能不能发现事物之间的因果性,不如说是我们有没有能力创造一个因果性的知识去赋予(解释、预测)事物。“科学其实就是创造出对我们所观察事物的解释或起因。”(【5】P18)。知识不过是我们创造并选择出的,将用于指导我们实践的理论(假说、猜想)

因此,因果性同相关性知识一样,不代表知识的真理性,因果性知识和相关性知识都是概然的,两者概率的大小,也就是知识的真理性程度,只与它们被确证的程度有关。知识的真理性(概率)“是已经获得证实的内容的增函数”(【6】P58)。对相关性知识而言,其获得证实的内容便是能够佐证这种相关关系的数据,这样的数据量越大,相关性知识的真理性就越强,这就是大数据之于相关性知识的优势。所以,在语法信息层面上,两种知识的价值与是否具备因果性无关,相关性或因果性不决定知识的概率大小。

3、知识的效用大小

Alpha Go Zero所创造的对弈知识,也就是那些定式、手筋、布局,甚至是我们可以体会到的Alpha Go Zero的行棋“思路”、“风格”,不仅在它自己的对弈中的发挥作用,而且对人类的行棋,甚至在人对围棋的理解方面,都产生了影响,这些都是Alpha Go Zero所创造的知识的价值体现。我们如何在知识的效用上,也就是在知识的语用信息层面上去衡量这种价值的大小呢?

知识内容的价值在运用中才能得到体现,“所有知识原初都只是服务于实践的目的,这是一个无可置疑的、要着力强调的真理”。(【1】P125)。显而易见,知识的内容越多,其可用范围越广。也就是说,在客观层面上,因果性知识由于其内容的丰富,效用要大于相关性知识,语用信息量也更高。

但是,知识的效用具有主观性,它与我们实践的目的密切相关。围棋知识对不下棋的人就没什么价值。因果性的医学知识可能对医学研究人员比较有用,但对于病人,甚至于对临床医生,统计数据类的相关性知识,或许更能帮助他们做出决定。Alpha Go每一步行棋的目标是胜率的提高,而不是围更多“地”,但是人类棋手不具备直观的概率判断本领,缺少类似Alpha Go价值网络的计算能力,所以,人类棋手无法将胜率的提升作为行棋的依据,他们更关注“势”和“地”,认为那才是围棋根本,将行棋的目标更多地放在了盘面“围目”上面。所以,对弈知识在取胜的“效用”上,人类棋手和Alpha Go不完全可比。

实际上,人工智能和人类在知识的使用方式上有很大的差别。比如,Alpha Go只会在经验到的、同样的棋局局面下使用围棋知识,而具有因果性思维的人类,借助逻辑推理,会分析这些下法的“棋理”,在其它的盘面情况下“融会贯通”。“我们可能从理论中获得比我们原来给予理论的更多的知识”(【2】P158)。目前的人工智只能进行非常简单的逻辑推理,它是用相关性思维使用知识,包括因果性知识的,只能直接使用因果性知识的部分结论,而对于因果性知识可以演绎出的其它结论,是“视而不见”的。人工智能可以根据药物的疗效统计数据使用格列卫治疗慢性白血病,但它不会知道这种靶向治疗的作用机理,也就不会懂得用这种药的治病原理去分析药物的效用,比如分析药物的副作用。所以,同样的知识对具备因果性思维的人类比对人工智能更有用。对不同的主体,知识有着不同的使用价值,正是由于知识的这种主观性,在语用信息层面上看,相关性和因果性两种知识的效用,就缺少了可比性。

我们在知识的三个信息层面上分析了两种知识在价值上的差别。知识的内容体现了知识的客观性,语义信息层面上,因果性知识因其内容的丰富而更具价值。也正是由于知识内容的客观性,因果性知识的效用也较相关性知识更高。但知识的效用又极具主观性,在语用信息层面上,两种知识需要对同一主体才具有可比性。至于语法信息层面,知识的概率大小与知识的因果性无关。总的来说,对同一认知对象,由于因果性知识在语义信息层面上有着相关性知识不可能具备的内容,语义信息量更大,从而其价值较相关性知识更高。

 

四、创造知识的代价与需求

在本体论的意义上,演绎推理并不能创造新的知识(【6】P10),它只是我们获得知识,运用知识过程的一个环节。无论是因果性知识还是相关性知识,都是由归纳过程产生的。人工智能的相关性知识是通过广义的统计过程(包括贝叶斯过程)完成归纳的,它完全是一个理性的计算过程;而人类的知识(包括相关性的和因果性的),比如科学理论的发现过程,则充满了灵感、顿悟等等的非理性。

Alpha Go获得相关性知识使用的是贝叶斯网络的隐马尔可夫模型,其数学的或逻辑的基础是贝叶斯公式,它是逆概率演算,也就是由结果的概率推导出原因的概率,与由结果或者现象归纳出原因的思维顺序一致。贝叶斯公式用来确定两个随机变量之间互为条件的概率之间的关系,它并不判定事物之间的关系是否具备因果性或相关性,而是认为这种关系的存在是概然的,并通过已经观察到的证据(数据),来推断因果或是相关关系存在的概率。

我们确实希望未来的人工智能在某些方面具备甚至超越人类的认知能力,但是开发具有人类智能或具有因果性思维的机器系统所需的投入也是可想而知的。创造知识的种类,所需要的条件、环境(最主要是数据量),某一领域中的研究已经到达的深度等等的因素,导致创造因果性、相关性两种知识的代价可能会有天壤之别,这样,两种知识的比较,就不能限于其价值方面,还应包括其发现的成本方面。

因果性思维善于发现、运用一因一果或者一因多果的因果知识,但现实更多的情况是一果多因或者多果多因。譬如,除了大气变暖,海平面升高还有没有其它的原因?一个疟疾病人痊愈了,除了青蒿素以外,还有没有其它因素?反过来,青蒿素除了能治愈疟疾外,还对哪些疾病有用?对于多重原因的情况,无论从理论还是实验的角度,都难以精确完整地通过因果分析发现所有的原因。用统计方法,包括贝叶斯网络来分析、发现相关性,相对来说可能更容易。要找到证券市场的因果性何其困难,当下我们能依靠的基本上都是相关性知识。

相比于因果性知识,相关性知识是人工智能发现的强项,在这些领域,发现相关性知识,代价更低,时间更短。一些程序性知识就比陈述性知识更容易被人工智能发现。Alpha Go Zero用40天的时间就已经发现人类1000多年来几乎全部的围棋对弈知识,但它发现的是“怎么下”的知识(knowledge-how),它还不能从棋理上解释“为什么这么下”的原因(knowledge-why)。在我们进入的这个大数据时代,人工智能为我们获取相关性知识提供了前所未有的便利和可能。

给人工智能提供第谷.布拉赫在天体观测方面留下的20多年的数据资料,说不定它也可以发现开普勒的三定律。但是,要像万有引力定律一样,定义出引力,再将所有物体的运动都诉诸这一定义,怕是仅具有相关性思维的人工智能不可能做到的。因果性知识,尤其是常识的发现,是通过所谓“小样本”情景下的学习获取的,机器没有这种基于因果性思维的小样本学习本领,所以现在让机器发现、拥有常识还是件很困难的事。

此外,即便是同样的知识结论,人工智能和人类的发现过程(代价)也可能不一样。拿围棋中的征子来举个例子。人类只要有了引征的概念,那他很容易由一个具备引征功能的“引征点”推论出一条“引征线”,再推论出包括六条“引征线”的引征区域上的所有点都可以引征的知识;而对Alpha Go Zero,就只能逐点,然后再逐条线去计算、发现整个引征区域上各点的征子功能,获得引征的知识。事实上,Alpha Go Zero是较晚学会征子、打劫等手段的,发现这样的知识,对它来说代价较高。

我们确实难以想象,Alpha Go Zero如何用相关性思维学会打劫、征子等等知识的。Deepmind承认,Alpha Go Zero之前的版本不得不把征子作为输入神经网络的特征之一。但是,Alpha Go Zero的神经网络,省去了征子特征的输入,没有为打劫、征子做任何特殊的算法上的处理。

总的来说,对同一事物,因果性知识价值高,其发现的代价也高;相关性知识的价值低,但发现相对比较容易,代价较低。我们衡量知识的价值不应该仅仅考虑其是否具备因果性,也不应该以是否创造出因果性知识去衡量判定人工智能的进展。

在许多决策过程当中,因果性知识不是必须的,我们可能只关心事物之间的相关性,或者只需要相关性数据就可以决定我们采取的策略。向什么人推送广告,只要有人群好恶的统计数据就行了,而不需要知道为什么这些特定人群喜欢这样的产品。日常公共交通的安排,根本不需要分析人流大小出现的原因。事实上,我们没完全解释清楚的、没有找到原因的许多知识都在用。我们可以先有了飞机上天(更多的是相关性知识),才出现了空气动力学;有了轮船下海,才有了流体力学。相比于 Alpha Go Zero,人类千百年来对围棋的探索经验,不过是一个「局部最优解」,但这些知识我们已经使用了千年。

AlphaGo在对阵李世石的比赛中,以非常稳定的1分钟1步的节奏下棋,之后的Alpha GoMaster在快棋比赛中每步几乎都在8秒以内落子,Alpha GoZero在对弈中也几乎没有机会进入到读秒阶段,所以,没有看到有关Alpha Go Zero与对手“打将”的报道,或许Alpha Go Zero还没机会学到围棋打将的知识,因为它没有读秒的需求。

顶级围棋赛事有着复杂的计时系统,Deepmind研究总监索尔·格雷佩尔表示是考虑到这个问题的,他说:“人类能进行复杂的时间管理。在困难的局面下,他们会思考更长时间,而在简单的局面下,他们花的时间较少。我们试图让Alpha Go也能做到这点。”现在看来,Alpha Go并不擅长何时停止思考,完成落子。基于强大的运算速度,Alpha Go Zero没有读秒的需要,从而也缺少了这方面的经验。打将和打劫一样,分别被认为是棋手在时间和空间上的腾挪。因为有需求,Alpha Go Zero对打劫学习、运用得很好(在和柯洁的三番棋的第二局,完全可以看出AlphaGo对于劫材个数、大小判断的精准),或者说打劫对Alpha Go Zero很有效用,知识的语用信息量很高;而因为没有需求,Alpha Go Zero可能至今还没学会打将。

给定一个围棋局面,高手能讲出一些黑白方优劣的道理,但在AlphaGo的眼里,局面和胜负只有相关性。Alpha Go特别喜欢把人类棋手习惯“保留”的地方走掉,这大概是为了满足它自己减少不必要的随机,提高评估准确性的需求,而未必符合人类的棋理。从先期版本的Alpha Go的表现看,一些人类的知识还成了它提高技艺的制约。Alpha Go能拥有的,也是它需要的,只是人类知识推理的结论,它能够加以运用的是事物的相关性。

阿佩尔和哈肯使用巨量的自动运算完成了四色定理的证明以后,没有人能够检验证明的所有步骤,这曾引起大量的争论。但这些争论几乎不涉及到定理的真实性或者证明的正确性。这反映出,除了“定理是正确的”这种知识以外,人类还想要理解定理。同样,对量子力学的结论已经没有太多的疑义,但对这些结论的“诠释”却还存在多种争议。获得逻辑上的一致是人类的一种持续的需求,实际上,整个世界3都是因我们的需求而产生的,比如,求真诞生了科学,求善诞生了宗教,求美诞生了艺术等等,需求激发出主体的创造力,成就了这些精神产品。

Alpha Go Zero的诞生充分说明了知识产生于需求,产生于问题,而不是像先验论所认为的产生于先天的理性。Alpha GoZero除了“先天的”逻辑、数学运算知识外,它不具备因果、抽象等基本的人类理性,不具备不证自明的公理、前提。但是,没有理性的指导,Alpha Go Zero也可以开始“实践”,产生经验,创造知识。舍恩伯格在《大数据时代》里说,大数据的特征有三:全样而非抽样,效率而非精确,相关而非因果。包括现代的经济学、医学等等众多的经验事实,特别是兴起的大数据,使得事物间相关性分析成为获取知识的另一个重要的思维方式。棋手们需要、希望在对弈中考虑到“全局最优”,而这对于有限计算能力的人类来说很难,此时,人工智能依赖强大的计算能力,就可以在一定的程度上满足我们的需求。我们现在更需要的是在某些方面,特别是在人的思维的弱项上,得到人工智能的帮助。

早期的人类不是不去探究事物的因果性,而是那时人类没有这样的需求或能力。所以,应该依据我们当时的需求和认知能力(代价),根据对事物已达到的认知阶段,尽可能地拓展我们知识的获取渠道,包括通过人工智能获取知识的渠道。我们不应该以因果性来贬低相关性知识,也不应该以人类知识来贬低人工智能发现的知识。两种知识在认知水平的不同价段,主导我们的实践活动。

 

五、知识论眼中的人工智能

我们已经分析了,知识只有通过人,才能完成对世界的改造;反过来,世界呈现的事实,只有通过人,才能归纳、总结、添加、修正知识,从而改变了世界3。世界3只能与世界2发生直接相互作用,“在人类的水平上可称为第二世界及精神世界的那些东西,越来越变成第一世界和第三世界的中间环节:我们在第一世界中的一切活动都受到我们的第二世界对第三世界的了解程度的影响”(【2】P159)。所以,波普尔认为人或者人的意识是三个世界之间相互作用的中介,“……,我提出一切都取决于我们和我们的作品之间的给—取关系,取决于我们提供给第三世界的产品,也取决于产品对我们的经常的反馈,可以通过有意识的自我批评来增强的反馈”(【2】P157)。这一给一取,也就是世界3的一进一出,都经过了人类的中介。

这样,我们自然要问,人工智能能否担当这样的中介。目前的人工智能,包括Alpha Go Zero就已经给了很好的回答:在某些领域,①人工智能完成了知识的创造(给);②、人工智能学习、运用了已有的知识,包括人类创造的知识(取)。也就是说,在一些领域,人工智能充当了人类智能的角色,达到甚至找过了人类的水平,成为人类在认知意义上的有力工具。

工具改变了人类作用于世界的方式。北京邮电大学的钟义信教授认为,人类创造使用的工具分成了三大类,实物工具、能量工具、信息工具。实物工具改变施加在对象上的力的性质、大小、作用方式,帮助人类克服体力的限制,比如杠杆、车轮等各种器械;能量工具转化能量的形式、作用方式和效果,帮助人类克服体能上的限制,比如风车、电动机等各种机器;信息工具改变人类获取、处理、利用信息的方式,帮助人类克服智能上的限制。以往的信息工具,比如,狼烟、纸笔、指南针、计算机、互联网,只是为人类获取、处理信息提供了帮助,这样的工具还不能从信息中提炼出知识,并自主对知识加以利用。人工智能与以往信息工具的根本区别在于,它对知识的创造和运用,自行完成判断和决策,在波普尔的“给”、“取”两个方面成为三个世界之间中介的能力。所以,在认识论层面上看,目前的人工智能是人类工具进化的又一个层次,是人类的“认知放大器”。

当然,与人类相比,由于因果性的缺乏等原因,人工智能充当这种中介角色,还有不小的缺陷。人工智能的预测范围无法超越历史训练的数据集,它只能适应和过去经验极为相似的新情况,这成为人工智能发展的瓶颈。前百度公司首席科学家吴恩达认为,“机器只能从事很窄领域里的工作,并且可以在这些领域里超越人类,但要人工智能拓展到相关领域非常困难”。从相关性到因果性,通往通用人工智能的道路上存在着的一道鸿沟。2011年图灵奖得主,贝叶斯网络之父Judea Pearl认为“几乎所有的深度学习突破性成果,本质上来说都只是些曲线拟合罢了。人们应该更关注人工智能中的因果推断,这可能是实现真正智能机器的必由之路”。那种认为在大数据时代,相关关系替代了因果关系,因而因果关系消失了的观点,是站不住脚的。

在通用人工智能(AGI)的定义上,业界主要存在三种观点:

1、认为“AI”的行为表现应该与人完全一致。

2、认为“AI”应该能够解决一切过去只有人才能解决的问题。

3、认为“AI”应该具有与人相同的认知功能。

我们将它们分别称为AI1、AI2和AI3。AI1无非就是一个能够通过图灵测试的计算机系统,它是被阐释得最为彻底地一类人工智能。哲学家约翰.瑟尔,用中文房间悖论对图灵测试发起诘难,认为图灵测试运用了纯粹行为主义方法,并不能真正回答测试是否满足通用人工智能标准的问题。目前人工智能领域的研究的主要方向已经不是AI1, AGI主流研究将“AI”重新定位在AI2。确实,从成功解决问题的角度看,机器翻译、图像识别、知识问答等方面的准确率已经超过了人类;仅仅拥有相关性知识的Alpha Go Zero战胜了既具备相关性又具备因果性的人类,但是,正如我们上面分析的,至今AI2解决的问题仍然限于某一特定的应用领域。

笔者认为,作为人类的信息工具,AI3才准确诠释了通用人工智能。按照波普尔认识论观点,认知功能体现在与世界3的互动之中,而认知功能相同并不要求认知方式也相同。我们前面举过的围棋“引征”等例子就说明,Alpha Go Zero可以用相关性统计的方式获得与人类因果性知识相同的结论(命题)。飞机飞行可以不像鸟类一样,那机器思维为什么一定要像人类一样呢?彼得.诺维格在《人工智能:一种现代方法》一书中指出:“当莱特兄弟和其他人不再模仿鸟类飞行,而是开始研究空气动力学的时候,人类对“人工飞行”的探索才算是取得了成功”。短期内还看不到人工智能建立起因果性思维的本领,但我们不应由此否定人工智能的发展。

事实上,因果性知识更多地集中在科学技术当中,而许多如艺术、宗教等领域的知识都是非因果性的,或者说是非理性的,人类有着广泛的非理性认知成果,我们不应该排斥认知过程中的非因果的认知。我们不确定通用人工智能可以仅仅建立在相关性思维的基础上,它也不应该只具备单一的思维方式,但是,因果性未必是通向通用人工智能的唯一途径。或许,人工智能可以用非人类的认知方式达到甚至超越人类的认知能力,人工智能不应该排斥这种非人类的思维方式,虽然确实没有看到任何证明其存在的证据,但我们不能否认这种可能性。

波普尔认为,知识的自主性,决定了知识有它自己的进化之路(【2】P123)。而人工智能作为“基于知识的系统”(【3】P143),其进化终将能够自主完成。那时,智能机器可以制造出比自身智能水平更高的机器,然后这些更智能的机器还能继续制造出更加智能的机器,这符合《生命3.0》的作者迈克斯.泰格马克对生命、智能的定义。其实在1975年,约翰.霍兰德就提出了著名的遗传算法理论。他认为,不依靠单独编写解决问题的程序,而是让一组程序通过自身的演化(根据某些算法)而变得能够更有效的发现解决问题的方法,这才是智能的本质。人类既不帮助也不阻止,即,没有人的参与,机器自我复制成功的那个时间点,才是所谓的“奇点”,在这个时间点上,人工智能将摆脱作为工具的宿命。

 

 

参考文献:

【1】(德)M.石里克,普通知识论,北京:商务印书馆.2007.

【2】(英)卡尔.波普尔,客观知识,上海:上海译文出版社.1987

【3】(加)赫克托.莱韦斯克,人工智能的进化,北京:中信出版集团.2018

【4】(英)大卫.休谟,人类理解研究,北京:商务印书馆,1982

【5】(美)尼尔斯.尼尔森,理解信念,北京:机械工业出版社.2018

【6】赵明达,理论的竞争——信息科学视角下的休谟问题,吉林:吉林出版集团股份有限公司,2019

相关性知识成就了Alpha Go Zero_第1张图片

作者简介:赵明达,毕业于华中科技大学信息工程专业,曾发表《终极通信》等文章多篇,2019年出版专著《理论的竞争——信息科学视角下的休谟问题》。

你可能感兴趣的:(相关性知识成就了Alpha Go Zero)