摘要:人工智能取得成果斐然,但是现阶段的人工智能体还远未达到接近人类心智的水平。在面对复杂环境下,计算体系中的人工智能水平有限,无法发挥其特点。智能是一个复杂系统,在追求算力与算法实现人工智能应用的时代,人在与智能体的合作中的作用不可忽视。机的能力价值(计算)与人的能力价值(算计)协同系统还需研究。本文通过不同角度分析机器的计算逻辑以及人类“算计”的认知能力,探究其能力与不足,并且提出计算-算计模型。为人机混合智能提供一种可行架构。
关键词:人工智能;认知;计算-算计;人机混合智能
一、引言
现如今,人类对人工智能还未下确切的定义,但是一个符合大多数人观点的定义,提到人工智能就是让计算机完成人类心智能做的各种事情。从上世纪40年代图灵的人工智能预言,到上世纪80年代专家系统的开发,再到如今三大主义分支的人工智能应用渗透到人类生活的各个方面[1]。其中,联结主义强调模仿大脑皮质神经网络以及神经网络间的联结机制,即用多隐层的处理结构,处理各种大数据;行为主义以模仿人或生物个体、群体控制行为功能为主,主要表现为具有奖惩控制机制的强化学习方法;符号主义强调以物理符号系统来产生智能行为,主要应用为知识图谱的应用体系。人工智能的应用取得了一定成果,但是其存在不可忽视的缺陷。联结主义下的深度学习算法不可微分,计算收敛性较弱,在开放的动态环境下效果较差,其模型本身是一个“黑盒”[2]。行为主义的强化学习将人的行为过程看的过于简单,实验中只是测量简单的奖惩反馈过程。其次行为主义研究可观察行为,往往忽视心理的内部活动,否定意识的重要性,将意识与行为对立。符号主义及其知识图谱遇到了如何定义“常识”问题以及不确知事物的知识表示与问题求解问题。
要让人工智能接近人类的心智,还需要探索何为智能。大部分对智能的定义有一个共同特点:智能是解决问题的能力,更复杂的问题需要更高水平的智能。相比于加减法,求解微分方程需要更高的智能水平;相比于井字游戏,会下一手好围棋需要更高的智能水平。但是,机器能够求解某种特定问题,并不是意味着机器具有较高的智能水平,哪怕这种问题非常复杂[2]。将目光转向人类的神经网络。神经网络常常简化为感知器,中枢,效应器组成的系统单元,且三个系统每一个都有许多神经元组成,互相之间都有反馈。以目前的神经科学分析手段,该模型是正确的,但是人们往往忽略了外界信息与体内信息的比例。人们常常将该系统简化为输入输出系统,实际上神经系统接收内部信息的感受器是接受外部信息感受器的10万倍[4]。也就是说,神经系统在整体上更像一个自我封闭系统。而且,正式神经网络的封闭性,使得建构主义可以推出客观存在不能离开建构者的哲学理论[5]。机器作为客观存在,解决问题离不开人类。所以说,实现完全脱离人类的通用人工智能系统是不现实的一个课题。本文将在后面章节提出计算-算计模型的人机融合系统。
二、人机融合智能
人工智能虽然在各特定领域的应用越来越广泛,但人们对通用人工智能的呼声愈发明显,不再满足于“弱人工智能”有限的能力。计算机发展到今天,算力已经大幅提升,量子计算机又会将算力提升几个数量级。于是我们转而思考人类智能的本质、来源,试图从认知神经科学等方面找灵感来理解意识,希望赋予人工智能自主意识,但收效甚微。更为实际可行的方案是人机交互融合,充分让人的意识思考即算计与机的逻辑计算有机地结合起来,让机在融合中去学习理解人的算计能力。人机融合智能将开启新的智能时代。
什么是人机融合智能?简单地说,就是着重描述一种由人、机、环境系统相互作用、充分利用人和机器的长处产生的新型智能形式[6]。它既不是人的智能,也不是人工智能。人机融合智能不是简单的人机结合,而是要让机器逐渐理解人的决策,让机器从人的不同条件下的决策来渐渐地理解价值权重的区别。人通过对周围环境的感知加上自己的欲望冲动形成认知,而机器只能对周围环境获取数据、信息,通过特定的数据触发特定的执行过程,将人的认知能力与机的计算能力融合起来,建立新的理解途径,进而做出合目的性合规律性的决策,产生出“人x机”> “人+机”的效果[7]。
如何实现人机有机融合?目前的人机融合智能还处于初级阶段,仍有一些关键问题需要解决,其中最关键的是如何机器的认知能力与机器的计算能力有机地融合[8]。当下处于实际应用阶段的人机系统人和机器的分工明确,主要是机器将数据显示给人,人通过界面操作机器,并没有产生有效的融合。人的思维决策过程是在不断接收外界信息的基础上,通过感知理解、联想想象将外界信息内化为自己的知识或者经验常识,这也是学习过程,进而在遇到问题时可以调用自己的经验常识,并借助灵感直觉等对问题进行分析理解。而机器则不具备这种对外界信息的抽象和非理性思考的能力。所以,融合的关键是要在认知水平提升机器的知识理解和学习能力,这样人和机器就能在认知水平进行沟通交流——融合。人的联系、想象表现为对一个问题或者知识的抽象和迁移,这样才能由跨域解决不同领域的问题,越是抽象的表征越能够进行普适的迁移能力,可突破思维的局限。人类通过先验知识的内化可完成非公理的直觉意识,机器则只是在理性逻辑下处理客观数据。让机器提升认知能力则是人机融合能够平滑的关键。
人机融合智能另一个需要考虑的关键问题是介入,即人机融合的时机与方式[8]。当人的突然介入,或者人和机在对周围环境信息的感知处理出现不对称的情况进而导致的人和机所作出的决策有冲突时,系统该如何决断。在人机各自的决策冲突时,还会有可解释的问题,即一方该如何对自己的决策做出解释进而说服另一方。另外,人机融合中,机因为外界信息不足或者自身一些原因导致的历史决策中正确率不高,这时便会有人对机的信任问题,在一些特殊场景如军事应用中,决策失误的可容忍度是非常低的。如果在一般场景中,机的决策正确率很高,长此以往,又会导致人的依赖性过高,容易造成人性中的自信、果敢、勇气等优良特性丧失。
人机融合的表现即人机沟通的方式有人机交互界面、辅助决策和人机功能分配等。人机之间应建立高速、有效的双向信息交互关系,避免信息不对称等问题。机擅长从周围环境中态势感知出更多定量、具体的信息,处理后应以简洁直观的方式呈现给人,人做出的思考、决策也应该可解释、有逻辑的应用于机。现有的在航空、核电、空管等领域应用的人机功能分配多是根据一些自动化水平量表[9]做出的静态分配,通过一定系统相对合理的将不同的功能按人和机能力进行分配。对人机功能实行合理的分配,可充分利用、结合人机各自的优势,体现人机融合系统的智能化。
三、计算-算计模型
3.1 计算简述
理解知识是理解智能的源头。古代中外哲学家注意到术语、名词、概念的内容是因人而异的。例如老子曾说“道可道,非常道;名可名,非常名”。柏拉图也曾认识到,语言和概念的模糊性和易变性难以描述永恒不变的实体。但是哲学家们在知识的不确定中也在尝试解释宇宙万物的统一性,认为存在一种永恒的,普适的,客观的自然规律,道家把它称为“道”或“太一”。而柏拉图发明了“理念”,“形式”,并且正式提出同一性问题。这也标志着哲学的诞生。柏拉图在此基础上提出的诸多问题主宰者2000年的哲学潮流,诞生了诸多学说,但是意见的意见仍然是意见。导致这种意见众多却无法解释的现象,原因在于没有解决问题的工具。
建造测量理性和思维的工具,从亚里士多德的三段论系统开始。通过给定的初始前提,三段论系统可以推导出结论。但由于亚里士多德提出的该逻辑较为粗糙,无法表述有价值的逻辑推理。随后,数学家们在逻辑,计算,概率论,博弈论中的研究工作,不仅提高了人类的生产水平与认知水平,而且为现阶段的人工智能提供了工具。19世纪,布尔提出了布尔逻辑,即命题逻辑,随后,弗雷格扩展了布尔逻辑,创建了一级谓词逻辑。通过引入关系谓词符号、变量以及量词,就能表述演绎规则。当人类将焦点聚集在弗雷格逻辑时,发现了若干漏洞,其中一个漏洞是没有把逻辑概念与集合论概念分解开。为此,希尔伯特在20世纪20年代去掉了罗素逻辑(罗素曾完善弗雷格逻辑的“说谎者”漏洞)中所有专门针对集合概念的部分,专门构建了“谓词逻辑”并沿用至今。因此,如希尔伯特所说,数学无需再用数字,几何图形等传统研究符号来描述,甚至可以用啤酒,凳子等毫无关联的符号来研究数学。通过抽象符号,用逻辑证明来定义数学,由此数学变成一种普适逻辑。1908年,策梅洛专门针对集合论提出公理。1930年,哥德尔证明任何理论可以转化为集合论,使得集合论本身具有了本体论中立性。
随后,希尔伯特提出了算法的判定性问题:有没有一种算法,能够判定在谓词逻辑下的命题是否可以证明成立?1936年,丘奇,图灵,克莱尼分别独立证明,这样的算法是不存在的。由此推理出停机问题无法用算法解决。对于希尔伯特判定性问题而言,不存在判定一个谓词逻辑命题是否可证明的算法。这一定量被称作丘奇定理。换而言之,其说明了计算和推理是两码事:某些数学问题无法用计算解决,只能通过推理解决。丘奇、图灵定义的“λ演算”和“图灵机”就是通用计算,这一观点也被称为“丘奇——图灵论题”。1978年,英国数学家、逻辑学家甘迪提供了丘奇论题的物理形式证明。他假设:a. 信息的密度是有限的;b. 信息的传输速度是有限的。在经典的三维空间中,“丘奇——图灵论题”的物理形式是成立的。甘迪的论证说明大自然之所以被数学化,仅仅因为信息的密度和传播速度是有限的。联想到相对论关于光速有限的假设以及最小作用量原理,这样的结论在令人惊奇之余又不违反物理原则。因此,我们可以用算法来进行各种学科和知识的探索,并以人工智能的方式出现在今天的科研、制造、生产、商业、服务和消费行为中的原因。
现有的人工智能技术均是依赖于现有的计算体系,达到模仿人类心智的人工智能体系还未建立。在现有的计算体系下,人工智能能够表征一部分人类理性思维特质,而非理性,甚至非逻辑性的思维特性如何表征,是人工智能发展的一大突破口。
3.2 算计简述
计算的局限性无法通过图灵机突破,所以对人的非理性、非逻辑思维解构与在机器上的重建就有非凡的意义。从对人的认知模式的理解,尝试解释人的认知能力和构建出能学习、推理的认知模型,已经在一些应用领域取得不错的效果。再后来的对意识的理解构建出的意识图灵机[10]在处理问题时能做到其思维过程的意识觉知。即便如此,我们对人类的思维过程的模仿依然显得很拙劣,对人类的直觉、灵感、顿悟等能力的模拟还是没有好的方案,更别说人类特有的责任、价值的理解。
3.2.1 认知模型
认知模型是对人类认知能力的理解并在次基础上构建的模拟人的认知过程的计算模型。这里认知模型中的认知能力通常包括感知、表示、记忆与学习、语言、问题求解和推理等方面[11]。为了能够构建出更加智能的机器,我们便希望从人的身上寻找灵感,同时也是更好地探索和研究人的思维机制,特别是人对周围信息的感知处理机制,进而可为打造出真正的人工智能系统提供新的体系结构和技术方法[12]。Duch[13]根据记忆和学习的不同将现有的认知模型分为三类:符号化(Symbolic)认知模型、浮现式(Emergent)认知模型和混合型(Hybrid)认知模型三种。粗略地讲,符号化认知模型侧重于利用高阶符号和陈述性知识,采用传统人工智能的自上而下的分析方法来处理信息,如SOAR、EPIC、NARS等;浮现式认知模型则利用低水平的激活信号流经由无数处理单元组成的网络,采用一种自下而上的处理,这种处理依赖于浮现式自组织属性和连接属性,如IBCA、NOMAD等;混合型认知模型则将这两种方式结合起来,具备符号化认知模型和浮现式认知模型的某些特点,如ACT-R、LIDA、4CAPS等。
3.2.2 意识图灵机
意识图灵机 (Conscious Turing Machine, CTM)的灵感来源于图灵的简单而强大的图灵机。与前文提到的对大脑或者思维认知的构建提出的认知模型不同,意识图灵机是针对意识的构建的简单数学模型。认知神经科学家巴尔斯提出的全局工作空间理论[14]概述了对意识的理解,再有一些脑中神经相关物的研究,基于此布鲁姆提出了意识图灵机。意识图灵机能够在处理信息过程中对意识内容产生意识觉知,能够体验感觉而不仅仅是模拟感觉,提出这些感觉产生的可能方式,如痛苦和快乐。意识图灵机适合对其所做的高级决策做出解释,这就为人工智能的不可解释性问题的解决提供了思路。另外,我们认为在意识图灵机中有意识和自由意志的感觉,以及幻觉和梦境的体验。
3.2.3 算计
人机融合智能系统不仅需要机器的强计算能力,更重要的是人的智慧,是一种理性与非理性、机的计算与人的算计深入融合的智能系统。机的客观数据采集输入、逻辑推理和决策输出已经在应用中大展拳脚,而对于人的认知决策过程还需要进一步理解建模,才能实现算计能力。
算计也即盘算,筹划谋算;对事情的经过或结果进行仔细而从容的反复思考;考虑。近义词为:权衡、谋略、谋划、打算、计划、筹划、策动、策画、贪图、希图、希望、蓄意、野心、阴谋、妄图、妄想、企图、打定、准备、预备、筹算。算计也即人们对于做什么之慎思斟酌,对应于英语中的deliberations,weigh up,weighings,plans,strategies。
认知是人获取和应用知识的过程,知识图谱是人对客观世界的各要素之间的理解进而尝试表示的一种形式,在目前的人工智能应用中已有良好的表现。在简单问答数据集上的问答能力已经可以和人类相媲美,但是对于复杂的问题依然无能为力。这是因为复杂问题需要多跳的表征和推理。在算计中,与计算上仅仅依靠硬件传感器采集到的数据进行输入、表示过程不同,算计需要基于目标驱动和价值驱动对数据进行动态表征。如今的深度学习系统中并没有恒定的知识表征,对不同的学习数据就会有不同的表征形式,并没有基于其自身的原点对数据进行不同事实甚至责任、价值的划分。而人类的大脑中存在“参考系”的恒定表征(参考系为位于大脑皮层的上层),人类是基于自身的观念如欲望、义务对于不同的事实数据进行表征理解。在计算、算计的不同表征中,连续特征空间为人(算计)的认知内容,离散语义符号空间代表机(计算)的感知系统,二者之间还应存在一种连续的准语义空间。我们可以通过上升(raising)操作将连续空间中的特征表征迁移到准语义空间中,进而通过抽象操作将准语义空间中的表征迁移到离散语义符号空间中。反过来,我们可以通过嵌入、投影,将离散语义符号空间中的表征迁移到连续特征空间。这样一来,我们就构建了一种感知、认知相结合的通道。数学的表征常常涉及具体事实抽象化,其推理内容则严格按照逻辑来进行,这当然不可或缺,但总是有非理性非逻辑的存在。简单问题,通过一定知识图谱表示和问题求解程序在现今的人工智能系统下就能实现求解,但复杂问题往往需要多跳的推理。这种多跳的推理不仅是计算中的映射,更重要的是一些非逻辑的漫射(如发散思维)、影射(如联想想象)等。人类的推理常常具有试探性,是经过多次试错、根据结果反馈而又校准之后进行下一步实施,而现有的人工智能的逻辑推理缺乏这种主动的试错性,这就在最后的决策过程上使得效果欠佳。有人提出了基于图的可解释认知推理框架,即以图结构为基础,将逻辑表达用作对复杂问题的分析过程,从而表示成显示的推理路径。可是图的结构化必然会过滤掉一些非结构化的隐信息,是可以一定程度上解释迁移性,但更像是一种“硬解释”,似乎整个结构就是为了推理过程服务。算计的弹性推理不仅需要知识驱动和数据驱动的联合,更有价值和责任的引领,这样在推理过程中才会有非理性的洞见、直觉等表达。计算的决策输出则是根据逻辑推理的结果或者大数据、概率的优化产生,而算计却可做出一些不合逻辑或多逻辑组合的意向性表达。计算的处理是从事实到新的事实,而算计则是可以实现从事实通过动态表征和弹性推理实现价值体现。
3.3 计算-算计模型
本文根据现有的计算及认知领域成果,提出计算-算计模型,如图1所示。这里有个前提,由人、机、环境构成的系统智能不仅仅包涵数学、计算机科学、心理学、哲学等领域,它还涉及到其它诸多学科融合的复杂系统。既具有“确定性”,同时也具有“随机性”。在此,本文不对人机环系统进行更加细致的客观描述,只是对其进行可行性的模型预测。
态势感知层内包含环境信息。环境包括自然时空与社会时空内的环境,一切问题的源头来自于自然与社会,也可以说人类知识的来源也是如此,此环境包含了确定以及不确定的成分。除此之外,态势感知层还负责态势信息的收集与感知处理。数学领域的微积分类似于这一过程,通过将已知数据进行处理,从而接近问题答案。指挥与控制领域的情报收集与分析领域同样是对信息的感知处理,相对于数字与微积分符号,情报的量化更加复杂,更多的是交由经验丰富的指挥员处理。传统的自动化方法及机器学习算法可能会导致“回路外”错误,因为人类对任务的态势感知度较低,因为人类对任务以及环境的感知有很大程度基于经验,使容易产生自满情绪或缺乏警惕性。环境的不确定反馈也会对回路外的问题产生影响,这凸显了在紧密结合与松散结合的人机环交互之间实现平衡的重要性。现如今,算法处理后的数据可解释性下降,使得人类困于“回路外”,同时也产生人类对智能代理的(agent)信任度下降问题。
认知决策层类似于对态势感知信息的深加工,其不仅仅取决于人的传统意
义上的认知,同时也需要机器推理的能力。人类的推理基于直觉,逻辑,关联等认知能力。算计的思想包含于其中。20世纪80年代专家系统盛行,基于人工智能的专家系统风靡一时,机器可以进行简单的问答,但是问答内容局限性较强。主要原因除了计算能力外,还有机器被授予的推理能力基于一对一,一对多,多对一的知识映射关系。如何实现在动态表征下的弹性推理,在具备足够硬件算力条件下是值得被考虑的问题。并且将动态表征下的知识进行散射、漫射、影射,实现多跳推理,是实现该问题的关键。模糊逻辑提供一个或多个连续状态变量映射至相应类别进行推理和决策的框架;神经网络利用程序,在大型典型案例数据库的训练过程中学习到的可变互联权重来进行的知识表达的算术框架;遗传与进化算法在进化遗传学的启发下,采用重复仿真的方法,缩小潜在的选项范围,选择最优解决方案。人类通过人机交互界面与机器交互,机器给予人类辅助决策。实现机件人化是人机融合中迈出的一大步。
目标行为层主要体现在人机混合决策。当出现更高水平的智能体时,人类
永远处于决策的最高层,这是在许多领域达成的共识(在目标追求低人力成本条件下例外)。意义建构是对真实世界中的生存至关重要,很多研究表明人类努力建构这个世界中的对象,事件和态势的意义。人类较为擅长迹象解读,对人类而言,建构是一种心理活动。为了使得机器有效与人类合作,机器与人类的反应与决策应当将相同对象、事件或态势解读为相同的迹象,或者获得相同的意义。机器的辅助决策在必要时刻同样需要提供更完整的意义建构,达到人机混合决策的目标。
四、总结
人机融合智能是人工智能发展的必经之路,其中既需要新的理论方法,也需要对人、机、环境之间的关系进行新的探索。人工智能的热度不断加大,越来越多的产品走进人们的生活之中。但是,强人工智能依然没有实现,如何将人的算计智能迁移到机器中去,这是一个必然要解决的问题。我们已经从认知角度构建认知模型或者从意识的角度构建意识图灵机,这都是对人的认知思维的尝试性理解和模拟,期望实现人的算计能力。计算-算计模型的研究不仅需要考虑机器技术的飞速发展,还要考虑交互主体即人的思维和认知方式,让机器与人各司其职,互相融合促进,这才是人机融合智能的前景和趋势。
参考文献
[1] Boden MA. Ai: Its Nature and Future[M] , Oxford University Press UK; 2016.
[2] Collobert R, Weston J,Bottou L, Karlen M, Kavukcuoglu K, Kuksa P. Natural language processing(almost) from scratch[J]. Journal of machine learning research.2011;12(ARTICLE):2493− 537.
[3] Lee D. Birth of Intelligence: From RNA toArtificial Intelligence[M], Oxford University Press; 2020.
[4] Segal LX. The dream of reality: Heinz vonFoerster's constructivism[M] Springer Science & Business Media; 2001.
[5] 金观涛《系统的哲学》[M] 鹭江出版社,2019.
[6] 刘伟. 智能与人机融合智能[J]. 指控信息系统与技术,2018,9(2):1- 7.
[7] 刘伟. 追问人工智能:从剑桥到北京[M]. 北京:科学出版社,2019,10:10-17.
[8] 刘伟. 人机融合智能的现状与展望[J]. 国家治理,2019,220(04):9-17.
[9] CUMMINGS M L, BRUNI S, MERCIER S, et al. Automation Architecture forSingle Operator, Multiple UAV Command and Control[J]. International C2 Journal,2008(2).
[10]Manuel B, Lenore B. Atheoretical computer science perspective on consciousness.[J] Journal ofArtificial Intelligence and Consciousness 8.01(2021):1-42.
[11]Samuel B. Wintermute.Abstraction, Imagery, and Control in Cognitive Architecture[D]. Michigan:University of Michigan,2010.
[12]Pat Langley, John E. Laird,Seth Rogers. Cognitive architectures: Research Issues and Challenges[J].Cognitive Systems Research,2009,10(2):141-160.
[13]Wlodzislaw D, Richard J.Oentaryo, Michael P. Cognitive Architectures: Where do we go from here? [A].In: Proceedings of the 2008 conference on Artificial General Intelligence[C].Netherlands, 2008: 122-136.
[14]Baars, B. J. (1997). In theTheater of Consciousness: A rigorous scientific theory of consciousness.Journal of Consciousness Studies 4, No. 4, 292-309.