写这本书的初衷还是得从剑桥图书馆说起,自从来到剑桥逐渐适应了这里的环境和学术氛围以后,除了与朋友们聚会聊天,就是准备好矿泉水和面包,到学校各个图书馆里去看书、找书、借书了。记得那是2013年春天的一个下午,阴雨连绵,风呼呼地刮着,在剑桥大学图书馆的顶层,空无一人,静的有点瘆人,按图索骥,终于找到了那本1948年诺伯特·维纳发表的《控制论--关于在动物和机器中控制和通讯的科学》,心里很是激动,忘了时差,随即就给谭文辉(本书的第二作者)拨通了手机告知……。
是啊,时至今日,控制论的思想和方法已经渗透到了几乎所有的自然科学和社会科学领域,维纳把控制论看作是一门研究机器、生命社会中控制和通讯的一般规律的科学,更具体他说,是研究动态系统在变化的环境条件下如何保持平衡状态或稳定状态的科学(他特意创造“Cybernetics”这个英语新词来命名这门科学。“控制论”一同最初来源希腊文“mberuhhtz”,原意为“操舵术”,就是掌舵的方法和技术的意思,在柏拉图的著作中,经常用它来表示管理人的艺术)。尽管维纳也意识到了生命、社会中的反馈不完全是可计算的,但是,在他的控制论中,却是用基于客观数据或事实的反馈机制作为控制的核心,这恐怕与植根于西方科技还原思想有关(即万物是由基本微粒(分子、原子等)构成的,并且万物皆数),事实上,东方传统思想中,除了类似的还原论(如金木水火土)外,还有涉及到天人合一的整体观和系统论,落实到控制上,不妨认为一个人机环境系统不但要有客观事实数据的反馈,还应包含主观价值责任的反馈。无独有偶,对于1948年香农提出的以信息量多少的统计公式为代表的信息论理论(见其1948年发表的《通讯的数学理论》一文)也有同样问题,即只注重客观事实数据的多少而忽略了其所包含信息价值的大小,于是在当前许多领域都出现了DRIP(Data Rich Information Poor)现象——数据丰富信息贫乏。再进一步看,1948年,得到学术界重视的L.V.贝塔朗菲在美国讲授“一般系统论”虽然把研究和处理的对象看作一个整体系统来对待(从本质上说明其结构、功能、行为和动态,以把握系统整体,达到最优的目标),但其本质上仍是以计算为主的数学描述过程,没有深入发掘非数学非计算的因素和过程。通过上述,我们可以看到传统的控制论、信息论、系统论都存在着还原为主系统为辅的失衡状态,在进入智能时代的背景下,这种局面愈演愈烈,这在一定程度上也说明了为什么说当前AI距离智能越来越远的原因。鉴于此,本书将尝试做一些边缘性的研究和探讨,希望能够把西方的科技优势与东方的智慧思想取长补短、相得益彰,使二者有机地结合起来造福人类。
当前,人们常常会问及“人是计算机吗?”、“什么是智能?”、“智能是什么?”这样的问题,答案往往却是众说纷纭、莫衷一是……,其中不少人认为:智能不仅是规则和概率,智能也可以反规则和反概率,智能虽然具有随机性和不确定性,但同时也具有决定性和必然性,追根溯源,智能的本性就是人类的本性,所以通过研究人的本性才能够体现并观察智能的可能性和复杂性。
哲学家休谟认为:“一切科学都与人性有关,对人性的研究应是一切科学的基础。”任何科学都或多或少与人性有些关系,无论学科看似与人性相隔多远,它们最终都会以某种途径再次回归到人性中。从这个角度来看,人工智能“合乎伦理的设计”很可能是黄粱一梦。伦理对人而言还是一个很难遵守的复杂体系,对机器而言则更加难以理解。在人工智能领域,“合乎伦理设计”或许是科幻成分多于科学成分、想象成分多于真实成分。
当前的人工智能及未来的智能科学研究具有两个致命的缺点,即把“数学等同于逻辑”和“把符号与对象混淆”。人机混合的难点和瓶颈也因此在于(符号)表征的非符号性(可变性)、(逻辑)推理的非逻辑性(非真实性)和(客观)决策的非客观性(主观性)。
既是…又是…,既是…又不是…,阴阳“怪”气,是非“不”分,让to be or not to be 变成了 to be and not to be,这是数理逻辑的命门,也是智能逻辑的生门,量子物理已把这扇紧闭的大门撬开了一丝缝隙,也为打开人机环境系统智能之门准备好了基础:非同一律、矛盾律、非排中律与同一律、非矛盾律、排中律应该是一样客观存在的,只不过我们在黑暗里常常习惯了闭上眼睛……
真正智能领域的瓶颈和难点之一是人机环境系统失调问题,具体体现在跨域协同中的“跨”与“协”如何有效实现的问题,这不仅关系到解决各种辅助决策系统中“有态无势”(甚至是“无态无势”)的不足,还涉及到许多辅助决策体系“低效失能”的朔源。也许需要尝试把认知域、物理域、信息域构成的基础理论域与陆海空天电网构成的技术域有机地结合起来,为真实有效地实现跨域协同打下基础。
平心而论,智能化应该不是信息化、数字化的简单延伸、扩展,而是一种与后两者大不相同的新型范式,智能不仅是掌握已知的信息、学习已有的知识,更重要的是生成有价值的信息、知识及有效地使用这些信息、知识。同时,也是理性逻辑推理与感性超逻辑判断的统一。
如果说人工智能是人类理性的产物,那么人机混合智能就是人类理性与感性的共同产物,如果只有理性,就是机器了,机器没有情感;都是感性的话,人就是动物了,动物没有什么理性。人类感性与动物感性最大的区别就在于人类还有理性相伴。
人类之初或许既不是孟子的“性本善”,也不是耶稣的“有原罪”,而是中性的,若把之放入狼群,就是狼孩,若把之放入社会,就是人孩,当然,不同的人群会有不同的孩子。人类社会的复杂常常在于混阶、混颗粒度立体(而不是各种平面的图谱和网络)的相互作用和多重因果叠加纠缠,Pearl先生的《为什么》仅仅延续了西方传统——试图从数理的角度破解因果关系,殊不知,他一开始就偏离了真实的生活常识:人类的因果关系既包括自然的同时也包含社会的,既包括客观事实性的实然有时也常常包含主观价值性的应然,这种杂乱无章的混合表现俗称为“复杂系统”。
如果把人工智能看成低层为数学的结构建筑,那么人机混合智能就是低层为复杂系统的情理结构,其中的根本是人类的算计,算计是活的计算,算计不但构建起了一座座分科而学的丰碑(数学、物理、化学、经济、法律、政治、历史……),而且还树立起仁(人性/思想)、义(应该/合宜)、礼(制度/程序)、智(是非/分类)、信(解释/鲁棒)的围栏和边界。遇到逻辑不自洽或悖论时,机器往往会死机,而人类意识却可以逢山开道、遇水搭桥,如果把物质看成是客观存在的事实,意识是主观对客观事物事实的价值反映,那么休谟之问“从事实中能否推出价值”则可近似为“物质能否变为意识”、“机器能否思维”的问题,那么事实性计算与价值性算计之间也就是物质与意识的共存共生问题。
要做一个自己相信的智能系统很难,要做一个别人相信的智能更难。目前,人工智能系统已经广泛应用于诸多领域,部分实现了代替人类做出决策的过程。但现实中的人工智能方法局限于相对“确定性、完全信息、受限环境、可解释性差”的约束,不能满足复杂环境决策的要求。在真实复杂的不确定因素、非完全信息、开放环境中,人类的经验、直觉、灵感与人工智能系统的高效、精确具有合作互补的巨大潜力。
时下的人工智能系统之所以还远远不能达到人们的期望,其根本原因在于构造人工智能的基础是当代数学而不是真正的智能逻辑,首先数学不是逻辑,从数到图再到集合,从算数到微积分到范畴论无一不是建立在公理基础上的数理逻辑体系,而真正的智能逻辑既包括数理逻辑也包括辩证逻辑,还包括未发现的许多逻辑规律,这些还未被发现的逻辑规律既有未来数学的源泉也有真情实感逻辑的涌现,真实智能从不是单纯脑的产物(如上面提及的狼孩),而是人、物(机器是人造物)、环境相互作用、相互激发唤醒的产物,如一个设计者规划出的智能系统还需要制造者认真理解后的加工实现,更需要使用者因地制宜、有的放矢地灵活应用等等,所以一个好的人机融合智能涉及三者(甚至多者)之间的有效对立统一,既有客观事实(状)态的计算,也有主观价值(趋)势的算计,是一种人、物、环境的深度态势感知系统。而当前的人工智能无论是基于规则(数学模型)的还是基于统计概率(大小数据)的大都是基于计算,而缺乏人类算计的结合与嵌入,进而就远离了智能的真实与灵变。
另外,自然科学及数学等理性工具本质上是一种主体悬置的态势感知体系,人文艺术等感性常常是一种主体高度参与的态势感知体系,人机融合智能涉及到了这两方面,由于智能主体的实时参与,所以更侧重人文艺术感性方面。与西方理性计算思维相比,东方智慧中既有理性的成分也有感性的成分,东方智慧不是单纯的智能计算,而是智能化,重点在“化”,即算计。算计是人类带有动因的理性与感性混合盘算,是已有逻辑形式与未知逻辑形式的融合筹划。由上所述,我们不难看出,人机混合智能中的计算-算计(计算计)问题其实质是东西方智慧的融合与共生。
世界是复杂的,复杂性的世界并不都是科学和计算,而是科学与非科学、理性与感性融合的人物环境系统,智能是自然与人工的结合,准确地说,依目前的数理、物理水平,通过编写计算机程序是不可能实现人类水平的智能的,人工智能是不可能真正理解世界的,必须另辟蹊径。本问题根据东西方文明的特点及现有计算及认知领域成果,提出计算计模型,针对复杂、多域、动态的环境,研究人机混合下的态势感知模型,探索人-机-环境对决策的影响。进一步构建基于理性和感性混合驱动的计算计模型,实现人机混合智能决策。完成人机混合智能及计算计的理论创新、模型创新、方法创新与平台创新,为人机混合智能决策提供方法和理论基础。
“智能”这个概念本身就暗含着个体、有限对整体、对无限的关系。针对智能时代的到来,有人提出,“需要从完全不同的角度来考虑和认识自古以来就存在的行为时空原则”,如传统的人、物、环境关系等。图灵机的缺点是只有刺激-反应而没有选择,只有顺应而没有同化和平衡机制。
人机身体融合早期主要应用于躯体残缺人士的假肢方面。近年来开始应用于增强人体力量和耐受能力的动力装甲或动力外骨骼,以及真实人体与虚拟人体的互动控制等领域。
人机行为融合包括人影响机器、机器影响人和人机协同行为三种模式。人工智能、智能机器人和虚拟数字人的快速发展使得人的行为表现往往是爱到机器影响后的结果,驾驶行为是驾驶员与汽车中的导航、自动巡航等汽车驾驶辅助系统融合的结果,社交行为也是社交应用与媒体调节下的混合结果。最近也应用于娱乐、电影人物形象和动作的创作以及直播领域,如依托5G、VR、AR等技术开办虚拟演唱会和控制虚拟人物(avatar)的动作与表情等,演唱者可以在工作室内和VR/AR技术搭建的演唱会场景中举办虚拟现场演唱会。数字孪生(Digital Twin)是对真实物体、生物体或人的虚拟数字建模与实时同步方法。与虚拟仿真和传统虚拟现实不同的是,数字孪生的相关参数是随真实物体、生物体或人的变化相应变化的,因此能够以数字化的方式如实反映真实物体、生物体或人的状态。
人机智能融合系统通过结合机器智能与人的智能的优势来克服现有人工智能系统的不足,是人工智能的一种演进模式。例如,在CommPlan的人-机器人协同决策的框架中,决策模型的一部分通过学习数据获得,而另一部分则由人工手动设定,以准备食物任务进行的实验结果证明,这种人机融合的协同决策在决策时间上显著快于没有人机互动和互动方式仅由开发者根据自己经验设定的方式。脑机接口技术的发展使得其在医疗健康、游戏、虚拟现实等领域的应用广泛开来,突破了传统的单项的脑机交互模式。
近年,人机交互技术的发展与进步也促进了人、机与环境的融合。使得人类所处的环境能够与人类以一种自适应的、可进化的、非侵入的、低负荷的、自然的、甚至是主动的方式进行交互,形成了环境智能或泛在智能(Ambient Intelligence,AmI)。自动驾驶汽车系统是环境智能领域相关技术发展的集中体现,通过对环境的自动感知、理解和执行实现不同程度的自动驾驶。人机融合的目标是有效协同。在人与系统的协同过程中,系统透明度、人对机的信任程度、人机之间的认知一致性会决定有效协同的程度。
在人机融合的研究中,一个重要的方向是自主系统的研究。在执行任务的状态中,自主系统可以根据任务需求,自主完成“感知—判断—决策—行动”的动态过程。例如有科学家们已经开始研究额外的机器手指对大脑神经系统的影响。目前,机器只有事实性的学习,而没有价值性的学习,道德物化(技术化)与道德人化(非物化)两者如何平衡以实现人机环境系统的有机统一、人类的自由可能性如何与机器的确定必然性相融合协同、“一阴一阳谓之道”这个思路如何体现在人机交互与人机环境系统智能之中等一系列的问题都还远远没有解决。
人机混合智能的核心问题为:是不是+该不该+好不好的混杂组合问题。其中“是不是”属于客观事实性逻辑计算问题,“该不该”属于主观价值性判定算计问题,“好不好”属于主客观混合性决策计算计问题。当前大家做人机混合智能大都处在做“是不是”(0、1)的逻辑可计算部分,对于主观价值的可判定性及两者的混合计算计性还未有好办法解决。
人机之间、态势之间、感知之间、计算与算计之间常常具有非互惠作用现象,即作用力不等于反作用力,如何量化分析这些等价的相互作用呢?并且,现有的逻辑体系很难判断处理各种意外,如塞翁失马的大逻辑与刻舟求剑的小逻辑。现阶段的人机交互很难实现人机之间的有机融合,仍处于相对简单的低级水平,难点之一就在于价值意向性的形式化。鉴于机器只有局部性事实逻辑,没有人类的整体性价值逻辑,我们可以尝试把人机结合起来进行功能与能力的互补,用人类的算计这把利刃穿透机器计算不时遇到的各种各样的“墙”。
智能是在人与物、环境的交互中逐步形成的,一方面,我们的认知总是在与这个世界发生着融合;另一方面,被误用的计算却也可能会影响我们的认知。1968年图灵奖获得者理查德·哈明就曾一语中的地认识到:“计算的目的不在于数据,而在于洞察事物。”,这里的洞察就包含着对未来的预测与算计。
如果说14-17世纪的文艺复兴是回归希腊,把人从神学、上帝的束缚下解放出来,引发了宗教改革、启蒙运动、工业革命,导致理性主义、个人主义盛行。那么未来的人机环境系统智能将回归以人为本的宗旨,把人从机器(高科技机器和各种社会机器)的束缚下解放出来,重新确认和界定人是目的,发掘和发展个性才能,使人类走向光明的未来。人机环境系统中有不同的人,同时也有不同的角度和意图(包括对手),如何"与或非+是非中"这些人性呢?也许一旦掌握了人性以后,我们就有希望在其他各方面轻而易举地取得胜利了。康德的这句“事物的特性往往与观察者有关”就体现了东方思想中人和人、人和物、人与环境之间的关联性以及西方量子力学的本质。
人是生理与社会的融合,机器是物理学与数学的结晶,环境是地理与历史的产物,人机环境系统交互则是复杂形式与简单规律的表征。复杂就是多事、物的交织作用。机管复,人管杂。复杂的往往是形式,主要还是因为没有找到简单的运行规律,当你找到万有引力时,一切都明亮起来……真正的智能不但可以解决问题,而且更应该提出问题,二者相辅相成。无,是非存在的有;虚是非存在的实;非是非存在的有;should是非存在的being。2005年奥斯卡获奖电影《鸟人》中的一句台词:“A thing is a thing;not what is said of that thing”,这或许是对“道可道非常道;名可名非常名”最传神的英文翻译吧!
或许,对人类而言,理性的极限是一种感性,从几个司空见惯的符号中(E=mc2)竟也能看出美来!从人类不断发展的角度来看,是一个“长江后浪推前浪”并且“青出于蓝而胜于蓝”的过程:曾几何时,哲学取代了迷信,宗教取代了哲学,科学取代了宗教,下面是复杂还是系统或者智学会取代了科学?!我们拭目以待……
人机环境系统智能的基本问题即是感性与理性的平衡问题,其中:Being作为存在,隐隐意味着理性上的至少、惟一性;Should表征意识,潜在意味着感性中的可能、无限性。
事实关系是在时间、空间和上下文的事实域内给人一种强烈的客观感觉。而价值关系则是深刻情感化的,其中的对象、属性、范畴越来越由自我、作用和意识构成的主观模型所定义。这种事实关系和价值关系之间彼此定义和塑造的双重过程,就是事实价值混合物。人类态势感知到的常常是这种事实价值弥(散)聚(合)混合体,并可以根据具体情况恰当突显出或客观事实的一面或主观价值的一面。对于机器的态势感知,常常是被赋予非适应性的量化事实性突显过程,并且是内化成了的人为规训和统计束缚。智能分为理智和情智两大块,AI只是理智中极小的一部分,目前的智能技术水平还大多停留在AI上,更奢谈更广阔深远的情智。智能不是完全去除错误和愚蠢,而是共处共生,阴阳同构。
有物理上的“非存在的有”,比如老子里的“三十辐共一毂,当其无,有车之用。埏埴以为器,当其无,有器之用。凿户牖以为室,当其无,有室之用。故有之以为利,无之以为用。”,也有心理上的“非存在的有”,比如“爱恨交加”。态,存在的时空;势,非存在的时空;感是有的时空,知是无的时空。存在的事物或事实提供了科学的依据和基础,非存在的意识或想象则提供了艺术的联系与说明,态势感知把存在的和非存在的“有无”游刃在一起,形成多种不同的人机环境系统侧面以解释出全息的世界及其投影、影射。
人机之间若不能产生可塑性(重新有效分配感性与理性资源的能力),即意味着失配。AI们一直试图把人类的感性转化为理性嵌入到系统中,这里有两个极大的困难(也是元宇宙的科学瓶颈),一是感性的机理与逻辑还远远没有搞清楚,二是理性的机理与逻辑还处在原生态阶段。事实涉理,价值及义,西方的智能文化是存在固有缺陷的,缺失义理,有眼利而无大义,是一维的,非此即彼。而东方文化则以义理为核心,义利兼备,以大义为本,是二维度的,和而不同。支撑智慧文化在中国存在,以及在中国存在的,正是西方所缺失的义理文化。如何实现事实价值之间的适时隐显是智能的关键。美国出现经济危机和疫情危机,其根源都在缺失义理,有利而无义。事实突显主导时有“态”,价值突显主导时有“势”,事实价值混合突显主导时有“态势”。外部刺激所产生的是“感”性,内部刺激所产生的是“知”性,内外部的结合刺激为“感知”。若事实为阳,价值为阴,一阴一阳谓之“道”,休谟之问(从事实Being能否推出价值Should)则为“问道”之问。
本书分为人机交互与人机混合智能两部分,前面四章涉及人机交互,后面八章涉及人机环境系统智能。如果把“人机交互”看成脖子以下的形而下规则约束,那么“人机环境系统智能”就是脖子以上的形而上自由意志,人类与科技的关系中既有绝对决定的事实成分,也有相对自由的价值因素,正可谓:岁月无情,如剑如霜,生命有界,绝对决定;人生有意,如桥如电,风光无限,自由意志。最后用离开剑桥时感叹出的“质鳞波苍穹,何命不羞?!”与大家共勉,谢谢!