每当写完一本书时,才会感到还有很多更重要的思考没有写进去。对于人机环境系统智能这样一个永恒的主题感觉更是如此。
现在,各国在继续开发新一代人工智能技术及其应用的同时,积极布局更新一代人工智能发展,旨在通过机器学习和推理、自然语言理解、建模仿真、人机融合等方面的研究,突破人工智能基础理论及核心技术。
目前来看,人机交互、人机混合、人机融合的难点常常在于第一是“互”、第二是“融”,关键之处第一是“人”、第二是“多”。任何一个产品系统,只要和人打交道与人碰在一起就会变得很复杂。
哲学是为科学扫清形而上的束缚而诞生的,维特根斯坦为图灵扫了不少疑惑,休谟为哈萨比斯扫了不少障碍,康德为量子物理扫了不少围栏:事物的属性往往与观察者有关,东方思想、东方哲学则是为人机环境系统智能天然而生的清障夫:天地人和谐共生。
人机如何使what-when-where-who-why-how-how much 这些因素恰好混合,是人机环境系统智能好坏的关键,不同的分工方式及动态的分工在足球比赛中也类似:人球环境之间的时空情感交错……
之前曾写过两本书,一本是2019年科学出版社出版的《追问人工智能——从剑桥到北京》,主要包括分为五部分内容:①人工智能:从“史前”到现在;②认知的奥秘:深度态势感知;③探索人机未来:人机融合智能;④三分天下:人、机、环境;⑤人工智能:伦理之问。第二部书是2021年清华大学出版社出版的《人机融合:超越人工智能》,延续了上一部书没解决的一些问题,做了较深入的思考,也分为五部分:①智能的本质;②人工智能迈不过去的三道坎;③深度态势感知再认知;④自主性问题;⑤人的智慧和人工智能。这本算是第三本,针对当前人工智能的难点、痛点及发展趋势提出了一个前卫的概念叫人机环境系统智能,其中特别强调与AI数理结构不同,人机环境系统的智能是一种情理结构,既有理性的计算也有感性的算计,既有客观事实数据的信息量多少/反馈也有主观价值经验的信息质之好坏/反馈,是一种既有同一律、非矛盾律、排中律又有非同一律、矛盾律、非排中律的辩证逻辑,是涉及数据、AI、人与系统、自主、群智、伦理道德、法律标准、测试评价等领域的继承与锚定体系,是既有东方类比/隐喻(人)与西方归纳/演绎(机)的综合体验。它不是人工智能,而是一种由人、机、环境系统相互作用而产生的新型智能形式,既不同于人的智能,也不同于机器的智能,是把一种物理、生理、心理、数理、管理、哲理、文理、机理、艺理、地理、伦理等相结合的崭新一代智能领域。
智能不仅涉及形式化的拓扑,而且还包括意向性的拓扑。用维特根斯坦的话说就是“有一天出现包含有矛盾的数学演算研究,人们将会真正感到自豪,因为他们把自己从协调性的束缚中解放出来了”。当前的AI主要是建立在数学规则和统计概率基础上的自动化,自动化特点是确定性的输入,可编程的处理,确定性的输出;人工智能的特点是部分确定性的输入,可编程的处理,部分确定性的输出;而智能的特点是不确定性的输入,不可编程的处理,不确定性的输出。除此之外,还有功能和能力概念的不同,功能是所有的自动化产品,机械化产品都是具有功能而没有能力。人工智能到目前为止也只有功能没有能力。只有在小说、电影、艺术品里面的人工智能或者智能系统才有能力,而人恰恰是有能力一个标志。人类的能力是从内而外发出的,有目的性,指向性,意向性,主动性的,而功能是没有的。功能的基础是逻辑,是数学,是映射,这是功能最重要的特点,而能力则是人类最重要的漫射、散射、影射,是无法用当前形式化手段进行模拟的系统。智能和人工智能最大的区别,第一,智能里面不是场景化的,同时还包含了艺术。第二,智能里面有辩证和矛盾的处理权衡机制。第三,真正的智能里面有洞察力,把握should即应该干什么,这是主动性最重要的体现。第四,智能里体现知几、趣时、变通,而人工智能则体现规则、统计、稳定。
态势感知是指在一定的时间和空间内对环境中的各组成成分的感知、理解,进而预知这些成分的随后变化状况。深度态势感知是对态势感知的认知,它是在Endsley的态势感知(数据/信息输入、处理、输出)基础上,混合人、机智能。既包括了人的意向性,也融合了机的形式化,既涉及事物的大数据能指又关联它们之间的小/无数据所指,既能够理解事物原本之意,也能够通情达理、明白弦外之音。人机环境系统智能中深度态势感知的本质是把事实与价值统一起来:人负责价值,而机处理事实,主要涉及五点:①输入混合表征的能指与所指切换(如人机常识的一致性);② 人/团队的归纳、演绎、类比推理与机的统计性推理结合;③人/团队的风险性决策与机的无责任性决策;④人/团队的自否性反思与机的机械性反馈协调;⑤ 如何通过任务需求自动调度控制人机资源分配、功能匹配。
所有的智能里面还都有相反的作用,正如阴里面有阳,阳里面有阴,是反作用力的。这里引申出反人工智能。反人工智能就是要加速我方人机环境系统的协同联合能力,同时破坏对手的人机环境系统的协调融合能力。
未来的智能化涉及从计算走向算计(功能到能力),从科技走向艺术,是有算计的计算或有计算的计算:计算计+功能力,具体涉及这样几个问题:在人机结合中,什么可以自动化?应该如何自动化?什么时候应该自动化?智能不是有序,有序的叫仆人,真正的智能里面包含混乱和无序。智能不是整体大于局部之和的2>1+1,智能也不是局部之和大于整体的1+1>2,而是整体与局部之和的混合1+1><2。智能不是适应,智能也不是不适应,而是适应+不适应双向的结合。真实的智能有着多重含义:①事实形式上的含义,即通常说的理性行动和决策的逻辑,在资源稀缺的情况下,如何理性选择,使效用最大化;②价值实质性含义,既不以理性的决策为前提,也不以稀缺条件为前提,仅指人类如何从其社会和自然环境中谋划,这个过程并不一定与效用最大化相关,更大程度上属于感性范畴;③过度依赖AI易造成失去人性中的自信、果敢、责任和勇气;④人类智能的基石可能不是数学,人的智能可以知道自己的不智能,并且人类可以形成并跳出概念并使用概念,机器智能则不然,智能算法不同于数学算法,它是一种超出数学计算的算计,不但有显性的逻辑推理,还有隐性的知识和秩序运筹,是科学与艺术的融合,在计算计系统中,如果把不同计算看成乐队里的各个乐器/乐手,那么算计就是让乐队演奏起华美乐章的那只看得见的指挥之手;⑤智能不是万能,智能仅是解决问题的一种工具手段,对于人、机而言,人的动态规划与机器的动态规划却是不同的:有经验的人可以游刃有余地将一个复杂性大问题拆成事实、价值、责任等不同性质的小问题来求解,即用事实、价值、责任的不同化法进行大事化小,小事化了,还可以避免各种一孔之见和固步自封,而目前的机器对此异质合取,化解问题依然望尘莫及,人工智能只会模式对比(不是类比),也许这也是人类智能的又一个瓶颈和难点:如何有效地处理异质性的非形式化问题?计算算法只是提高效率的工具和机制,不能自主的决策系统,算计算法里面包含自主的决策和非标准的多重因果及相关关系;⑦人机功能力分配是关键,人机功能力分配是人的能力与机器的功能分配,人具有主动性的能力使然(使能),机体现被动试的功能赋予(赋能),是人的动态算计与机器的准动态计算之间的分配,人的能力是会随着人机环境系统的变化而变化的。需要探索新的因果关系、统计概率、递归迭代、与或非;⑧机是半导体,人是变导体,数据/信息/知识本身既包括事实也包括价值,只不过事实是以显性方式表征,价值常以隐性方式出现,计算处理的是事实,算计对待的是价值,当然,更多时候使用的是计算计方式,从事实到价值的桥梁如果是概念,那么就是计算,从事实到价值的桥梁如果是实践,那么就是算计;⑨哲学不仅可以解释世界,也可以改造世界,真实实践过程中,归纳、类比、演绎、隐喻的嵌套递归混合造成了现有理性逻辑推理的无能为力,所有的信息知识和核的数据都不是固定的,都是变化的,动态的,多样的。随着外部的实践和交互产生相互的作用,人常常有内外两套态势感知系统(OODA系统)耦合而成,共振时最强,抵消时最弱,另外还有一些非智能因素(即智慧)影响决策系统:想不想、愿不愿、敢不敢、能不能……这些因素虽在智能领域之外,但对智能的影响很大。
1948年,维纳在《控制论》最后一段写道:“信息、语言和社会”结尾处写道:不管我们在社会科学中的研究是统计性的或是动力学性质的——这种研究一定具有两可的性质,它们可信的程度只能够到达头几位数字,一句话,他们不能给我们提供大量的可以验证的、有意义的信息,如同我们在自然科学中可以希望得到的那种信息一样。我们不能忽视这些信息,但我们对这些信息的可靠性不要抱太大的希望,不管我们愿意与否,许多东西我们只好让熟练的历史学家用不“科学”的、叙述的方法进行研究。
从中我们不难看出:一个智能系统是自组织与它组织共在的,即是一个同化与顺应同时起作用的平衡组织,打破平衡就会产生出新的系统。开放智能系统中的逻辑不同于物理系统中的数理逻辑,除了已知恒定的变量参数以外,还会在各种事、物交互过程中不断衍生出新的变量参数,原有的变量参数会退居次席或消失,还有的变量参数甚至会忽隐忽现……,这些都增加了智能逻辑变化的不稳定性和不确定性,使真实智能与人工智能的距离越来越远,与人机环境系统智能的距离越来越近。变量的变化与变化的变量让基于计算的AI很难应对博弈时智能体的态势感知,而人类的算计恰恰相反,她不但可以应对变量的变化问题,也可以处理变化的变量问题,还可以解决非计算的判定性问题,如非情人眼里出东施。人机环境系统智能不但可以有效地态-势-感-知,而且还可以更高效地势-态-知-感,更可以把两者结合起来游刃有余地往返迭代回归升华,不但要计算,还要算计,切实实现“道者反之动”。
DARPA(Defense Advanced Research Projects Agency,美国国防部高级研究计划局)假设当今机器学习ML的一些限制是:①无法结合上下文和背景知识的结果;②将每个数据集视为一个独立的不相关输入。在现实世界中,观察结果通常是相关的,并且是潜在因果机制的产物,可以建模和理解。DARPA认为,能够获取和集成符号知识并大规模执行符号推理的混合AI 算法将提供稳健的推理,推广到新情况,并提供保证和信任的证据。DARPA在这方面研究的缺点就在于:只有符号知识而忽略了非符号知识。当前人机交互最前沿的问题之一就是人与人工智能的交互,但我们还仍没有看到黎明前的曙光,究其因,人机之间只有“计算”尚无“算计”浸入,再简化一点说,即只有“算”没有“计”。许多被计算出的智能,只能是计算智能,缺少很多的感知、认知和洞察。
一个关于人们在涉及经济风险时如何做出决策的流行理论是前景理论,它由行为经济学家 Daniel Kahneman 和 Amos Tversky 在 1970 年代提出的(后来 Kahneman 获得了诺贝尔奖)。其核心理念是:人并非总是理性的。康德最重要的洞见是,在世界既有的状态与世界应然的状态之间有个鸿沟,而两者都有相同的价值。而一个人需要一直把两者记在心上。这是极端难以采取的立场。这是非常现代的。这意味著一定程度的活在刀口上,一定程度的永恒挫折。休谟认为,虽然人类是理性的动物,而且这是我们本性的一个面向,我们应该拥抱它,而且不能否认:我们不只是理性的动物,也是非理性的人类动物。对人类生命的哲学理解,并不是设计出来把人类生命拉去跟哲学达成一致的,它是设计出来让哲学符合人类生命的。
“智能”在人机环境系统里具有完全不同于它在经典数理、生理、物理里的意义,它不再是一个单纯的硬逻辑计算,而是要参与到系统演化中来的软硬逻辑计算计。世界是由软硬逻辑混合出的计算计构成的。硬逻辑指客观上无法改变的数理、物理等逻辑,强调一义性和自洽性。软逻辑指主观上可以改变的心理、管理等逻辑,涉及多义性和辩证性。计算侧重硬逻辑,算计偏好软逻辑。计算主要处理时空一致性问题,算计侧重解决时空不一致性的困难。计算体现了不易,算计则体现了变易,计算计则是蕴含着不易与变易的有机结合——对易或不对易。
如果两个力学量是对易的,它们就互相独立,先测量谁后测量谁不影响结果,它们可以有共同的本征态,可以同时测准;如果两个力学量不对易,它们就不独立,一般来说先测量谁后测量谁结果就不一样,它们没有共同的本征态,无法同时测准。因此,如果两个力学量不对易(比如测量量子运动时的位置/动量与博弈中的态/势、感/知),它们就没法同时处于本征态。系统处于一个力学量的本征态,测量这个力学量时能测准,另一个力学量就会因为处于叠加态而测不准。于是,你就没法同时测准它们,这就是所谓的不确定性原理。博弈中的态、势与感、知是两组不对易的非力学量,它们所产生出的不确定性可能会更强。
《素书》曰:“夫道、德、仁、义、礼五者,一体也。”,实际上,人、机、环与智力、智能、智慧也是一体的,人机环境的智能光合作用,即为天时、地利、人和、机辅之间的共振效应;现实的being-可能的should(being隐藏着should,should也隐藏着being)、态势感知、计算-算计大都是一体的。计算计打破了虚实(真假、有无)的界限,可以虚虚,也可以实实,还可以虚实。非常道即计算-算计的混杂性。算计的核心在于悬置、等待、蛰伏……,正如康德所言:“我们的理智并不是从自然界引出规律,而是把规律强加给自然界,这个强加给自然界的规律是我们由众多的理论中,遴选出的理论来表述的。”
一个包含特定人机环境系统态势感知中的态、势、感、知都是多种、多层级的,如态分为初态、次态…N态,在不同的上下文背景中会表现出不同的状“态”,势、感、知也类似。在不同上下文背景中不同态、势、感、知的叠加纠缠构成了千变万化的主客观组合。这就决定了博弈决策的过程与其说是对数据的客观分析,不如说是对风险和优先级的权衡。基于观察,可得这么一个观点:单纯数据驱动的AI模型,在做决策时候,极易受到攻击。同时,机器自主性的提高可能会大大增强人机交互的难度,主要表现在机器自主性所带来的不确定性增加,但随着人机交互的频繁,会降低这种不确定性,但不会彻底消除。
在经典力学里,系统状态一旦确定,所有力学量的取值就都确定了,测量只不过是把这些值读取出来,并不会影响它们。一个苹果在那里,它的位置和动量都是确定的,不论谁去测量,测量几次,都不会改变苹果的位置和动量。你去测量苹果的位置,当然也不会影响苹果的动量。
以前,你以为一个人要么是步兵,要么是炮兵。而现在,你发现他还可以是特种兵,可以既是步兵又是炮兵。一群完全一样的特种兵,一样可以根据战场需求立马“分裂”成步兵队和炮兵队,就像马赛克第二次通过排列组合后分裂一样。跟量子叠加态相对,我们把量子处于确定的自旋向上或自旋向下的状态称为本征态。也就是说,通过某磁场的量子可以处于自旋向上本征态、自旋向下本征态以及自旋向上和自旋向下的叠加态。
人机环境系统也类似,其态势感知既有本征态,也有叠加态。如果一个人机环系统既可以处于进攻的本征态,也可以处于防守的本征态,还可以处于攻守混合的叠加态,那我们就可以认为(就像通过x方向磁场后的每个量子都是处于z方向自旋向上和自旋向下的叠加态)该人机环境系统处于态势感知叠加态。于是,第二次通过相同或类似博弈行为/任务规划时,仍既可能攻,也可能守,这样就分裂成了两种态势感知叠加(就像第二次通过z方向磁场时,每个量子都既可能向上偏转,也可能向下偏转,这样就分裂成了两束。),只有通过具体博弈时才能知道究竟是何种态势与感知。
一个想法能否变成现实,我们分成三个阶段:第一个阶段大逻辑,第二个阶段小逻辑,第三个阶段执行细节,顺序一定不要乱。只有前面解决了,才能进入下一步。当然这三步是螺旋形的迭代中完善,解决了大逻辑问题,开始研究小逻辑。
在智能博弈中,大逻辑常常包括软硬逻辑,小逻辑特指硬逻辑。大逻辑可以让任何看起来不搭的事在特定情境上发生,但是这事在小逻辑上却又是合理且自洽的,就像物理学中的波粒二象性,可以看作“两种截然相反的观点,却能并行不悖。”,双方永远不会按照对手的想象而活着,如同军事家辛弃疾所言“谋贵众,断贵独”。
场论的概念起源于麦克斯韦的电磁场理论,麦克斯韦电磁场理论的核心概念是“场”,在某种空间区域,其中具有一定性质的物体能对与之不相接触的类似物体施加一种力,这就是“场”。那么一个带电物体对其他带电物体施加一种力(吸引力或排斥力,取决于极性)。磁体周围有磁场。人机环境系统中或许也有态、势、感、知场,计算、算计场,以此打破博弈中的时空与价值维度。我们目前缺乏的是如同拓扑的概念一样谈论一般可计算计性概念的抽象框架。基于拓扑的概念,我们能够谈论一般空间之间的连续函数;同样的,我们或许也需要有一个对可计算计性的一般框架来考虑一般不同数据结构之间的可计算计函数,同时比较不同计算计模型之间的关系。
俄罗斯文学大师陀思妥耶夫斯基有句名言,“我只担心一件事,我怕我配不上自己所受的苦难”,此时此刻,我只担心一件事,我怕我配不上自己所受到的帮助和厚爱。如果说,文字具有生命力,那她一定也有灵魂,如果想看看遥远未来的样子,可以打开各种各样的经典或杂记,里面都有,只是很多尚未被关联……若这本小书能够让您在闲暇之余产生瞬间的这种感觉,也算是对笔者的一丝安慰了。白驹过隙,生命实在是太短暂,人应该对某样东西倾注深情。不经意之中,笔者选择了人机环境系统智能,也选择种下了一颗种子……
这三部书写了五年,也算小结了,后面的思考也许还会更多、更有意思!
感谢谭文辉在本书工作中的共同研究和无尽有趣的探讨工作,感谢刘欣在本书工作中的共同研究和组稿工作,感谢牛博、武钰对第十章的贡献、金潇阳对第七章的贡献,感谢王小风、马佳文在本书编写之初给予的建议与支持,感谢庄广大、胡少波、何瑞麟、王玉虎、关天海、于栖洋在本书编写过程中给予的大力帮助,感谢辛益博、陶雯轩、何树浩、伊同亮、王赛涵、韩建雨、孙维一、邹阳洋等同学在编写过程中提供的参考意见,同时也感谢一些部门与机构的支持,以及各位专家和学者的激发、唤醒、探讨!
感谢我的老师袁修干先生,从您那里第一次听到了人机环境系统的概念,感谢秦宪刚、韩磊等各位老师多年的帮助和指正!
感谢剑桥的偶然相遇,让我们看见了西方智能的根!
感谢读过前两部书的诸多老师,给我们提出了许多宝贵的意见和建议,谢谢各位老师的悉心指教!书中仍有许多并不完善甚至不正确的地方,恳请大家们继续批评指正,您的指教才是对作者最大的帮助!谢谢!
本书算是初步完成对家人、师长、朋友和学生们的一个承诺,也感谢我所有师长和亲朋好友对我一直来的鞭策和支持,尤其要感谢侯俊琳老师和张莉老师的大力支持和帮助。
最后,引用茹科夫斯基所说:“使人类飞翔在天空的不是肌肉的力量,而是智慧与思想”与大家共勉,谢谢大家!