人工智能是研究如何将人类自身所具有的感知、认知、行动、控制和决策等能力通过机器来实现的一门学问,但它也可以是一个赋能系统、一个开源代码平台、一门初高中课程、一个大学本科专业、一种思维方式、甚至是我们每个人每天所生活的“智能社会”空间。人工智能本身还处于不断发展和进步的过程中,我们要警惕将人工智能等同于人类大脑的不切实际之举和“人工智能超越人类”的杞人忧天之扰,要认识到目前人工智能还处于完成特定任务的“就事论事”阶段,迈向通用人工智能是人类今后面临的长期而艰巨的任务。
回望历史,人工智能的曲折发展也体现出人类对智能行为的不懈模拟和精心构造,它在今天犹如水和电一样赋能社会发展和经济进步。机器人偶指的是模仿人和动物的行动而做成的机器器械,这个机器器械将按照人的意志行动。而人工智能是以机器为载体,对数字化的信息进行处理后所实现的人类智能或生物智能。真正推动人类第一台计算机诞生的是1937年由图灵(Alan Turing)从机械角度、在发表于《论数字计算在决断难题中的应用》一文中提出的图灵机模型。在图灵机模型中,我们事先将已经写好的程序存入程序控制器,一旦图灵机从两端无限长的纸带上读入数据或任务指令,就可以“按部就班”地触发预设程序,直至图灵机停机,完成可计算的任务。图灵机模型推动了计算机的诞生,使得人类从手工计算时代迈入自动计算时代,成为人工智能的“机器载体”。
从达特茅斯会议开始,人工智能登上了历史舞台。但在其发展过程中,人工智能遭遇了若干挫折。与早期人工智能研究所设定的“集合封闭、规则完备、约束有限”场景不同,现实社会中诸多行为决策往往是开放环境下完成的,即在未能全面掌握所有条件下进行的推理和决策。因此,人工智能需要模拟大脑非严密推导功能,即对推理的严格约束进行松绑。人工智能早期所遭遇的挫折,与人类对其抱有过大期望也有关系。
逻辑推理与优化搜索是早期人工智能进行问题求解所采用的主要方法。逻辑是对知识进行探索、阐述和确立有效推理原则的学科,它包括两个最重要的组成部分,分别是规范化的知识和推理方法。把知识规范化后,就可通过推理规则从已知出发,用“计算”方式来模拟人类思辨,“推理就是计算” 意味着推理和计算这两个概念在霍布斯研究中具有逻辑上等价关系。
专家系统可视为某一领域知识库与推理机相互结合的产物,可用来完成诸如某一疾病的诊断等任务。但是,由于专家系统中所使用的规则严重依赖于领域专家对经验和潜意识的归纳总结能力以及对相关问题的泛化能力,使得专家系统“只专不通”。1997年5月,国际象棋冠军卡斯帕罗夫和IBM公司的“深蓝”计算机程序展开了一轮令全球瞩目的人机大战。结果,深蓝计算机发挥出色,以2胜3平1负的总比分战胜了卡斯帕罗夫, 成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统,这是人工智能领域一个里程碑事件。
以数据为燃料,通过人工智能方法这一引擎从数据中获取知识、进行决策,体现数据的价值是一项充满挑战的任务。一般情况下,大数据支撑着当前人工智能的发展,大数据一直被奉为机器学习成功的关键钥匙。但是,人工智能不等于大数据。实际上,大数据中总存在一批“代表性小数据”,通过对小数据的分析理解,可洞察大数据所蕴含的规律。当然,对于今天人工智能模型而言,对大数据越来越依赖,对大数据的利用能力也在不断增强。“皮之不存、毛将焉附”,人工智能算法这一引擎的快速运转不能脱离数据本身这一燃料。
为了解决手工明确构造规则来进行人脸检测的不足,基于统计建模的机器学习方法被提出。统计模型包含了数目不一的参数,需要通过不同方法来优化和学习,使得模型更好地完成任务。数据驱动学习就是从数据出发来学习数据中所蕴含的模式,对数据进行归纳和抽象。算法不断从数据和经验中进行学习,提升自身能力,从机器学习跃进到学习机器,这是智能算法的追求目标。
早期深度学习模型如MCP模型和感知机模型由于只是一个简单映射函数,因此无法完成复杂识别任务。为了将早期深度学习模型拓展为复杂映射函数,一个直接思路是在感知机模型的输入层和输出层之间增加一些神经元,搭建隐藏层,将深度学习模型由两层浅层结构扩展为多个隐藏层构成的深层结构。深度学习通过一系列神经元的组合,完成了从数据到任务的复杂映射,在算法、数据和算力联合推动下催生了人工智能发展又一次高潮,但也带来了炼金术之困惑。
博弈论拥抱人工智能,推动人工智能从感知智能向决策智能转变,这一转变使人工智能从追求最优解向探索均衡解迈进。东汉马融在《围棋赋》中说:“三尺之局兮,为战斗场”,从战争中学习战争是博弈水平不断提高的关键要素。在这一过程中,智能算法不断与外部环境交互,根据所得到的奖励或惩罚等反馈信息持续改进博弈策略。人工智能和博弈论的结合依旧是未来解决复杂现实问题的一个重要研究方向。
科学研究表明:群体智能水平与构成群体中的个人成员之间的协作密切程度相关,而与成员平均智慧水平或最高智能无关。西晋陈寿所著《三国志·吴书·孙权传》写到,“能用众力,则无敌于天下矣;能用众智,则无畏于圣人矣”,众力汇成众智,推动人类文明持续发展。
“横看成岭侧成峰”,同样的数据会存在千万种解读。但是,与“历史不是任人打扮的小姑娘”一样,数据也不是任人打扮的小姑娘。辛普森悖论的重要性在于它告诉我们如下道理:很多时候我们看到的数据并不是反映现象全貌的数据,如果忽略产生数据的“潜在变量”,可能会改变已有结论。
随着互联网的飞速发展及数据量的急剧增加,从不同渠道产生的文本、图像和视频等不同类型媒体数据紧密混合,以一种新的形式,更形象、更综合地表达个体或群体的意图。这种多类型媒体数据依赖共存、数据来源广泛丰富、用户交互史无前例的新型媒体表现形式,被称为“跨媒体”。
现代认知科学的相关研究表明,人对外界的感知呈现出跨媒体特性,早期研究认为,大脑的认知过程就是通过融合不同类型的感知信息而完成的。“麦格克效应”是大脑对眼睛和耳朵所提供的矛盾的信息进行猜测的结果,它验证了人类对外界信息的认知是通过对听觉和视觉等不同感官信息进行整体处理后才得到的,任何感官信息的缺失或不准确都将导致大脑对外界信息的理解产生偏差。当人们感知的视觉信息和听觉信息相互矛盾时,对这些信息的理解既不符合视觉信息也不符合听觉信息。
2020年12月,斯坦福大学计算机科学系前任主任、现英伟达首席科学家比尔·戴利在一次主题演讲中提出了以英伟达创始人黄仁勋本人命名的“黄氏定律”。黄氏定律表明:在“计算架构改进”的推动下,人工智能芯片的性能每年可提升1倍,远远超过了摩尔定律。人工智能模型对算力有强烈需求,黄氏定律为满足算力需求提供了保障。
我们习惯于把人类和其他生物所表现的智能统称为碳基智能,因为生命由碳水化合物构成;而把机器智能系统称为硅基智能,因为芯片的基础材质是二氧化硅。人工智能的深入发展推动着人与机、机与机以及人机共融社会形态的形成,呈现混合增强智能。智能机器与各类智能终端已经成为人类的伴随者,人与智能机器的交互、混合是未来社会的发展形态,这就是混合增强智能。混合增强智能可以由两种方法来实现,分别是“人在回路的混合增强智能”和“基于认知计算的混合增强智能”。在混合增强智能中,人类总是这种形态的制造者和协调者,是智能进步的推动者。
从一定程度上而言,人工智能有机协调了实验科学和理论科学两种研究方式,在合理应用科学定律的前提下,以计算方式来系统化地解决现实中的复杂问题。1953年9月30日,理查德森去世后给后人留下了令人难忘的一句话:“我们人生的责任是要为后人留下更美好的事”。人类探索宇宙真理的征途永无止境,在这个过程中,科学计算促进了人工智能本身的深入发展,人工智能又重塑不同学科研究的范式革命。
我们不能在一种技术的生命早期阶段就预言到它的社会后果。然而,当我们发现其不好的后果时,技术通常已经成为整个经济与社会结构的一部分,以至于对它的控制变得极端困难。这就是控制的困境。当容易进行改变时,对它的需要无法得以预见;当改变的需要变得清楚明了时,改变已经变得昂贵、困难而且颇费时日。人工智能具有技术性和社会性的双重属性,需要关注人与机器、机器与机器以及人机共融所形成的社会形态中应遵守的道德准则和法律法规。
众所周知,科学思维包括实证思维、逻辑思维和计算思维三种。实证思维以观察和归纳自然现象及社会现象规律模式为特点,逻辑思维以推理和演绎为特点。计算思维则以形式化、程序化和机械化为特点,它把实际问题抽象为可形式化表达的数学问题,用计算机语言来编程,自动优化求解数学问题所表达的模型,从而解决实际问题。“工欲善其事,必先利其器”,人工智能使得我们以计算为手段来模拟人类某一方面的能力,创造性地解决问题,体现了计算思维。
计算机能够从数据中进行学习。机器学习是统计推理的一种方法,其能发现数据中所蕴含的模式。学习算法设计了许多新的表达方法,促进人工智能近年来在许多领域取得了较大进步。但是,人工智能对社会将产生积极和消极双刃剑影响。人工智能技术极大改变了我们工作、旅行、交流以及彼此关怀的模式。对于人工智能可能的害处必须高度重视,比如由于训练人工智能算法所使用数据存在偏差,训练得到的人工智能系统就会给某些人带来算法偏见。因此,我们必须严肃讨论人工智能对社会的影响,研究将伦理道德引入人工智能系统的标准和规范。
[1] 吴飞.《走进人工智能》.高等教育出版社