我们自称 Homo sapiens-智慧的人一因为我们的智能( intelligence)对我们非常重要。数千年来,我们一直试图理解我们是如何思考的,仅仅少量的物质怎能感知、理解、预测和操纵一个远大于自身且比自身复杂得多的世界。人工智能( artificial intelligence)领域,简称AI,走得更远:它不但试图理解智能实体,而且还试图建造智能实体。
人工智能是最新兴的科学与工程领域之一。正式的研究工作在第二次世界大战结束后迅速展开,1956年创造了“人工智能”这个名称本身。与分子生物学一起,AI经常被其他学科的科学家誉为“我最想参与的研究领域”。一方面物理专业的学生有理由认为所有好的研究思想已经被伽利略、牛顿、爱因斯坦以及其他物理学家想尽了。另一方面,AI对若干位专职的爱因斯坦们和爱迪生们仍有良机。
AI目前包含大量各种各样的子领域,范围从通用领域,如学习和感知,到专门领域如下棋、证明数学定理、写诗、在拥挤的街道上开车和诊断疾病。AI与任何智力工作相关,,它确实是一个普遍的研究领域。
我们已经声称人工智能是令人激动的,但是我们还没有说明它是什么。图1.1 中我们看到沿着两个维度排列的A的8种定义。顶部的定义关注思维过程与推理,而底部的定义却强调行为。左侧的定义根据与人类表现的逼真度来衡量成功与否,而右侧的定义依靠一个称为合理性( rationality)的理想的表现量来衡量。一个系统若能基于已知条件“正确行事”则它是合理的。
历史上,对AI的所有4种途径都有人关注,不同的人用不同的方法来追寻不同的途径。以人为中心的途径在某种程度上必是一种经验科学,涉及到关于人类行为的观察与假设理性论者的途径涉及到数学与工程的结合。不同的研究小组既相互批评又相互帮助。让我们更详细地考察一下这四种途径。
1. 像人一样行动:图灵测试的途径
由阿兰·图灵( Alan Turing)(1950)提出的图灵测试( Turing Test)的设计旨在为智能提供一个令人满意的可操作的定义。如果一位人类询问者在提出一些书面问题以后不区分书面回答来自人还是来自计算机,那么这台计算机就通过测试。目前,我们要注意的是:为计算机编程使之通过严格采用的测试还有大量的工作要做。计算机尚需具有以下能力:
自然语言处理( natural language processing)使之能成功地用英文交流;
知识表示( knowledge representation)以存储它知道的或听到的信息;
自动推理( automated reasoning)以运用存储的信息来回答问题并推出新结论;
机器学习( machine learning)以适应新情况并检测和预测模式。
因为人的物理模拟对智能是不必要的,所以图灵测试有意避免询问者与计算机之间的直接物理交互。然而,所谓的完全图灵测试( total Turing Test)还包括视频信号以便讯问者既可测试对方的感知能力,又有机会“通过舱口”传递物理对象。要通过完全图灵测试,计算机还需具有:
计算机视觉( computer vision)以感知物体;
机器人学( robotics)以操纵和移动对象。
这6个领域构成了AI的大部分内容,并且图灵因设计了一个60年后仍合适的测试而值得称赞。然而AI研究者们并未致力于通过图灵测试,他们认为研究智能的基本原理比复制样本更重要。只有在莱特兄弟和其他人停止模仿鸟并开始使用风洞且开始了解空气动学后,对“人工飞行”的追求才获得成功。航空工程的教材不会把其领域目标定义为制造“能完全像鸽子一样飞行的机器,以致它们可以骗过其他真鸽子”。
2. 像人一样思考:认知建模的途径
如果我们说某个程序能像人一样思考,那么我们必须具有某种办法来确定人是如何思考的。我们需要领会人脑的实际运用。有三种办法来完成这项任务:通过内省一一试图捕获我们自身的思维过程;通过心理实验—观察工作中的一个人;以及通过脑成像察工作中的头脑。只有具备人脑的足够精确的理论,我们才能把这样的理论表示成计算机程序。如果该程序的输入输出行为匹配相应的人类行为,这就是程序的某些机制可能也在人脑中运行的证据。例如,设计了GPS,即“通用问题求解器”( General Problem Solver)的艾伦·纽厄尔( Allen Newel)和赫伯特,西蒙( Herbert Simon)(Newe和 Simon,1961)并不满足于仅让其程序正确地解决问题。他们更关心比较程序推理步骤的轨迹与求解相同问题的人类个体的思维轨迹。认知科学( cognitive science)这个交叉学科领域把来自A的计算机模型与来自心理学的实验技术相结合,试图构建一种精确且可测试的人类思维理论。
认知科学本身就是一个迷人的领域,值得写几本教材和至少一部百科全书( Wilson和Kel,199)我们将偶尔评论AI技术与人类认知之间的异同。然而,真正的认知科学必然基于真实人或动物的实验调查与研究。我们把那方面的内容留给其他书籍,因为我们假定读者只有一台用于实验的计算机。
在A的早期,不同途径之间经常出现混淆:某位作者可能主张一个算法很好地完成一项任务,所以它是人类表现的一个好模型,或者反之亦然。现代作者区分这两种主张;这种区分使得AI和认知科学都能更快地发展。这两个领域继续相互丰富,通过将神经生理学证据吸收到计算模型中,这种相互作用在计算机视觉中体现得最明显。
3. 合理地思考:“思维法则”的途径
希腊哲学家亚里士多德是首先试图严格定义“正确思考”的人之一,他将其定义为不可反驳的推理过程。其三段论( syllogisms)为在给定正确前提时总产生正确结论的论证结构提供了模式一例如,“苏格拉底是人;所有人必有一死;所以,苏格拉底必有一死。”这些思维法则被认为应当支配着头脑的运行;他们的研究开创了称为逻辑学( logic)的领域。
19世纪的逻辑学家为关于世上各种对象及对象之间关系的陈述制订了一种精确的表示法(将这种表示法与通常的算术表示法做对比,后者只为关于数的陈述提供表示法)。到了1965年,已有程序原则上可以求解用逻辑表示法描述的任何可解问题(虽然如果不存在解,那么程序可能无限循环)。人工智能中所谓的逻辑主义( logicist)流派希望依靠这样的程序来创建智能系统。
对这条途径存在两个主要的障碍。首先,获取非形式的知识并用逻辑表示法要求的形式术语来陈述之是不容易的,特别是在知识不是百分之百肯定时。其次,在“原则上”可解一个问题与实际上解决该问题之间存在巨大的差别。甚至求解只有几百条事实的问题就可耗尽任何计算机的计算资源,除非关于先试哪个推理步计算机具有某种指导。虽然这两个障碍对建造计算推理系统的任何尝试都适用,但是它们最先出现在逻辑主义流派中。
4. 合理地行动:合理 Agent的途径
Agent就是能够行动的某种东西(英语的aent源于拉丁语的 agere,意为“去做”)当然,所有计算机程序都做某些事情,但是期望计算机 Agent做更多的事:自主的操作感知环境、长期持续、适应变化并能创建与追求目标。合理 Agent( rational agent)是一个为了实现最佳结果,或者,当存在不确定性时,为了实现最佳期望结果而行动的Agent。
在对AI的“思维法则”的途径中,重点在正确的推理。做出正确的推理有时也是合理Agent的部分作用,因为合理行动的一种方法是逻辑地推理出给定行动将实现其目标的结论,然后遵照那个结论行动。另一方面,正确的推理并不是合理性的全部:在某些环境中不要做可证正确的事情,但是仍然必须做某些事情。还有一些合理行动的方法不能被说成涉及推理。例如,从热火炉上退缩是一种反射行为,通常这种行为比仔细考虑后采取的较慢的行为更成功。
图灵测试需要的所有技能也允许一个 Agent合理地行动。知识表示与推理使Agent能够达成好的决定。我们必须能够生成可理解的自然语言句子以便在一个复杂的社会中勉强过得去。我们必须学习,不只是为了博学,而是因为学习可提高我们生成有效行为的能力。
合理 Agent的途径与其他途径相比有两个优点。首先,它比“思维法则”的途径更般因为正确的推理只是实现合理性的几种可能的机制之一。其次,它比其他基于人类行为或人类思维的途径更经得起科学发展的检验。合理性的标准在数学上定义明确且完全通用并可被“解开并取出”来生成可证实现了合理性的 Agent设计。另一方面,人类行为可以完全适应特定环境,并且可以很好地定义为人类做的所有事情的总和。所以本书将着重研究合理 Agent的一般原则以及用于构造这样的 Agent F的部件。我们将看到尽管间题可被陈述得貌似简单,但是在试图求解问题时各种各样的难题就出现了。
要记住的一个重点是:不久以后我们将看到实现完美的合理性—即总做正确的事情在复杂环境中不可行。其计算要求太高。然而,对本书的大部分内容,我们将采纳工作假设:完美的合理性对分析是一个好的出发点。这样既简化了问题又为该领域中的大多数基本素材提供了恰当的背景。