本文是中国人工智能学会编著的《人工智能导论(面向非计算机专业)》一书第一章的摘要与笔记,仅供个人学习之用。其它章节请访问下列相应 URL。
第一章 绪论(本章)
第二章 概念表示
现代人工智能的起源公认是 1956 年的达特茅斯会议。
时至今日,还没有一个被大家一致认同的精确的人工智能定义。
但目前最常见的 AI 定义有两个:
① 一个是明斯基提出的,即“人工智能是一门科学,是使用机器做那些人需要通过智能来做的事情”;
② 另一个更专业一些的定义是尼尔森给出的,即“人工智能是关于知识的科学”,所谓“知识的科学”就是研究知识的表示、知识的获取和知识的运用。
在这两个定义中,专业人士更偏向于第二个定义。原因很简单,因为第一个定义中涉及两个未明确定义的概念,一个是人,一个是智能。什么是人?什么是智能?到现在依然是很难清楚回答的问题。相比之下,第二个定义只涉及一个未明确定义的概念,就是知识。
在人、智能、知识三个概念当中,知识被研究的应该是比较彻底的。同时,人和智能的定义也与知识紧密相关,而且知识是智能的基础。如果没有任何知识,很难发现什么是智能。
根据前面的论述,我们知道要理解人工智能就要研究如何在一般的意义上定义知识。可惜的是准确定义知识也是一个十分复杂的事情。
但关于知识,至少有一点是明确的,那就是知识的基本单位是概念。 精通掌握一门知识,必须从这门知识的基本概念开始学习。而知识自身也是一个概念。
据此,人工智能的问题就变成了如下三个问题——如何定义(或者表示)一个概念、如何学习一个概念、如何应用一个概念。
经典概念的定义由三部分组成:第一部分是概念的符号表示,即概念的名称,说明这个概念叫什么,简称概念名;第二部分是概念的内涵表示,由命题来表示,命题就是能判断真假的陈述句;第三部分是概念的外延表示,由经典集合来表示,用来说明与概念对应的实际对象是哪些。
概 念 定 义 的 组 成 { 概 念 的 符 号 表 示 概 念 的 内 涵 表 示 概 念 的 外 延 表 示 概念定义的组成 \begin{cases} 概念的符号表示 \\ 概念的内涵表示 \\ 概念的外延表示 \end{cases} 概念定义的组成⎩⎪⎨⎪⎧概念的符号表示概念的内涵表示概念的外延表示
举一个常见的经典概念的例子——素数。其概念名在汉语中为“素数”,在英语中为“prime number”;其内涵表示是一个命题:只能够被 1 和自身整除的自然数;其外延表示是一个经典集合:{1,2,3,5,7,11,13,17,…}。
很容易发现,经典概念定义的三部分各有其作用,且彼此不能互相代替。具体来说,概念有三个作用或功能,要掌握一个概念,必须清楚其三个功能。
第一个功能是概念的指物功能,即指向客观世界的对象,表示客观世界的对象的可观测性。
举一个《阿Q正传》里的例子:那赵家的狗,何以看我两眼呢?句子中“赵家的狗”应该是指现实世界当中的一条真正的狗。
但概念的指物功能有时不一定能够实现,有些概念其设想存在的对象在现实世界并不存在,例如“鬼”。
第二个功能是指心功能,即指向人心智世界里的对象,代表心智世界里的对象表示。 概念的指心功能一定存在。如果对于某一个人,一个概念的指心功能没有实现,则该词对于该人不可见,简单说,该人不理解该概念。
鲁迅有一篇著名的文章《论丧家的资本家的乏走狗》,显然,这个“狗”不是现实世界的狗,只是他心智世界中的狗,即心里的狗(在客观世界,梁实秋先生显然无论如何不是狗)。
最后一个是指名功能,即向认知世界或者符号世界表示对象的符号名称,这些符号名称组成各种语言。
最著名的例子是乔姆斯基的“colorless green ideas sleep furiously”,这句话翻译过来是“无色的绿色思想在狂怒地休息”。这句话没有什么意思,但是完全符合语法,纯粹是在语义符号世界里,即仅仅指向符号世界而已。
概 念 的 功 能 { 指 名 功 能 指 物 功 能 指 心 功 能 概念的功能 \begin{cases} 指名功能 \\ 指物功能 \\ 指心功能 \end{cases} 概念的功能⎩⎪⎨⎪⎧指名功能指物功能指心功能
知道了概念的三个功能之后,就可以理解人工智能的三个流派以及各流派之间的关系。人工智能也是一个概念,而要使一个概念成为现实,自然要实现概念的三个功能。 人工智能的三个流派关注于如何才能让机器具有人工智能,并根据概念的不同功能给出了不同的研究路线。
符号主义提出了物理符号系统假设:只要在符号计算上实现了相应的功能,那么在现实世界就实现了对应的功能,这是智能的充分必要条件。
著名的“图灵测试”就是在符号层面进行的。有了图灵测试,我们就可以将研究的重点放在智能的外在功能性表现上,使智能在工程上看似乎是可以实现和判断的。
但在指名功能里实现了概念的功能,并不能说明一定实现了概念的功能。实际上,根据指名与指物的不同,哲学家 Searle 专门设计了著名的“中文屋实验”用来批判图灵测试。这是哲学上对符号主义的一个正式批评,明确指出了按照符号主义实现的人工智能不等同于人的智能。
连接主义认为大脑是一切智能的基础,主要关注于大脑神经元及其连接机制,试图发现大脑的结构及其处理信息的机制、揭示人类智能的本质机理,进而在机器上实现相应的模拟。
按照这条路,连接主义认为可以实现完全的人工智能。对此,哲学家普特南设计了著名的“缸中之脑”实验,可以看作是对连接主义的一个哲学批判。缸中之脑实验说明即使连接主义实现了,指心没有问题,但指物依然存在严重问题。因此,连接主义实现的人工智能也不等同于人的智能。
尽管如此,连接主义仍是目前最为大众所知的一条 AI 实现路线。在围棋上,采用了深度学习技术的 AlphaGo 战胜了李世石,之后又战胜了柯洁。在机器翻译上,深度学习技术已经超过了人翻译的水平。在语音识别和图像识别上,深度学习也已经达到了实用水准。客观地说,深度学习的研究已经取得了工业级的进展。
行为主义假设智能取决于感知和行动,不需要知识、表示和推理,只需要将智能行为表现出来就好,即只要能实现指物功能就可以认为具有智能了。
对此,哲学家普特南也设计了“完美伪装者和斯巴达人”实验,可以看作是对行为主义的哲学批判。因此,行为主义路线实现的人工智能也不等同于人的智能。
简单地说,人工智能三大流派假设之所以能够成立的前提是指名、指物、指心功能等价。 然而,在现实生活中概念的指名、指物与指心功能并不等价,单独实现概念的一个功能并不能保证具有智能。因此,单独遵循一个学派不足以实现人工智能,现在的人工智能研究已经不再强调人工智能的单一学派。很多时候会综合各个流派的技术。
在围棋上战胜人类顶尖棋手的 AlphaGo 综合使用了三种学习算法——强化学习(行为主义)、蒙特卡罗树搜索(符号主义)、深度学习(连接主义)。
目前的人工智能还有很大的缺陷,其使用的知识表示还是建立在经典概念的基础之上。经典概念的基本假设还是指名、指物与指心等价,这与人类的日常生活经验严重不符,过于简单化了。因此,在经典概念表示不成立的情况下,如何进行概念表示是一个极具挑战性的问题。