人工智能复习参考
第1部分 绪 论
1-1. 什么是人工智能?试从学科和能力两方面加以说明。
人工智能是用计算机来表示和执行人类的智能活动 ,
人工智能(学科):是计算机科学中涉及研究、设计和应用智能机器的一个分支。其近期的主要目标在于研究用机器来模仿和执行人脑的某些智力功能,并开发相关理论和技术。
人工智能(能力):是智能机器所执行的通常与人类智能有关的智能行为,如判断、推理、证明、识别、感知、理解、通信、设计、思考、规划、学习和问题求解等思维活动。
1-2. 在人工智能的发展过程中,有哪些思想和思潮起了重要作用?
数理逻辑,关于计算的新思想
控制论思想
专家系统,机器学习,计算智能,人工神经网络等和行为主义的研究
1-3. 为什么能够用机器(计算机)模仿人的智能?
人类智能是一个非常复杂的行为,至今仍未能被完全解释。但人的一些初级认知过程目前计算机也能按类似的原理工作。再有,可以将人看是一个智能信息处理系统。作为信息处理系统又叫符号操作系统或物理符号系统。所谓符号就是模式。任一模式,只要它能与其他模式相区别,就是一个符号。一个完善的符号系统应具有下列6种基本功能:
(1)输入符号;
(2)输出符号;
(3)存储符号;
(4)复制符号;
(5)建立符号结构:通过找出各符号间的关系,在符号系统中形成符号结构;
(6)条件性迁移:根据已有符号,继续完成活动过程。
假设:任何一个系统,如果它能够表现出智能,那么它就必定能够执行上述6种功能;反之,任何系统如果具有这6种功能,那么它就能够表现出智能,这种智能指的是人类所具有的那种智能。把这个假设称为物理符号系统的假设。物理符号系统的假设伴随3个推论,
推论1:既然人具有智能,那么他(她)就一定是个物理符号系统。
推论2:既然计算机是一个物理符号系统,它就一定能够表现出智能。
推论3:既然人是一个物理符号系统,计算机也是一个物理符号系统,那么就能够用计算机来模拟人的活动。
1-4. 人工智能的主要研究和应用领域是什么?其中,哪些是新的研究热点?
研究领域:问题求解,逻辑推理与定理证明,自然语言理解,自动程序设计,专家系统,机器学习,神经网络,机器人学,模式识别,机器视觉,智能控制,智能检索,智能调度与指挥,分布式人工智能与Agent,计算智能与进化计算,数据挖掘与知识发现,人工生命,系统与语言工具。
研究热点:专家系统,机器学习,神经网络,机器人学,模式识别,分布式人工智能与Agent,数据挖掘与知识发现。
第2部分 知识表示
2-1. 什么是知识?知识的要素有哪些?知识的表示方法有哪些?
Feigenbaum:知识是经过削减、塑造、解释和转换的信息。简单地说,知识是经过加工的信息。
Bernstein:知识是由特定领域的描述、关系和过程组成的。
Hayes-Roth:知识是事实、信念和启发式规则。从知识库的观点看,知识是某领域中所涉及的各有关方面的一种符号表示。
知识要素:事实,规则,控制,元知识
知识表示方法:一阶逻辑表示法,产生式知识表示法,框架表示法,语义网络表示法,面向对象表示法
2-2. 状态空间法、问题归约法、谓词逻辑法和语义网络法的要点是什么?它们有何本质上的联系及异同点?
(ppt无)状态空间法:基于解答空间的问题表示和求解方法,它是以状态和算符为基础来表示和求解问题的。一般用状态空间法来表示下述方法:从某个初始状态开始,每次加一个操作符,递增地建立起操作符的试验序列,直到达到目标状态为止。
(ppt无)问题规约法:已知问题的描述,通过一系列变换把此问题最终变为一个子问题集合;这些子问题的解可以直接得到,从而解决了初始问题。问题规约的实质:从目标(要解决的问题)出发逆向推理,建立子问题以及子问题的子问题,直至最后把初始问题规约为一个平凡的本原问题集合。
谓词逻辑法:采用谓词合式公式和一阶谓词演算把 要解决的问题变为一个有待证明的问题,然后采用消解定理和消解反演来证明一个新语句是从已知的正确语句导出的,从而证明这个新语句也是正确的。
语义网络法:是一种结构化表示方法,它由节点和弧线或链组成。节点用于表示物体、概念和状态,弧线用于表示节点间的关系。语义网络的解答是一个经过推理和匹配而得到的具有明确结果的新的语义网络。语义网络可用于表示多元关系,扩展后可以表示更复杂的问题。
2-3. 如何用谓词公式表示知识?
用谓词公式既可表示事物的状态、属性和概念等事实性的知识,也可表示事物间具有因果关系的规则性知识。
用谓词公式表示知识的一般步骤
1.定义谓词及个体,确定每个谓词及个体的确切含义。
2.根据所要表达的事物或概念,为每个谓词中的变元赋以特定的值。
3.根据所要表达的知识的语义,用适当的连接符将各个谓词连接起来形成谓词公式。
2-4. 什么是产生式规则?产生式系统由哪些部分组成?说明各部分的功能。
产生式系统由三部分组成,即总数据库(或全局数据库)、产生式规则和控制策略。
总数据库又称为综合数据库、上下文、黑板等,用于存放求解过程中各种当前信息的数据结构。当产生式规则中某条规则的前提与总数据库中的某些事实相匹配时,该规则就被激活,并把其结论作为新的事实存入总数据库。
产生式规则是一个规则库,用于存放与求解问题有关的某个领域知识的规则之集合及其交换规则。规则库知识的完整性、一致性、准确性、灵活性和知识组织的合理性,将对产生式系统的运行效率和工作性能产生重要影响。(课件:用于描述相应领域内知识的产生式规则集合。)
控制策略为一个推理机构,由一组程序组成,用来控制产生式系统的运行,决定问题求解过程的推理线路,实现对问题的求解。
2-5. 说明产生式系统推理机的推理方式及推理过程。
产生式系统:有时,then部分用于规定动作;这时,称这种基于规则的系统为反应式系统(reaction system)或产生式系统。产生式系统:正向推理,逆向推理,双向推理。
产生式规则:
正向推理:从一组表示事实的谓词或命题出发,使用一组产生式规则,用以证明该谓词公式或命题是否成立。
逆向推理:从表示目标的谓词或命题出发,使用一组产生式规则证明事实谓词或命题成立,即首先提出一批假设目标,然后逐一验证这些假设。
双向推理:双向推理的推理策略是同时从目标向事实推理和从事实向目标推理,并在推理过程中的某个步骤,实现事实与目标的匹配。
2-6. 如何用框架表示法表示知识?如何用语义网络法表示知识?
框架表示法是以框架理论为基础发展起来的一种结构化的知识表示,它适用于表达多种类型的知识。框架理论的基本观点是:人脑已存储有大量的典型情景,当面临新的情景时,就从记忆中选择一个称作框架的基本知识结构,其具体内容依新的情景而改变,形成对新情景的认识又记忆于人脑中。
语义网络表示知识:一般由一些最基本的语义单元组成。这些最基本的语义单元被称为语义基元,可用如下三元组来表示为(节点1,弧,节点2)
用语义网络表示知识的步骤
1 确定问题总所有对象和各对象的属性。
2 确定所讨论对象间的关系。
3 根据语义网络中所涉及的关系,对语义网络中的节点及弧进行整理,包括增加节点、弧和归并节点等。
4 将各对象作为语义网络的一个节点,而各对象间的关系作为网络中各节点的弧,连接形成语义网络。
第3部分 知识推理
3-1. 什么是推理?推理的任务、分类。
推理是按某种策略由已知判断推出另一判断的思维过程
推理的基本任务是从一种判断推出另一种判断
分类:
演绎推理:从全称判断推导出特称判断或单称判断的过程
归结推理:从足够多的事例中归纳出一般性结论的推理过程,是一种从个别到一般的推理
默认推理:又称缺省推理,它是在知识不完全的情况下假设某些条件已经具备所进行的推理
3-2. 什么是置换?什么是合一?什么是归结?
置换:在谓词逻辑中,有些推理规则可应用于一定的合式公式和合式公式集,以产生新的合式公式。一个重要的推理规则是假元推理,这就是由合式公式和产生合式公式的运算。另一个推理规则是全称化推理,它是由合式公式产生合式公式,其中为任意常量符号。同时应用假元推理和全称化推理,例如,可由合式公式和生成合式公式。这就是寻找的对的置换,使与一致。
合一:寻找项对变量的置换,以使两表达式一致,叫做合一。如果一个置换作用于表达式集的每个元素,则用来表示置换例的集,称表达式集是合一的。如果存在一个置换使得:那么称此为的合一者,因为的作用是使集合成为单一形式。
归结:在谓词公式,某些推理规则以及置换合一等概念的基础上,能够进一步研究消解原理,有些专家把它叫做归结原理。
3-3. 化为子句形有哪些步骤? 请结合例子说明之。
3-4. 把下列句子变换成子句形式:
~ ("x){P(x)→{(" y)[p(y)→p(f(x,y))]∧(" y)[Q(x,y)→P(y)]}}
~ ("x){P(x)→{(" y)[p(y)→p(f(x,y))]∧(" y)[Q(x,y)→P(y)]}}
(1)消去蕴涵符号(只应用∨和~符号,以~A∨B替换A→B)
~ ("x){~P(x)∨{(" y)[~p(y) ∨p(f(x,y))]∧(" y)[~Q(x,y) ∨P(y)]}}
(2)减少否定符号的辖域(每个否定符号~最多只用到一个谓词符号上,并反复应用狄·摩根定律)
($x) {~{~P(x)∨{(" y)[~p(y) ∨p(f(x,y))]∧(" y)[~Q(x,y) ∨P(y)]}}}
($x) {P(x) ∧{~{(" y)[~p(y) ∨p(f(x,y))]∧(" y)[~Q(x,y) ∨P(y)]}}}
($x) {P(x) ∧{{~(" y)[~p(y) ∨p(f(x,y))]∨{~(" y)[~Q(x,y) ∨P(y)]}}}
($x) {P(x) ∧{($ y)[p(y) ∧~p(f(x,y))]∨($ y)[Q(x,y) ∧~P(y)]}}
(3)对变量标准化(对哑元(虚构变量)改名,以保证每个量词有其自己唯一的哑元)
($x) {P(x) ∧{($ y)[p(y) ∧~p(f(x,y))]∨($ ω)[Q(x, ω) ∧~P(ω)]}}
(4)消去存在量词(以Skolem函数代替存在量词内的约束变量,然后消去存在量词)
P(A) ∧{[p(B) ∧~p(f(A,B))]∨[Q(A, C) ∧~P(C)]}
(5)化为前束形:(把所有全称量词移到公式的左边,并使每个量词的辖域包括这个量词后面公式的整个部分)
(6)把母式化为合取范式(任何母式都可写成由一些谓词公式和(或)谓词公式的否定的析取的有限集组成的合取)
P(A) ∧{[p(B) ∨Q(A, C)]∧[p(B) ∨~P(C)]∧[~p(f(A,B)) ∨Q(A, C)]∧[~p(f(A,B))∨~P(C)]}
P(A) ∧[p(B) ∨Q(A, C)]∧[p(B) ∨~P(C)]∧[~p(f(A,B)) ∨Q(A, C)]∧[~p(f(A,B))∨~P(C)]
(7)消去全称量词(所有余下的量词均被全称量词量化了。消去前缀,即消去明显出现的全称量词)
(8)消去连词符号∧(用{A,B}代替(A∧B),消去符号∧。最后得到一个有限集,其中每个公式是文字的析取)
P(A)
p(B) ∨Q(A, C)
p(B) ∨~P(C)
~p(f(A,B)) ∨Q(A, C)
~p(f(A,B))∨~P(C)
(9)更换变量名称(可以更换变量符号的名称,使一个变量符号不出现在一个以上的子句中)
P(x1)
p(y1) ∨Q(x2, ω1)
p(y2) ∨~P(ω2)
~p(f(x3,y3)) ∨Q(x3, ω3)
~p(f(x4,y4))∨~P(ω4)
3-5. 简述用归结法证明定理的过程(消解反演求解过程)。
给出一个公式集S和目标公式L,通过反证或反演来求证目标公式L,其证明步骤如下:
(1)否定L,得到~L;
(2)把~L添加到S中去;
(3)把新产生的集合{~L,S}化成子句集F;
(4)(以前)应用消解原理,力图推导出一个表示矛盾的空子句
(现在ppt)反复归结子句集F中的子句,若出现了空子句,则停止归结,此时就证明了L永真
3-6. 如何通过消解反演求取问题的答案?
从反演树求取对某个问题的答案,其过程如下:
(1)把由目标公式的否定产生的每个子句添加到目标公式否定之否定的子句中去;
(2)按照反演树,执行和以前相同的消解,直至在根部得到某个子句为止;
(3)用根部的子句作为一个回答语句。
实质:把一棵根部有NIL的反演树变换为根部带有回 答语句的一棵证明树。
3-7. 与/或形演绎推理有哪几种推理方式? 简述推理过程
与/或形演绎推理推理方式:正向演绎、逆向演绎、双向演绎;
正向演绎:
从已知事实出发,正向地使用蕴含式(F规则)进行演绎推理,直至得到某个目标公式的一个终止条件为止。
事实表达式的与/或变换:1消去公式中的“à”;2把“ ”移到紧靠谓词的位置上;3重新命名变元名;4引入Skolem函数消去存在量词;5消去全称量词,且使各主要合取式中的变元不同名
把领域知识的表示形式变成规定形式的步骤 :1消去公式中的“à”;2把“ ”移到紧靠谓词的位置上;3 引入Skolem函数消去存在量词;4消去全称量词 5 恢复蕴含式
推理过程:
1用与/或树把已知事实表示出来
2用F规则的左部和与/或树的叶节点进行匹配,并将匹配成功的F规则加入到与/或树中
3重复第(2)步,直到产生一个含有以目标节点作为终止节点的解图为止
逆向演绎推理 :
从待证明的问题(目标)出发,通过逆向地使用蕴含式(B规则)进行演绎推理,直到得到包含已知事实的终止条件为止
变换过程与正向演绎推理中的已知事实的变换相似。先消去全称量词,方法是用存在量词约束的变元的Skolem函数消去全称量词约束的相应变元,然后在消去存在量词
推理过程:
1用与/或树把目标公式表示出来
2用B规则的右部和与/或树的叶节点进行匹配,并将匹配成功的B规则加入到与/或树中
3重复进行第 (2)步,直到产生某个终止在事实节点上的一致解图为止
与/或形双向演绎推理:
由表示目标及表示已知事实的两个与/或树结构组成,这些与/或树分别由正向演绎的F规则及逆向演绎的B规则进行操作,并且仍然限制F规则为单文字的左部,B规则为单文字的右部。
3-8. 研究不确定性推理有何意义?有哪几种不确定性?
现实世界中遇到的问题和事物间的关系往往比较复杂,客观事物存在的随机性、模糊性、不完全性和不精确性,往往导致人们认识上一定程度的不确定性。这是,若仍然采用经典的精确推理方法进行处理,必然无法反映事物的真实性。谓词,需要在不完全和不确定的情况下运用不确定知识进行推理,即进行不确定性推理。
(课件)意义:使计算机对人类思维的模拟更接近于人类的真实思维过程。
不确定性推理是一种建立在非经典逻辑基础上的基于不确定性知识的推理,它从不确定性的初始证据出发,通过运用不确定性知识,推出具有一定程度的不确定性的和合理的或近乎合理的结论。
由两种不确定性,即关于证据的不确定性和关于结论的不确定性。
3-9. 在什么情况下需要采用不确定推理?
选择不确定性表示方法时应考虑的因素:充分考虑领域问题的特征;恰当地描述具体问题的不确定性;满足问题求解的实际需求;便于推理过程中对不确定性的推算。
3-10. 简述概率方法、主观Bayes方法、可信度方法的主要推理方法
确定性推理:规约推理、消解演绎推理和规则演绎推理等。
主观Bayes方法:
可信度方法:(推理算法)组合证据的不确定性算法,不确定性的传递算法,多个独立证据推出同一假设的合成算法。
证据理论:(推理模型)概率分配函数与类概率函数,知识不确定性的表示,证据不确定性的表示,组合证据不确定性的表示,不确定性的传递算法。
第4部分机器学习
4-1 什么是学习和机器学习?为什么要研究机器学习?
学习(西蒙):学习就是系统在不断重复的工作中对本身能力的增强或者改进,使得系统在下一次执行同样任务或类似任务时,比现在做的更好或效率更高。
(课件)学习是系统所作的适应性变化,使得系统在下一次完成同样或类似的任务时更为有效。
机器学习:机器学习是研究如何使用机器来模拟人类学习活动的一门学科。稍为严格的提法是:机器学习是一门研究及其获取新知识和新技能,并识别现有知识的学问。
机器学习进入新阶段的重要性表现在以下诸多方面:
(1)机器学习已成为新的边缘学科并在高校形成一门课程。
(2)结合各种学习方法,取长补短的多种形式的继承学习系统研究正在兴起。
(3)机器学习与人工智能各种基础问题的统一性观点正在形成。
(4)各种学习方法的应用范围不断扩大,一部分已形成商品。
(5)数据挖掘和知识发现的研究已形成热潮,并在生物医学、金融管理、商业销售等领域得到成功应用,给机器学习注入新的活力。
(6)与机器学习有关的学术活动空前活跃。
(课件)机器学习的重要性:机器学习是人工智能的主要核心研究领域之一, 也是现代智能系统的关键环节和瓶颈;很难想象: 一个没有学习功能的系统能被称具有智能的系统;来自生物、金融与网络等各领域的数据,迫切需要分析或建立模型。
4-2 试述机器学习系统的基本结构,并说明各部分的作用。
环境向系统的学习部分提供某些信息,学习部分利用这些信息修改知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分。在具体的应用中,环境、知识库和执行部分决定了具体的工作内容,学习部分所需要解决的问题完全由上述三部分确定。
4-3 试说明归纳学习的模式和学习方法。
归纳学习的一般模式为:
给定:①观察陈述(事实)F,用以表示有关某些对象、状态、过程等的特定知识;②假定的初始归纳断言(可能为空);③背景知识,用于定义有关观察陈述、候选断言以及任何相关问题领域知识、假设和约束,其中包括能够刻画所求归纳断言的性质的优先准则。
求:归纳断言(假设)H,能重言蕴涵或弱蕴涵观察陈述,并满足背景知识。
学习方法:
(1)示例学习:示例学习又称为实例学习,它是通过环境中若干与某概念有关的例子,经归纳得出一般性概念的一种方法。在这种学习方法中,外部环境(老师)提供的是一组例子(正例和反例),它们是一组特殊的知识,每一个例子表达了仅适用与该例子的知识。示例学习就是要从这些特殊知识中归纳出适用于更大范围的一般性知识,以覆盖所有的正例并排除所有的反例。
(2)观察发现学习:观察发现学习又称为描述性概括,其目标是确定一个定律或理论的一般性描述,刻画观察集,制定其类对象的性质。观察发现学习可分为观察学习与机器发现两种。前者用于对事例进行聚类,形成概念描述;后者用于发现规律,产生定律或规则。
4-4 简述概念学习的基本过程,请结合例子说明之。
概念,可被看作一个对象或事件集合,它是从更大的集合中选取的子集,或在这个较大集合中定义的布尔函数。
概念学习问题的定义:
给定一个样例集合以及每个样例是否属于某个概念的标注,怎样推断出该概念的一般定义。又称从样例中逼近布尔函数。
概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。
已知:
实例集X:每个实例x由6个属性描述,每个属性的取值范围已确定
假设集H:每个假设h描述为6个属性的取值约束的合取
目标概念c:一个布尔函数,变量为实例
训练样例集D:目标函数(或目标概念)的正例和反例
求解:
H中的一假设h,使对于X中任意x,h(x)=c(x)
4-5 简述决策树方法及其使场合;在构造决策树的过程中,测试属性的选取采用什么原则?如何实现?
决策树学习是一种逼近离散值目标函数的方法,在这种方法中学习到的函数被表示为一棵决策树。学习得到的决策树也能再被表示为多个if-then的规则,以提高可读性。
决策树通过把实例从跟结点排列到某个叶子结点来分类实例,叶子结点即为实例所属的分类。树上的每一个结点指定了对实例的某个属性的测试,并且该结点的每一个后继分支对应于该属性的一个可能值。分类实例的方法是从这棵树的根结点开始,测试这个结点指定的属性,然后按照给定实例的该属性值对应的数值向下移动。然后这个过程在以新结点为根的子树上重复。
决策树学习最适合具有一下特征的问题:
(1)实例是由“属性-值”对表示的;
(2)目标函数具有离散的输出值;
(3)可能需要析取的描述;
(4)训练数据可以包含错误;
(5)训练数据可以包含缺少属性值的实例。
最佳分类属性:
信息增益:
用来衡量给定的属性区分训练样例的能力
ID3算法在增长树的每一步使用信息增益从候选属性中选择属性
用熵度量样例的均一性:
熵刻画了任意样例集的纯度
属性选择度量标准--分支指标:
信息增益:用信息增益度量期望的熵降低
增益比率:
基尼指数:
……
4-6 简述贝叶斯学习方法,有哪些特性?朴素贝叶斯分类器基于的假定是什么?请结合例子说明之。
贝叶斯推理提供了一种概率手段,基于如下的假定:待考察的量遵循某概率分布,且可根据这些概率及已观察到的数据进行推理,以作出最优的决策;贝叶斯推理为衡量多个假设的置信度提供了定量的方法;贝叶斯推理为直接操作概率的学习算法提供了基础,也为其他算法的分析提供了理论框架。
贝叶斯学习方法的特性:
(1)观察到的每个训练样例可以增量地降低或升高某假设的估计概率。而其他算法会在某个假设与任一样例不一致时完全去掉该假设;
(2)先验知识可以与观察数据一起决定假设的最终概率,先验知识的形式是:1)每个候选假设的先验概率;2)每个可能假设在可观察数据上的概率分布;
(3)贝叶斯方法可允许假设做出不确定性的预测;
(4)新的实例分类可由多个假设一起做出预测,用它们的概率来加权;
(5)即使在贝叶斯方法计算复杂度较高时,它们仍可作为一个最优的决策标准衡量其他方法。
朴素贝叶斯分类器引入一个简单的假定避免数据稀疏问题:在给定目标值时,属性值之间相互条件独立,即。
4-7 Bayes网的两个要素是什么?Bayes网蕴涵的条件独立假设是什么?简述Bayes网的推理模式。请结合例子说明之。
贝叶斯网的两个要素:一组条件独立性假定(可表示为一有向无环图)以及一组局部条件概率集合;
精确定义条件独立性:
令,和为3个离散值随机变量,当给定值时服从的概率分布独立于的值,称在给定时条件独立于,即
上式通常简写成
扩展到变量集合:
下面等式成立时,称变量集合在给定变量集合时条件独立于变量集合
推理模式:可以用贝叶斯网在给定其他变量的观察值时推理出某些目标变量的值
由于所处理的是随机变量,所以一般不会赋予目标变量一个确切的值
真正需要推理的是目标变量的概率分布,它指定了在给予其他变量的观察值条件下,目标变量取每一个可能值的概率
在网络中所有其他变量都确切知道的情况下,这一推理步骤很简单
一般来说,贝叶斯网络可用于在知道某些变量的值或分布时计算网络中另一部分变量的概率分布
4-8 什么是集成学习?Boosting算法的核心思想是什么?
集成学习是从假设空间中选择一个作为整体的假设集合称为集成,将它们对新实例的分类预测进行合成,然后再输出结果
动机—多个分类器出错的概率总会比单个分类器出错的概率要低
Boosting是一种最广泛使用的集成学习方法,其核心思想是加权训练
一般的学习算法获得的结果通常包含不少错误(甚至可以要求仅强于随机猜想即只要>1/2的正确率)—该算法可以被称为“弱学习”或者“基本学习”算法
Boosting算法多次调用这个弱学习算法,用不同的训练子集(每个样例赋予不同权值)每次从被调用算法获得一个弱假设 / 算法最终把上述弱假设组合起来,产生一个更加精确的单一假设,以获得更好的预测结果
4-9 什么是学习器L可PAC学习?
定义:考虑定义在长度为的实例集合上的一概念类别,学习器使用假设空间。当对所有,上的分布,满足以及满足时,学习器将以至少的概率输出一假设,使,这时称是使用的可PAC学习的。所使用的时间为,,以及的多项式函数。
这里的定义要求满足两个条件。首先,必须一任意高概率()输出一个错误率任意低()的假设。其次,学习过程必须是高效的,其时间最多以多项式方式增长,多项式中和定义了对输出假设要求的强度,和则定义了实例空间和概念类别中固有的复杂度。这里,为中实例的长度。
(以前复习题)
4-13 什么时候用EM算法?简述EM算法过程。
EM算法可用于变量的值从来没有被直接观察到的情形,只要这些变量所遵循的概率分布的一般形式已知。EM算法已被用于训练贝叶斯网以及径向基函数网络。EM算法还是许多非监督聚类算法的基础,而且它是用于学习部分可观察马尔科夫模型的广泛使用的Baum-Welch前向后向算法的基础。
在EM算法的一般形式里,它重复以下两个步骤直至收敛
步骤1:估计(E)步骤:使用当前假设h和观察到的数据X来估计Y上的概率分布以计算Q(h’|h)
步骤2:最大化(M)步骤:将假设h替换为使Q函数最大化的假设h’
当函数Q连续时,EM算法收敛到似然函数P(Y|h’)的一个不动点。若此似然函数有单个的最大值时,EM算法可以收敛到这个对h’的全局的极大似然估计。否则,它只保证收敛到一个局部最大值。
第5部分 展望
5-1 你怎样评价人工智能的发展与争论?争论与发展的关系如何?
任何新生事物的成长都不是一帆风顺的。人工智能也不例外。从人工智能孕育于人类社会的母胎时起,就引起人们的争议。人工智能自1956年问世以来,也是在比较艰难的环境中顽强地拼搏与成长的。一方面,社会上对人工智能的科学性有所怀疑,或者对人工智能的发展产生恐惧。另一方面,科学界内部对人工智能也表示怀疑。
真正的科学与任何其他真理一样,是永远无法压制的。人工智能研究必将排除千难万险,犹如滚滚长江,后浪推前浪,一浪更比一样高地向前发展。在我国,人工智能也开始迎来了它的春天。
随着人工智能的发展,它已从一致独秀发展为百花争艳。
上面已经提到计算机科学界对人工智能持有不同的看法。就在人工智能研究者内部,也存在集中不同的学派。近年来,他们围绕人工智能的基础理论和方法等问题,展开论战。这种争论必将促进人工智能的进一步发展。
5-2 人工智能不同学派在理论、方法和技术路线上各有何争论?
1.对人工智能理论的争论:
(1)符号主义:认为人的认知基元是符号,而且认知过程即符号操作过程。它认为人是一个物理符号系统,计算机也是一个物理符号系统,因此,我们能够用计算机来模拟人的智能行为,即用计算机的符号操作来模拟人的认知过程。也就是说,人的思维是可操作的。它还认为,知识是信息的一种形式,是构成智能的基础。人工智能的核心问题是知识表示、知识推理和知识运用。知识可用符号表示,也可用符号进行推理,因而有可能建立起基于知识的人类智能和机器智能的统一理论体系。
(2)连接主义:认为人的思维基元是神经元,而不是符号处理过程。它对物理符号系统假设持反对意见,认为人脑不用于电脑,并提出连接主义的大脑工作模式,用于取代符号操作的电脑工作模式。
(3)行为主义:认为智能取决于感知和行动(所以被称为行为主义),提出智能行为的“感知-动作”模式。行为主义者认为智能不需要知识、不需要表示、不需要推理;人工智能可以像人类智能一样逐步进化(所以称为进化主义);智能行为只能在现实世界中与周围环境交互作用而表现出来。行为主义还认为:符号主义(还包括连接主义)对真是世界客观事物的描述及其智能行为工作模式是过于简化的抽象,因而不能真实地反映客观存在。
2.对人工智能方法的争论:
(1)符号主义:认为人工智能的研究方法应该是功能模拟方法。通过分析人类认知系统所具备的功能和机能,然后用计算机模拟这些功能,实现人工智能。符号主义力图用数理逻辑方法来建立人工智能的统一理论体系,但遇到不少暂时无法解决的困难,并受到其他学派的否定。
(2)连接主义:主张人工智能应着重于结构模拟,即模拟人的生理神经网络结构,并认为功能、结构和智能行为是密切相关的。不同的结构表现出不同的功能和行为。已经提出多种人工神经网络和众多的学习算法。
(3)行为主义:认为人工智能的研究方法应采用行为模拟方法,也认为功能、结构和智能行为是不可分的。不同的行为表现出不同的功能和不同的控制结构。行为主义的研究方法也受到其他学派的怀疑与批判,认为行为主义最多只能创造出智能昆虫行为,而无法创造出人的智能行为。
3.对人工智能技术路线的争论:
(1)专用路线:强调研制与开发专用的智能计算机、人工智能软件、专用开发工具、人工智能语言和其他专用设备。
(2)通用路线:认为通用的计算机硬件和软件能够对人工智能开发提供有效的支持,并能够解决广泛和一般的人工智能问题。通用路线强调人工智能应用系统和人工智能产品的开发,应与计算机主体技术和主流技术相结合,并把知识工程视为软件工程的一个分支。
(3)硬件路线:认为人工智能的发展主要依靠硬件技术。该路线还认为智能机器的开发主要依赖于各种智能硬件、智能工具及其固化技术。
(4)软件路线:强调人工智能的发展主要依靠软件技术。软件路线认为智能机器的研制主要在于开发各种智能软件、工具及其应用系统。
5-3 人工智能的发展对人类有哪些方面的影响?试结合自己了解的情况和理解,从经济、社会和文化等方面加以说明?
1.人工智能对经济的影响:
(1)专家系统的效益
(2)人工智能推动计算机技术的发展
2.人工智能对社会的影响:
(1)劳务就业问题
(2)社会结构变化
(3)思维方式与观念的变化
(4)心理上的威胁
(5)技术失控的危险
3.人工智能对文化的影响:
(1)改善人类知识
(2)改善人类语言
(3)改善文化生活
5-4 试评述人工智能的未来发展。
1.更新的理论框架
2.更好的技术集成
3.更成熟的应用方法
5-5 你对“人工智能” 课程及其教学有何建议?