人工智能的3个主流学派:
人工智能定义:是研究理解和模拟人类智能、智能行为及其规律的一门学科。主要任务—— 建立智能信息处理理论,进而设计可以展现某些近似于人类智能行为的计算系统。
物理符号系统的六种基本功能
(1)输入符号(input)
(2)输出符号(output)
(3)存储符号(store)
(4)复制符号(copy)
(5)建立符号结构:通过找出各符号间的关系,在符号系统中形成符号结构;
(6)条件性迁移(conditional transfer):根据已有符号,继续完成活动过程。
物理符号系统的假设:任何系统如果具有这6种功能,那么它就能够表现出智能;这种智 指的是人类所具有的那种智能。
人工智能的研究与应用领域:智能感知 智能推理 智能学习 智能行动
计算机模式识别系统由三部分组成:数据采集 数据处理 分类决策或模型匹配
专家系统组成:知识库 推理机
知识发现的四个特征:
知识的表示方法主要分为:
知识的特性:
知识的分类:
知识表示=数据结构+处理机制
选择知识表示方法的原则:
智能的4要素:信息 知识 策略 行为
智能的4个能力包括:
信息、知识、智能之间的关系
AI对知识表示方法的要求
经典逻辑推理:自然推理 归结推理 与或形推理
命题的两种类型:原子命题和复合命题
谓词公式化简为子句集的步骤
一阶谓词逻辑知识表示法的特点
归结推理:在定理证明系统中,已知一公式集F1,F2,…,Fn,要证明一个公式W (定理)是否成立,即要证明W是公式集的逻辑推论时,一种证明法就是要证明F1∧F2∧…∧Fn→W为永真式。
产生式知识表示:
产生式与谓词逻辑中的蕴含式的区别:
产生式系统的要素:
控制策略可分为两类:
三种控制方式比较:
不可撤回方式相当于沿着单独的一条路向下延伸搜索下去;
回溯方式则不保留完整的搜索树结构,只记住当前工作的一条路径,回溯就是对这条路 径进行修正;
图搜索方式则记下完整的搜索树 。
架系统和语义网络是人工智能中最常用的两种结构化知识表示方法,
面向对象的表示方法是很有发展前途的结构化知识表示方法。
语义网络是由节点和边组成的一种有向图。其中节点表示事物、对象、概念、行为、性质、状态等;有向边表示节点之间的某种联系或关系。
框架表示法:一种结构化的知识表示方法,已在多种系统中得到应用。
框架(frame):一种描述所论对象(一个事物、事件或概念)属性的数据结构。
脚本(script)是一种结构化的表示,用来描述特定上下文中固定不变的事件序列。
脚本组成:
知识图谱本质上是语义网络(semantic network)知识库
逻辑表示方法的优点:(1)严格性 (2)通用性 (3)自然性(4)明确性(5)模块性
不足:(1)效率低 (2)灵活性差
搜索就是找到智能系统的动作序列的过程。
求解问题包括:
搜索可以根据是否使用启发式信息分为:
按表示方式分:
搜索策略评价标准:完备性 时间复杂性 空间复杂性 最优性
搜索控制策略:
启发式搜索:如果在选择节点时能充分利用与问题有关的特征信息,估计出节点的重要性,就能在搜索时选择重要性较高的节点,以便求得最优解。
用来评估节点重要性的函数称为评估函数。
评估函数为:f(x)=g(x)+h(x)
g(x)——从初始节点S0到节点x的实际代价;
h(x)——从x到目标节点Sg的最优路径的评估代价,它体现了问题的启发式信息,其 形式要根据问题的特性确定,h(x)称为启发式函数。
在图搜索策略的基础上,给出A*算法。
评估函数f :f(n) = g* (n)+h* (n)
g* (n)为起始节点到节点n 的最短路径的代价,
h* (n)是从n 到目标节点的最短路径的代价
推理是人类的思维过程,它是从已知事实(证据)出发,通过运用相关的知识逐步推出某个结论的过程。
其中已知事实和知识是构成推理的两个基本要素。
不确定性推理就是从不确定性初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。
由于证据和规则的不确定性,导致了所产生的结论的不确定性
不确定性推理反映了知识不确定性的动态积累和传播过程,推理的每一步都需要综合证据和规则的不确定因素,通过某种不确定性测度,寻找尽可能符合客观实际的计算模式,通过不确定测度的传递计算,最终得到结果的不确定测度。
在专家系统中,不确定性表现在证据、规则和推理三个方面
要实现对不确定性知识的处理,要解决:
两种不确定性推理:
推理系统的定理集合随着推理过程的进行而单调地增大。
在C-F模型中,确定性因子定义为信任与不信任的差,CF(H,E)定义为:CF(H,E)=MB(H,E)-MD(H,E)
MB(Measure Belief,MB)称为信任增长度
MD(Measure Disbelief,MD)称为不信任增长度
当MB(H,E)>0时,有P(H,E)>P(H),这说明由于E所对应的证据的出现增加了H的信任程度,但不信任程度没有变化。
当MD(H,E)>0时,有P(H,E)<P(H),这说明由于E所对应的证据的出现增加了H的不信任程度,而不改变对其信任的程度。
若CF(H,E)>0,则P(H|E)>P(H)。说明由于前提条件E所对应证据的出现增加了H为真的概率,即增加了H的可信度,CF(H,E)的值越大,增加H为真的可信度就越大。 。这说明由于前提条件E所对应证据的出现减少了H为真的概率,即增加了H为假的可信度,CF(H,E)的值越小,增加H为假的可信度就越大。 根据CF、MB、MD的定义,可得性质: 模糊集合的定义 模糊决策:最大隶属度法 、加权平均判决法、中位数法 机器学习的基本结构: 选择表示方式时要兼顾以下4个方面: 强化学习(reinforcement learning),又称再励学习或评价学习。所谓强化学习就是智能系统从环境到行为进行映射的学习,目的是使强化信号(回报函数值)最大。强化学习主要包括**感知、行动、奖赏(评价)**三个环节。 有监督学习:网络的输出有一个评价的标准,网络将实际输出和评价标准进行比较,由其误差信号决定连接权值的调整。评价标准是由外界提示给网络的,相当于由有一位知道正确结果的教师示教给网络,故这种学习又称为有教师学习。在这种学习中网络的连接权值一般根据δ规则进行调整。 有监督学习具有分类精细、准确的优点,但学习过程复杂。 混合学习过程一般事先用无监督学习抽取输入数据的特征,然后将这种内部表示提供给有监督学习进行处理,以达到输入输出的某种映射。 NN的性质和能力: 神经元模型: 网络结构:单层前馈网络、多层前馈网络、递归网络 深度学习是一类基于神经网络的机器学习算法,网络结构包含两个以上非线性隐含层。 简述误差反向传播学习算法的主要思想。 什么是可信度?由可信度因子 CF(H,E)的定义说明它的含义
若CF(H,E)<0,则P(H|E)
(1)互斥性: 对同一证据,它不可能既增加对H的信任程度,又同时增加对H的不信任程度,这说明MB与MD是互斥的。即有如下互斥性,
当MB(H,E)>0时,MD(H,E)=0
当MD(H,E)>0时,MB(H,E)=0
(2)值域
0≤MB(H,E)≤1
0≤MD(H,E)≤1
-1≤CF(H,E)≤1
(3)典型值
当CF(H,E)=1时,有P(H|E)=1,它说明由于E所对应证据的出现使H为真。此时,MB(H,E)=l,MD(H,E)=0
当CF(H,E)=-1时,有P(H|E)=0,说明由于E所对应证据的出现使H为假。此时,MB(H,E)=O,MD(H,E)=1
当CF(H,E)=0时,则P(H|E)=P(H),表示H与E独立即E所对应的证据的出现对H没有影响。
(4)对H的信任增长度等于对非H的信任增长度
论域:所讨论的全体对象,用 U 等表示。
元素:论域中的每个对象,常用a,b,c,x,y,z表示。
集合:论域中具有某种相同属性的确定的、可以彼此区别的元素的全体,常用A,B等表示。
在经典集合中,元素a和集合A的关系:a属于A 或 a不属于A,即只有两个真值“真”和“假”。
无监督学习(无教师学习):一种自组织学习,此时网络的学习完全是一种自我调整的过程,不存在外部环境的示教,也不存在来自外部环境的反馈来指示网络期望输出什么或者当前输出是否正确。无监督学习可以实现主分量分析 (Principle Component Analysis)、聚类 (Clustering)、编码 (Encoding)以及特征映射 (Feature Mapping)的功能。
无监督学习具有分类灵活、算法简练的优点,但学习过程较慢。
误差反传算法的主要思想是把学习过程分为两个阶段:第一阶段
(正向传播过程)给出输入信息通过输入层经隐含层逐层处理并计算每个单元
的实际输出值;第二阶段(反向过程),若在输出层未能得到期望输
出值,则逐层递归的计算实际输出与期望输出之差值(误差)以便根据此差值
调节权值。
人们在长期的实践活动中,对客观世界的认识积累了大量的经验,当面临一个新事物或新情况时,往往可用这些经验对问题的真、假或为真的程度作出判断。这种根据经验对一个事物或现象为真的相信程度称为可信度。
在 C-F 模型中,知识是用产生式规则表示的,其一般形式为:
IF E THEN H (CF(H, E))
其中,CF(H, E)是该条知识的可信度,称为可信度因子。
CF(H, E)反映了前提条件与结论的联系强度。它指出当前提条件 E 所对应的证据为真时,它对结论 H 为真的支持程度,CF(H, E)的值越大,就越支持结论 H 为真。