Agent:通过传感器感知所处环境并通过执行器对该环境产生作用的智能体
Agent感知序列:该Agent所接收到的是所有输入数据的完整历史
感知信息:智能体的感知输入
感知序列:感知信息的集合
Agent函数:描述Agent行为,将任意给定感知序列映射为行动
Agent程序:实现Agent函数
The agent function describes what the agent does in all circumstances
The agent program calculates the agent function
理性:Agent的一种属性,考虑到迄今为止的感知,他们选择能够最大化其预期效用的行为。
理性(Rationality)Agent:对于每个可能的感知序列,根据已知的序列提供的证据和智能体内建的先验知识,理性智能体应该选择期望能使其性能最大化的行动。
Rationality depends on:
全知Agent:全知Agent明确知道他的行动产生的实际结果并做出相应的动作,现实中不可能。理性 ≠ 全知
完美Agent:理性Agent使期望性能最大化;完美Agent使实际性能最大化。理性 ≠ 完美
理性Agent还应该是自主的,它应该学习,以弥补不完整的或者不正确的先验知识。
任务环境的规范包括:
To design a rational agent we need to specify a task environment
PEAS(性能Performance,环境 Environment, 执行器Actuators, 传感器Sensors)
例如,在Spam Filtering垃圾邮件过滤中
任务环境的属性
Agent = 体系结构 + 程序(Agent程序)
体系结构,具有物理传感器和执行器的计算装置
智能体程序,每接收到一个新的感知信息,就将其添加到感知序列中,并根据先验知识的对应表得到一个行动,把传感器的感知信息映射到行动的Agent函数
All agents have the same skeleton
Four basic types in order of increasing generality
各部件的工作
要点回顾如卜:
Agent是可以感知环境并在环境中行动的事物。
Agent函数指定Agent响应任何感知序列所采取的行动。
性能度量评价Agent在环境中的行为表现。给定Agent的感知序列,理性Agent行动追求性能度量预期值最大化。
任务环境的规范包括性能度量,外部环境,执行器和传感器。设计Agent时,第一步总是把任务空间定义得尽可能完全。
任务环境从不同的维度看有很多变化。它们可能是完全或部分可观察的,单Agent或多Agent的,确定性的或随机的,片段式的或延续式的,静态的或动态的,离散的或连续的,已知的和未知的。
Agent程序是Agent函数的实现。 有各种基本的Agent程序的设计,反映出显式表
现的以及用于决策过程的信息种类。设计可能在效率、压缩性和灵活性方面有变化。适当的 Agent 程序的设计依赖于环境的本性。
简单反射Agent直接对感知信息做出反应。基于模型的反射Agent保持内部状态,其操作直接从当前世界状态的内部模型派生,并随时间更新。基于目标的Agent选择能实现显示表示的目标的动作,而基于效用的Agent试图选择能最大化它期望效用的动作。
所有Agent都可以通过学习来改进它们性能。
实验代码下载:
https://github.com/yyl424525/AI_Homework
人工智能-一种现代方法中文第三版pdf、课件、作业及解答、课后习题答案、实验代码和报告、历年考博题下载:https://download.csdn.net/download/yyl424525/11310392