《人工智能:一种现代的方法》总结 第二章

第二章 智能Agent


这一章主要讨论了Agent的各个方面,给读者一个初步的了解。

Agent是什么?Agent,在我看来,是一个在环境中,可以感知周围环境,并根据环境而进行动作的一个object。当然,我们需要的是一个理性的Agent。而理性的Agent做出的动作,应该是让它的性能度量最大化的动作,也就是说,该动作是一个正向性的动作。

当然,不同的价值观对于正向的标准是不同的,所以一个智能Agent需要根据所了解的知识来做出相应的行为。但是它又不能仅仅是根据其设计人员的价值观来判断事物,这样的话它就缺乏了自主性。我们需要的理性Agent应该能通过自身的学习来弥补之前的所了解的不足和缺陷。就如同刚出生的婴儿一般,理性Agent刚开始的时候可能会存在诸多随机的行为来处理事务,但是根据经验的积累,就逐渐形成了一套此Agent认为的价值观。

由于智能Agent依赖与环境,所以我们需要知道环境的性质。PEAS(性能,环境,执行器,传感器)是我们设计Agent的时候需要首先详细说明清楚的任务环境。它存在着很多维度:观察性,传感器是否可以完全记录Agent周围环境的状态;Agent数量,需要多少Agent
来完成特定的任务;随机性,环境中下一个状态是否完全取决于Agent
根据当前环境执行的动作;延续性,Agent的下一个片段是否依赖于之前片段中采取的行动;动态性,环境是否会变化;连续性,变化是否连续;未知性,Agent知识库中是否知道次问题的解决办法。

Agent其自身也存在着结构。Agent是一个体系结构和程序的组合,程序一定要适应体系结构。本书继续介绍了四种基本的Agent程序:简单反射Agent,它仅仅根据当前的环境感知来选择动作,它虽然很简洁,它的智能却是很有限的,并且很多情况现会陷入无限循环当中,随机化是解决这个问题的一个很好的办法;基于模型反射的Agent,根据感知历史来维持内部状态,并且根据已有的知识反应出当前状态无法看到的信息,再来选择动作;基于目标的Agent,根据当前状态以及目标信息来确定动作,也就是说它和之前两种不同的是,它考虑了动作的结果,当然,因此它的效率就会相对低,但是它可以使过程变得相对更灵活;基于效用的Agent,它在之前三种的基础上增加了对于行动结果的效益判断,它可以使期望效用最大化,但是对于这点需要深一步的研究。

学习Agent,由评判元件、学习元件、性能元件、问题产生器构成。学习元件通过评判元件的反馈来让Agent知道如何能做的更好,并确定如何修改负责动作的性能元件,问题产生器就是提供实验行动的元件。

你可能感兴趣的:(人工智能,智能Agent)