1.智能Agent的特点:

可自主操作、感知环境、持续动作、顺应变化、实现目标和最佳结果(或者最佳预期结果)。

概括地说,一个智能体可以被看作具有如下功能的任何事物:

  • 通过感受器感知外部环境,并且通过执行器作用于外部环境。
  • 可以通过学习或者应用知识来实现其目标。

2.理性Agent

定义:是一个有正确行为的智能体——该功能表中的每个条目都正确填写。

对于正确行为的解释:

  • 一个智能体在一个环境中依据感知生成一系列的动作。
  • 这些动作由一系列状态而引起环境发生变化。
  • 如果该系列变化是所期望的,则该智能体表现良好。

对于理性的理解:

理性是指探索、学习和自主的。

理性的动作是指对给定的感知序列,能使期待的性能指标最大化

理性同样依赖于四件事:

  • 定义成功标准的性能指标。
  • 智能体对环境的先验知识。
  • 智能体所能够完成的动作。
  • 智能体最新的感知序列。

3.PEAS

定义:PEAS是一种任务环境的规范,四个大写字母的缩写分别代表Performance(性能)、Environment(环境)、Actuators(动作器)和Sensors(感受器)。

不同的环境类型:

  • 完全可观测和部分可观测。一个智能体的传感器在每个时间点上可访问环境的完整状态,则该任务环境就是完全可观测的。
  • 单智能体和多智能体。一个智能体在一个环境内自运行,则它就是一个单智能体。
  • 确定性和随机性。环境的下一个状态完全由当前的状态和该智能体执行的动作所决定,则该环境是确定的。
  • 阵发性和连续性。智能体的动作过程被分为原子的片段,并且每个片段的动作选择仅仅依赖于片段本身。
  • 动态与静态。如果环境随智能体的行为而改变,则该智能体的环境是动态的;否则是静态的。
  • 离散与连续。离散与连续的区别在于环境的状态、时间处理的方式、以及感知和智能体的动作。
  • 已知与未知。在一个已知的环境下,所有动作的结果都是给定的。如果环境是未知的,则该智能体将需要学习如何动作,以便于做出正确的决策。

4.智能体的结构

智能体的结构如下图所示:

screenShot.png

智能体的层次:智能体通常表现为一个分层的结构,它包含许多"子智能体",而子智能体处理和执行较低级的功能。智能体和子智能体构建一个完整的系统,它可以通过行为和反应来完成艰巨的任务。

表示智能体状态的三种方式:

  • 原子式:每个状态是一个黑盒子,没有内部结构。
  • 因子式:每个状态由一组固定的属性和值组成。
  • 结构式:每个状态包含对象,每个具有属性以及与其他对象的关系。
screenShot.png

5.智能体的主要类别

下面介绍的5种类型的智能体,体现几乎所有智能系统的基本原理。

  • 简单反射智能体。
  • 基于模型的反射智能体。
  • 基于目标的智能体。
  • 基于效用的智能体。
  • 学习智能体。

简单反射智能体

简单反射智能体仅仅在当前感知的基础上动作,忽略其余的感知历史。

智能体功能是基于条件动作规则:if 条件 then 动作。

screenShot.png

关于简单反射智能体:

  • 仅当外部环境为完全可测时,该智能体的功能才能发挥。
  • 某些反射智能体也可以包含关于其当前状态的信息,允许它们忽视执行器已被触发的条件。
  • 智能体在部分可观测的环境下运行时,无限循环往往是无法避免的。
  • 如果智能体可以随机产生其动作,有可能从无限循环中摆脱出来。

模型反射智能体

一个基于模型的反射智能体可以处理部分可观测环境。

其当前状态存储在智能体中,维护某种结构,它描述不可见外部环境中的一部分。

screenShot.png

关于基于模型反射智能体:

  • 关于"外部环境如何运作"的知识被称为一个外部环境模型,由此得名"基于模型的智能体"。
  • 基于模型的反射智能体将保持某种内部模型。
  • 内部模型依赖于感知的历史,因此至少反射某些当前状态无法观测的方面。
  • 它作为反射智能体以某种方式选择动作。

一个基于模型的反射智能体算法。它采用一个内部模型来保持当前外部环境状态的轨迹,然后用等同于简单反射智能体的方式选择一个动作。

基于目标智能体

通过利用"目标"信息,基于目标的智能体进一步扩展了基于模型的智能体的功能。

screenShot.png

关于基于目标智能体:

  • 目标信息描述所希望的情形。
  • 它允许智能体在多个可能性之间选择一种方式,挑选出达到目标状态的那一个。
  • 搜索和规划是人工智能的子领域,致力于发现达到智能体目标的动作序列。
  • 在某些情况下,基于目标的智能体似乎不太有效,但是它更为灵活,因为这种支持其决策的知识明显地展示出来,并且可以被修改。

基于效用的智能体

一个特殊的状态可通过一个效用函数得到,该函数将一个状态隐射到该状态效用的度量。

screenShot.png

关于基于效用的智能体:

  • 一种更通用的性能度量,应该根据它们使得智能体多么"高兴"的程度,允许对不同的外部环境状态进行比较。
  • 效用这个术语,可用于描述智能体是多么高兴。
  • 一个理性的基于效用的智能体选择动作,将动作的期待效应最大化。
  • 一个基于效用的智能体需要建模并记录环境、任务轨迹,这涉及大量的感知、表征、推理和学习的研究。

学习智能体

学习允许智能体最初在未知的环境中运行,并且与其最初的知识相比,会变得越来越胜任。

screenShot.png

关于学习智能体:

  • 学习要素:它利用评论者对智能体如何动作的反馈,然后决定应该如何修改性能要素以便于未来做的更好。
  • 性能要素:获得感知并决定动作。
  • 问题发生器:它对推荐的动作负责,这将形成新的经验。

智能体的分类法

screenShot.png