强化学习02——基本概念

 

强化学习02——基本概念_第1张图片

一、基本概念

数据集:用于学习的数据的集合

样本:一个单独的个体成为一个样本

特征:一个样本具备的某些特质

​​

属性空间:属性取值范围

特征向量:一个样本

训练:从数据中学得模型的过程

训练集:训练过程中使用的数据

假设:学得模型对应了关于数据的某种潜在的规律

模型:学习算法在给定数据和参数空间上的实力化

样例:拥有了标记信息的样本成为样例,一般用表示第i个样例,其中 y_i \in \alpha是样本x_i的标记,\gamma是所有标记的集合

二、监督学习

  • 基本概念

给定一个样本,给予对应的标签

  • 理解

给小孩一个糖,然后告诉他这是糖

二、 无监督学习

  • 基本概念

给定一个样本,让其自己分类

  • 理解

给小孩一堆糖,他自己可能把大个的糖分为一堆,小个的糖分为另外一堆

三、强化学习

  • 基本概念

        是指一类从交互中不断学习的问题以及解决这类问题的方法。强化学习可以描述为一个智能体从与环境的交互中不断学习以完成特定目标。

  • 理解

        一个小孩,在不断成长中,做错了就挨打,做对了就奖励,最终逐渐变成一个成功人士的过程(怎么感觉像驯兽)。

 

 

你可能感兴趣的:(机器学习)