机器学习三要素及重要概念

学习与研究一个学科时,我们首先要知道这个学科最核心的组成部分是哪几个概念,这些概念之间有什么联系,各有什么作用。搞清了这些,后面的所有学习,只不过是围绕这些概念的树状图。
那么在机器学习方法中,我们的几个核心概念有哪些呢?

ps: 此专题为AI领域经典算法书籍及论文解析与代码复现,AI算法讲解。欢迎关注知乎专栏《致敬图灵》
https://www.zhihu.com/people/li-zhi-hao-32-6/columns
微信公众号:‘致敬图灵’。

1.明确概念

1.1模型

​ 模型就是我们要求的,可以由输入产生正确输出的函数或者概率模型。求出这个模型是我们最终的目标。因此我们第一步要确定模型的范围,也就是确定假设空间。

​ 下面介绍一下假设空间的概念,假设空间是指,由输入空间到输出空间的映射的集合。这个集合可以是条件概率分布,也可以是决策函数。

​ 条件概率分布的公式表达如下:


F = P ∣ P ( Y ∣ X ) F={P|P(Y|X)} F=PP(YX)
​ 决策函数的公式表达为:
F = { f ∣ Y = f θ ( X ) , θ ∈ R n } F=\left \{ f|Y=f_{\theta }(X),\theta \in R^{n} \right \} F={fY=fθ(X),θRn}
​ 上面所说的确定模型的范围就是指确定假设空间。

1.2策略

​ 由于假设空间是模型的集合,而我们要从集合中选择具体的模型,我们就应该考虑选择的指标与依据。策略就是考虑如何选择模型?

​ 我们所用到的策略方法有损失函数与风险函数两种。

1.2.1损失函数

​ 损失函数用来度量预测错误的程度。常用的损失函数有0-1损失函数(等于设定值损失为零,不等于损失为1),平方损失函数(设定值与预测值的差的平方),绝对损失函数(设定值与预测值的差的绝对值)。

​ 但是损失函数一般是用来度量模型对于一个样本的预测与分类的准确度。一般我们进行训练时,需要很多样本。

1.2.2风险函数

​ 若有多个样本,则可以通过求出每个样本的损失,然后求这些样本的平均损失,这个平均损失,就是模型的经验风险。风险函数可以度量模型对于多个样本的预测的准确度,除了经验风险,还有结构风险。

​ 结构化风险是为了防止模型的过拟合,加入了一个正则化项,这个正则化项是关于结构的函数,详细了解请google。

1.3算法

算法是指学习模型的具体的计算方法,也就是求模型中的具体的参数的方法。一般会用到最优化得算法,比如梯度下降等。

你可能感兴趣的:(机器学习)