机器学习_基本机器学习术语

文章目录

  • 介绍机器学习的基本术语
    • 1、特征
    • 2、标签
    • 3、模型


介绍机器学习的基本术语

机器学习_基本机器学习术语_第1张图片

这里主要介绍特征、标签、模型

1、特征

含义:用于描述数据的输入变量。

特征是机器学习中的输入,原始的特征描述了数据的属性。它是有维度的。特征的维度指的是特征的数目(不是数据集里面样本的个数),不同的数据集中的数据特征的维度不同,有多有少。

  • 少,可以少到仅有一个特征,也就是一维特征数据。比如房价(标签)仅依据房屋面积(特征)而定。
  • 多,可以多到几万,几十万。比如一个100pxx100px的RGB彩色图片输入,每一个像素都可以视为一个特征,也就是1万维,再乘以RGB3个颜色通道,那么这个小小的图片数据的特征维度就可以达到3万维。

举例来说,如果预测商品的销量,把商品的类别、价格和推荐级别这3个属性定义为商品的特征,那么这个数据集就是三维特征数据集。其中的一个样本的格式如下:
(x1, x2, x3)

然而,所谓三维特征,其实只是二维数据结构中的一个轴(另一个轴是样本轴)上的数据个数。

为了避免混淆,把向量、矩阵和其他张量的维度统称为阶,或者称为1D向量、2D矩阵、3D张量等。因此,以后一提“维”,主要指的就是数据集中特征X的数目。一般来说,特征维度越高,数据集越复杂

2、标签

含义:要预测的结果,也称目标。
标签,也就是机器学习要输出的结果,是我们试图预测的目标。示例里面的标签是房价。实际上,机器学习要解决什么问题,标签就是什么。
下面是一个有标签数据样本的格式:(x1, x2, x3 ; y)
标签有时候是随着样本一起来的,有时候是机器推断出来的,称作预测标签y’(也叫y-hat,因为那一撇也可放在y的上方,就像是戴了一个帽子的y)。比较y和y’的差异,也就是在评判机器学习模型的效果。

注:并不是所有的样本都有标签。在无监督学习中,所有的样本都没有标签。

3、模型

含义:将样本的特征映射到预测标签。
模型将样本映射到预测标签y’。其实模型就是函数,是执行预测的工具。函数由模型的内部参数定义,而这些内部参数通过从数据中学习规律而得到。
在机器学习中,先确定模型的类型(也可以说是算法),比如是使用线性回归模型,还是逻辑回归模型,或者是神经网络模型;选定算法之后,再确定模型的参数,如果选择了线性回归模型,那么模型f(x)= 3x+2中的3和2就是它的参数,而神经网络有神经网络的参数。类型和参数都确定了,机器学习的模型也就最终确定了。


学习机器学习的参考资料:
(1)书籍
利用Python进行数据分析
西瓜书
百面机器学习
机器学习实战
阿里云天池大赛赛题解析(机器学习篇)
白话机器学习中的数学
零基础学机器学习
图解机器学习算法

(2)机构
光环大数据
开课吧
极客时间
七月在线
深度之眼
贪心学院
拉勾教育
博学谷

你可能感兴趣的:(机器学习,机器学习,人工智能)