机器学习相关概念

标签:我们要预测的真实事物:y(如垃圾邮件)

基本线性回归中的y变量

特征:用于描述数据的输入变量:x1(如电子邮件中的发件时间,内容,字词等)

基本线性回归中的{x1,x2...xn}变量

样本:数据的特性实例:x(如一封电子邮件)

有标签样本:具有{特征,标签}: (x, y)(如:垃圾邮件,非垃圾邮件等,标签可能来自用户或者其他方面)

用于训练模型

无标签样本:具有{特征, ?}: (x, ?)(知道特征信息,但是并不知道是否为垃圾邮件)

用于对新数据做出预测

模型:可将样本映射到预测标签:y'(通过从数据中学习规律来创建模型)

有模型的内部参数定义,这些内部参数值是通过学习得到的

训练:创建或学习模型,也就是说,向模型展示有标签样本,让模型逐渐学习特征与标签之间的关系。

推断:指将训练后的模型应用于无标签样本。也就是说,使用经过训练的模型做出有用的预测 (y')。

回归模型:可预测连续值(如:加利福尼亚州一栋房产的价值,用户点击此广告的频率)

分类模型:预测离散值(如:某个邮件是垃圾还是非垃圾,这是一张狗,猫还是仓鼠图片)

你可能感兴趣的:(机器学习)