机器学习 day02(无监督学习,聚类算法,术语)

  1. 无监督学习
  • 在无标签的数据中,无监督学习的工作是找到某种结构,某种模式,或者只是在无标签的数据中找到一些有趣的东西。
  • 我们不是试图给每一个输入都提供一些正确的答案,从而监督算法。相反我们要求算法自己找到某种结构,某种模式,或者弄清楚什么是有趣的。如图:
    机器学习 day02(无监督学习,聚类算法,术语)_第1张图片
  1. 聚类算法
  • 将无标签的数据自动的放置在不同的集群或组中
  • 例如:在谷歌新闻示例中,聚类算法在没有监督的情况下,自行计算出该新闻属于熊猫,双胞胎,动物园新闻集群,并把同属于这个集群的新闻都放在同一个集群中。如图:机器学习 day02(无监督学习,聚类算法,术语)_第2张图片
  1. 机器学习的一些术语
    机器学习 day02(无监督学习,聚类算法,术语)_第3张图片
  • Training set :训练集,数据集
  • x :输入变量,特征,输入特征
  • y :输出变量,目标变量
  • 一行代表一个训练示例
  • m :训练样本的总数
  • (x , y):单个训练示例,指的是该表的一行
  • (x⁽ᴵ⁾ , y⁽ᴵ⁾):第i个训练示例,指的是该表的特定i行,注意,上标i不是求幂,指的是训练集的一个索引
    机器学习 day02(无监督学习,聚类算法,术语)_第4张图片
  • ŷ:y_hat,表示输出的预测,估计值
  • f:函数,数学公式
  • f w,b (x) = wx + b:一个以x作为输入的函数(线性函数),并且取决于w和b的值,f将输出预测y_hat的某个值。
  • f(x) = wx + b:以上函数的简写
  • Linear regression with one variable:只有一个变量的线性回归
  • w,b:参数,系数,权重

你可能感兴趣的:(学习,机器学习)