机器学习15-1(无监督学习算法)

Content

  • 简介
  • K-Means快速聚类
    • 数据集准备
    • 创建初始中心点
    • 类别划分
    • 重新计算中心点
    • 迭代停止条件
    • 数学意义
  • sklearn 中实现的 K-Means
    • 轮廓系数

简介

  • 此前,无论是回归问题还是分类问题,本质上其实都属于有监督学习范畴:即算法的学习是在标签的监督下进行规律学习,也就是学习那些能够对标签分类或者数值预测起作用的规律
  • 而无监督学习,则是在没有标签的数据集中进行规律挖掘,既然没有标签,自然也就没有了规律是否对预测结果有效一说,也就失去了对挖掘规律的“监督”过程,这也就是无监督算法的由来
  • 而如果一个数据集没有标签,我们就只能围绕特征矩阵进行规律挖掘,更具体的来说,面对没有标签的数据集,我们只能去尽可能的探索特征矩阵中的数值分布规律,当然这些规律肯定是需要符合一定的业务场景、拥有一定的现实意义
  • 而在所有的无监督学习算法中,最著名的两类算法就是聚类算法

你可能感兴趣的:(MachineL,机器学习,无监督学习,k-means)