Udacity 数据分析进阶课程笔记L39:聚类

  1. 聚类算法是一种非监督类型的机器学习算法,并通过电影分类解释聚类算法应用场景。
  2. K-Means算法
    • 讲解:确定聚类(簇)中心,通过计算各点到中心的距离,迭代优化中心的位置;
    • 一个在线演示链接;
    • 确认要聚类的数量,是使用K-Means算法时遇到的挑战之一;
    • 在一些情况下,多次使用K-Means算法聚类的结果可能不一致,尤其是数据分布无明显特征的时候。
  3. K-Means算法的局限性
    • K-Means是一种爬山算法hill climbing algorithm,其结果非常依赖于初试聚类中心的位置;
    • 局部最小值
  4. 聚类迷你项目

你可能感兴趣的:(Udacity 数据分析进阶课程笔记L39:聚类)