聚类

文章目录

    • 近似度
      • 余弦相似度与皮尔森相似度
    • K-means 算法
    • 初值的选择问题
    • k-means 的损失函数与梯度下降的关系
    • K如何取值呢?
    • 聚类的衡量指标
    • ARI
    • AMI
    • 轮廓系数
    • 层次聚类方法
    • AGNES中簇之间距离的定义方式
    • 密度聚类方法
    • DBSCAN
    • 密度最大值聚类
    • 簇中心的识别
    • 谱和谱聚类
    • 随机游走拉普拉斯算法

近似度

聚类_第1张图片

余弦相似度与皮尔森相似度

聚类_第2张图片

K-means 算法

聚类_第3张图片

初值的选择问题

聚类_第4张图片
K-means 是初值敏感的

k-means 的损失函数与梯度下降的关系

这里将K个簇看做u相同的正太分布,根据极大似然可以求得目标函数
聚类_第5张图片

K如何取值呢?

手肘法

聚类的衡量指标

聚类_第6张图片

ARI

聚类_第7张图片
聚类_第8张图片

AMI

聚类_第9张图片

轮廓系数

聚类_第10张图片
聚类_第11张图片

层次聚类方法

聚类_第12张图片
聚类_第13张图片
聚类_第14张图片

AGNES中簇之间距离的定义方式

聚类_第15张图片

密度聚类方法

聚类_第16张图片

DBSCAN

聚类_第17张图片
聚类_第18张图片
聚类_第19张图片
聚类_第20张图片

密度最大值聚类

聚类_第21张图片
聚类_第22张图片
聚类_第23张图片

簇中心的识别

聚类_第24张图片

谱和谱聚类

聚类_第25张图片

随机游走拉普拉斯算法

聚类_第26张图片

你可能感兴趣的:(机器学习)