机器学习笔记_ 聚类_2:谱聚类

谱聚类的定义

是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图,使子图内部尽量相似,而子图间距离尽量距离较远,以达到常见的聚类的目的。

  • 矩阵的谱: 方阵作为线性算子,它的所有特征值的全体称为方阵的谱,非方阵( ATA )的特征值
  • 谱半径: (A^TA)的最大特征值
  • 谱聚类: 对样本数据的拉普拉斯矩阵的特征值进行聚类
  • 拉普拉斯矩阵: L=D-W
  • 基本算法(随机游走的拉普拉斯矩阵)

    1. 计算 nn 的相似度矩阵W和度矩阵D
    2. 计算正则的拉普拉斯矩阵 Lrw=D1(DW)
    3. 计算 Lrw 的前k个特征向量 u1,,uk (前k个小的)
    4. 将k个特征向量组成矩阵U
    5. yiRk 是U的第i行的向量
    6. 使用 kmeans 将点 (yi)1,2...,n 聚成簇c1,…ck
    7. 输出A1,…AK
  • 图的最小割转换为拉普拉斯矩阵

fLf=12wij(fifj)2

参看博客:http://www.cnblogs.com/sparkwen/p/3155850.html

你可能感兴趣的:(机器学习笔记_ 聚类_2:谱聚类)