20150916谱聚类.md

1.谱聚类概念

1.1基本概念

  1. 实对称阵的特征值是实数
  2. 实对称阵不同特征值对应的特征向量正交
  3. :方阵作为线性算子,它的所有特征值的全体统称方阵的谱。
  4. 谱半径:方阵的谱半径为最大的特征值,矩阵A的谱半径为 (ATA) 的最大特征值
  5. 谱聚类:一般来说,是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。

1.2相似度图G

1.2.1相似度图G的概念

  1. 给定一组数据 x1,x2,,xn ,记任意两个点之间的相似度为 sij=<xi,xj> ,形成相似度图:G=(V,E)。如果 xi xj 之间的相似度 sij 大于一定的阈值,那么,两个点是连接的,权值记做 sij
    利用相似度图来聚类的时候,要使得每一簇边的权值极小,簇内部的权值极大。
  2. 邻接矩阵:如果 vi vj 之间的相似度 sij 大于一定的阈值,则认为这两个点是连接的,满足条件的 sij 则为 wij=0 即表示这两个点未发生连接。这样 wij 构成邻接矩阵W。
  3. 度矩阵:图G中某一点 viV 的度可以定义为: di=nj=1wij ,其中度矩阵 D=diag{d1,,dn}
  4. 子图: 图G的子图相当于全集的子集,也就是图G中的部分点构成的一个新的图。
    ①子图的指示向量:设置子图A的指示向量

你可能感兴趣的:(机器学习,谱聚类)