Abstract
• 拉普拉斯图的构造存在一些有待讨论的问题:(1)确定分析的规模;(2)确定近邻点的个数;(3)处理多尺度数据;(4)处理噪声和离群点。
• 本文提出通过确定约束的稀疏表示来计算相似度,这种无参方法可以降低计算复杂度同时提高鲁棒性。
1 Background and Motivation
• 基于图论产生了很多算法及应用:(1)聚类算法;(2)维数约简算法;(3)半监督学习算法;(4)排序算法。
1.1 Different Similarity Graphs
1.2 Introduction to Sparse Representation
• 稀疏表示目标函数:
• L0范数可以近似转化成L1范数的形式,便于优化求解:
• 稀疏表示具有鲁棒性,且对数据的规模一致性没有限制,这样可以解决引言中提出的问题。
2 Similarity Matrix Construction with Simplex Representation
• 应用稀疏表示来计算相似度矩阵S,第i个数据点和其他数据点之间的相似度为:
为了获得相似度的平移不变性,加上约束,得到:
约束可以化简目标函数:
3 Optimization Details and Algorithm
• 加速投影梯度法通过逼近和迭代的方法来求解:
3.1 Optimization Algorithm to Eq.(13)
4 Experiment on Synthetic Data Sets
实验,略
6 Conclusion and Future Work
• 提出了一个无参的谱聚类方法,对于噪声和规模一致性鲁棒;
• 通过辅助变量和牛顿求根算法来加速投影梯度法;
• future work:(1)引入标签信息,拓展到半监督图学习;(2)采用 l2,1范数。