论文笔记·图学习:A New Simplex Learning Model to Measure Data Similarity for Clustering

 

Abstract

• 拉普拉斯图的构造存在一些有待讨论的问题:(1)确定分析的规模;(2)确定近邻点的个数;(3)处理多尺度数据;(4)处理噪声和离群点。

• 本文提出通过确定约束的稀疏表示来计算相似度,这种无参方法可以降低计算复杂度同时提高鲁棒性。

1  Background and Motivation

• 基于图论产生了很多算法及应用:(1)聚类算法;(2)维数约简算法;(3)半监督学习算法;(4)排序算法。

1.1  Different Similarity Graphs

1.2  Introduction to Sparse Representation

• 稀疏表示目标函数:

• L0范数可以近似转化成L1范数的形式,便于优化求解:

     或     

• 稀疏表示具有鲁棒性,且对数据的规模一致性没有限制,这样可以解决引言中提出的问题。

2  Similarity Matrix Construction with Simplex Representation

• 应用稀疏表示来计算相似度矩阵S,第i个数据点和其他数据点之间的相似度为:

  为了获得相似度的平移不变性,加上约束,得到:

  约束可以化简目标函数:

3  Optimization Details and Algorithm

• 加速投影梯度法通过逼近和迭代的方法来求解:

论文笔记·图学习:A New Simplex Learning Model to Measure Data Similarity for Clustering_第1张图片

• 最后要进行对称化操作

3.1  Optimization Algorithm to Eq.(13)

4  Experiment on Synthetic Data Sets

     实验,略

6  Conclusion and Future Work

• 提出了一个无参的谱聚类方法,对于噪声和规模一致性鲁棒;

• 通过辅助变量和牛顿求根算法来加速投影梯度法;

• future work:(1)引入标签信息,拓展到半监督图学习;(2)采用 l2,1范数。

 

你可能感兴趣的:(论文笔记·图学习:A New Simplex Learning Model to Measure Data Similarity for Clustering)