阅读笔记之:Co-regularized multi-view spectral clustering-NIPS2011

想法:利用多个视角的信息进行聚类,提高聚类的准确性。很简单直接的原则;不同视角的数据具有潜在(underlying)一致的聚类。以这个为动机,在单视角谱聚类的基础上,增加多视角之间的约束。文章叫做共正则化(co-regularization),我理解的意思是,把多视角之间的约束当做每一个视角的正则化约束。文中还说共正则是在半监督中常见的技术,我觉得这种多视角的数据之间的对应关系也是一种监督信息。Anyway,之后可以看一下在半监督中的co-regularization。


单视角谱聚类:



这个式子中的v代表第v个视角,L代表的是graph的laplacian矩阵,而U的行就是数据的embeddings,得到U之后进行k-means聚类。在这个基础上作者提出了针对多视数据的两种co-regularization。


Pairwise Co-regularization 算法:

对laplacian矩阵特征值分解之后的U是对数据的embedding,也就是新的表达,作者希望在多视情况下,在新的表达情况下的样本相似度是相似的。

K表明样本表达U的相似度矩阵,也就是跨视角的样本相似度矩阵要尽量一致。这个约束加上单视角谱聚类的约束,就是整个表达式,选择线性相似度并化简得到,


优化的过程是要求得每个视角的U。这是两个视角的情况,这个表达式也可以扩展到多视角数据。


Centroid-based Co-regularization 算法:

上面讲的pairwise是指两两视角之间的约束,同一个样本的不同视角的表达仍然是不一样的,在文中作者又提出了一个方案,将每一个视角view-specific的U正则化为同一个Centroid U,类似a consensus set of eigenvectors。 不同于pairwise中成对的两两约束,这里面有多少个视角就有多少个regularization约束。将上式中v和w视角之间的约束改为其中一个视角和centroid U之间的约束就可以了。阅读笔记之:Co-regularized multi-view spectral clustering-NIPS2011_第1张图片

这个表达式的优化需要求得每个视角的U和centroid U。


评价:好想法的式子就是漂亮,经典算法很重要,理解深刻,才能做出创新。



你可能感兴趣的:(多模态数据聚类,正则,clustering,多视数据,谱聚类)