多视图子空间聚类(完备感知相似性)2019

paper:Multi-view subspace clustering with intactness-aware similarity(Xiaobo Wang a , Zhen Lei b , ∗, Xiaojie Guo c , Changqing Zhang c , Hailin Shi a , Stan Z. Li b , d )

解决问题:1.由于视图不足导致信息丢失,尝试从多视图数据中恢复完整的空间。例如[41],“intact”意味着完整并且未受损坏,这对图的构建非常有利。2.使用HSIS(Hilbert–Schmidt Independence Criterion)指导谱聚类。

以前构造相似矩阵方法存在问题:一是尽管不同相似矩阵中的块结构相似,但它们的值可能会显著不同,因此达成相似性共识可能会大大降低性能。换句话说,相似性假设可能不成立。另一个原因是,上述方法构造的相似度信息量较小,因为大多数方法都忽略了局部连通性。

希尔伯特-施密特独立性准则

多视图子空间聚类(完备感知相似性)2019_第1张图片

多视图子空间聚类(完备感知相似性)2019_第2张图片 

 结论:为了最大化两个随机变量X和Y之间的相关性,tr(K1HK2H)应该最大化。参考[55,58]

完备空间学习

F表示特征,X是要学习的潜在完备空间,两个正则项是为了稳定性。([41]理论依据:1更多的视图将带来更多关于完备空间的信息,可以利用多个视图之间的互补性来学习潜在的完备空间,尽管每个视图是有缺失的)。2可能无法获得学习潜在完备空间所需的所有视图,但当提供足够的视图时,我们可以大致恢复它)

多视图子空间聚类(完备感知相似性)2019_第3张图片

 与非负矩阵分解区别:不包含学习矩阵的非负惩罚,更具弹性。

 完备感知的相似性构造

获得完备空间X后,在应用谱聚类前应先构造一个信息相似矩阵S(n×n),借助HSIC理论学习与完备空间具有最大依赖性的完备感知相似度矩阵S。

 多视图子空间聚类(完备感知相似性)2019_第4张图片

  

 

 求解出S。

 新的想法

假设:完备空间本来就应该是中心化的,如果数据点的距离较小,则它们在同一簇中的相似性(概率)应较大,反之亦然。

多视图子空间聚类(完备感知相似性)2019_第5张图片

使用l1范数(代替F范数)处理离群值较多的情况,加入正则项防止平凡解。

多视图子空间聚类(完备感知相似性)2019_第6张图片 

注意:基于距离构造相似度,最常用的方法是高斯相似度函数

 这会导致局部领域具有较高的权重,而远处点之间的边具有正权重?

 

多视图子空间聚类(完备感知相似性)2019_第7张图片 

多视图子空间聚类(完备感知相似性)2019_第8张图片 

图解:给定具有多个特征的数据点集合,例如F 1,...,F V,提出的MSC IAS集成所有多视图信息来学习完备空间X,并通过HSIC构造完备感知相似矩阵S,形成统一的优化框架。此外,所提出的HSIC可以解释为通过基于局部连通性为每个完整数据点分配自适应和最优邻居来学习相似性。然后,对学习到的相似度采用归一化割等谱聚类算法,得到最终的聚类结果。 

代码:Xiaobo Wangwww.cbsr.ia.ac.cn/users/xiaobowang/: http://www.cbsr.ia.ac.cn/users/xiaobowang 

 

 

 

 

 

 

 

你可能感兴趣的:(聚类,数据挖掘,机器学习)