Large-Scale Multi-View Subspace Clustering in Linear Time

Large-Scale Multi-View Subspace Clustering in Linear Time

    • 摘要
    • 简介
    • 前期工作
      • 1.子空间聚类
      • 2.锚定图
    • 方法

摘要

因为传统的多视图子空间聚类(MVSC)通常具有两次或者三次的复杂度,用不到大规模的数据上,为了解决这个问题提出了线性阶复杂度的LMVSC。
受锚定图思想的启发,我们首先为每个视图学习一个更小的图。然后,设计了一种新的方法来整合这些图,使我们可以在一个更小的图上实现光谱聚类。

简介

为了解决传统MVSC时间复杂度够高的这样一个情况主要可以在两个方面进行改进:

  1. 第一,如何避免为多视图数据构造n×n个图,这需要大量的时间和存储。
  2. 第二,如何规避计算成本昂贵的步骤-具有O(n2k)复杂性的光谱聚类。

第一个问题:首先,为了解决大规模图的构造问题,我们选择少量的实例作为锚点,然后为每个视图构建一个更小的图。
第二个问题:其次,设计了一种新的多图集成方法,以便可以在小图上实现谱聚类。
本文贡献:我们首次尝试进行了大规模的多视图子空间聚类。我们提出的方法可以在线性时间内求解,作为一种特殊情况,该方法也适用于单视图子空间聚类任务。它在非常大规模的数据上具有很好的性能。

前期工作

1.子空间聚类

子空间聚类将每个数据点表示为其他点的线性组合,并使重构损失最小,得到组合系数。这个系数被视为对应点之间的相似性。
子空间聚类问题可以浓缩为下面这个公式:
在这里插入图片描述
其中:f()为一个正则化函数,S为自表达矩阵

2.锚定图

锚定图是构造大尺度图矩阵的有效方法。
首先选择m个点(m远小于n),每个点都作为一个近似于邻域结构的地标。然后,在地标与原始数据之间构造一个稀疏亲和矩阵Z∈Rn×m,如下:
Large-Scale Multi-View Subspace Clustering in Linear Time_第1张图片
其中K()为高斯核函数
然后去计算S矩阵:
在这里插入图片描述
其中:在这里插入图片描述

方法

步骤:
1.根据原始数据选取每个视图的锚点
2.根据原始数据X和锚定点A计算Z
Large-Scale Multi-View Subspace Clustering in Linear Time_第2张图片
3.然后计算:
Large-Scale Multi-View Subspace Clustering in Linear Time_第3张图片
4.最后将上式的结果用SVD分解,然后将k-means用于分解到的Q

LMVSC算法
Large-Scale Multi-View Subspace Clustering in Linear Time_第4张图片

你可能感兴趣的:(多视图聚类,聚类,算法)