多视图聚类概念

文章目录

  • 一、多视图聚类方法分类
    • 1.1区分方法(基于相似性)的方法
  • 二、多视图聚类
    • 半监督多视图学习
    • 多视图聚类(MVC)的两个重要原则,互补性和共识原则
  • 谱和谱聚类

一、多视图聚类方法分类

  • 生成(基于模型)的方法
    目的:试图了解数据的基本分布,并使用生成模型表示数据,每个模型表示一个集群。

  • 区分(基于相似性)的方法
    目的:直接优化包括相似性的目标函数,以最小化簇内的平均相似性并最大化簇间的平均相似性。
    根据如何组合多视图信息,可以分为以下五类:

    • 公共特征向量矩阵(多视图谱聚类)
    • 公共系数矩阵(多视图子空间聚类)
    • 公共指示矩阵(主要是多视图非负矩阵分解聚类)
    • 直接视图组合(只要是多核聚类)
    • 在投影后的视图组合(主要是典型相关分析)

1.1区分方法(基于相似性)的方法

MVC的目的是将N个主体分成K个类别,最终我们会得到一个成员矩阵H∈(N×K),它会指示哪一个主体是在同一个簇而其他主体是在其他簇。H的每一行的元素之和应该是1,这样可以确保每一行的等可能性。

二、多视图聚类

从对事物的不同角度的理解生成多个特征描述视图,而非单个视图,就是多视图。

若对事物作单视图特征表示,则意味着增加了特征空间的维度,且不同角度的特征合成统一视图,特征可能失去原有的意义。

而多视图能发挥各个视图的优势,把同一数据表示成多个特征集,然后在每个特征集上可以用不同的方法进行学习,达成协同学习的目的,改善学习性能。

半监督多视图学习

找到标记数据较好分类的视图,然后将该视图训练出的分类器对未标记的数据进行分类,并将分类结果给到其他视图,帮助其他视图训练分类器。

多视图聚类(MVC)的两个重要原则,互补性和共识原则

互补性:为了更全面、更准确地描述数据对象,应该使用多个视图。在多视图数据的上下文,每个视图都足以完成特定的知识发现任务。然而,不同的视图通常包含相互补充的信息。例如,在图像处理领域,每幅图像都由不同类型的特征来描述,如lbp、sift和hog,其中lbp是一种强大的纹理特征,sift对图像的光照、噪声和旋转具有鲁棒性,而hog对边缘信息敏感。因此,有必要利用这些相互补充的信息来描述这些数据对象,并对内部集群提供更深入的见解。

共识性:旨在最大限度地保持多个不同观点的一致性。

谱和谱聚类

方阵作为线性算子,它的所有特征值的全体统称方阵的谱。

  • 方阵的谱半径为最大的特征值
  • 矩阵A的谱半径:( A T A A^TA ATA)的最大特征值

谱聚类是一种基于图论的聚类方法,通过对样本数据的(LE)拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。

你可能感兴趣的:(深度学习,opencv,计算机视觉,python)