Binary Multi-View Clustering(基于二进制的多视图聚类)

本篇论文是一篇关于二进制的多视聚类文章,用于处理大规模的多视数据集。

1、首先对多视数据进行哈希编码

本论文在第v个视图的数据中随机选取m个样本或者通过k-mean算法直接生成m个子簇中心 a m v a_m^{v} amv来表达这个视图的数据分布,然后计算 x s v x_s^v xsv a m v a_m^{v} amv的核函数。
在这里插入图片描述
之后乘上对其进行降维,并通过sgn()符号函数得到第v个视图的哈希矢量。

2、学习一个统一的哈希矢量

因为是多视图学习,所以一共有M个视角的哈希矢量 h s v h_s^v hsv,从中学习一个统一的哈希矢量表达式 b s b_s bs与与它们近似。

其中 α v \alpha^v αv表示的是第v个视图的权重。

公式中第三项的求方差的含义是让二值码的分布更均衡
Binary Multi-View Clustering(基于二进制的多视图聚类)_第1张图片

3、进行聚类

在这里插入图片描述

整体的目标函数是:
Binary Multi-View Clustering(基于二进制的多视图聚类)_第2张图片
之后对他们进行交替优化求解,论文中写的很详细。

你可能感兴趣的:(聚类论文,聚类,机器学习)