OPMC多视图聚类算法

原文:One-pass Multi-view Clustering for Large-scale Data

创新点:

传统的 N M F NMF NMF聚类分两步走:求得 H H H矩阵,将 H H H矩阵用于 k m e a n s kmeans kmeans。这篇文章将两步合为了一步走。

目标函数

首先是标准的多视图 N M F NMF NMF。这里加了给 W W W做了一个正交化,这样可以给H的特征进行一个重构,特征之间的线性关系会越弱,特征之间就分得更开,聚类效果就越好。

注意!

这里 H H H的特征纬度不再是以往一样,需要自己定一个超参数,而是直接定为簇数 k k k
在这里插入图片描述

接来下是 k m e a n s kmeans kmeans的矩阵形态写法:

OPMC多视图聚类算法_第1张图片
Y ∈ R n ∗ k Y\in R^{n*k} YRnk,也就是隶属度。因为是 k m e a n s kmeans kmeans,硬聚类,所以 Y Y Y的每一个行向量肯定只能有一个“1”,如果是FCM,就不会有这个约束限制。C是中心矩阵,每一个行向量就代表了一个中心。

如果 H H H Y C YC YC注定相似的话,那干脆直接将他们相等好了。作者就简单粗暴地让
OPMC多视图聚类算法_第2张图片
将该式带入上面的目标函数得:
OPMC多视图聚类算法_第3张图片

把隶属度Y全局化,再将每个视图相加得到最终的目标函数:

OPMC多视图聚类算法_第4张图片
这里他直接把每个视图的权重设置为了一样,说是实验表明,这种等权重方式比多权重方式效果更好。

你可能感兴趣的:(聚类,聚类,机器学习)