深度聚类方法之跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)

深度聚类方法之跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)

1.参考文献

《C3: Cross-instance guided Contrastive Clustering》

2.跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)

该方法是在对比聚类(Contrastive Clustering,CC)上面的改进。

深度聚类方法之跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)_第1张图片

深度聚类方法之跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)_第2张图片

关于对比聚类可看我上一篇博客《深度聚类方法之对比聚类(Contrastive Clustering,CC)》

方法

①首先使用对比聚类(Contrastive Clustering,CC)框架来训练网络。

具体看上面链接,不作重复介绍。

改进之处

②引入了超参数\zeta,对相似度大于或等于一个阈值,则认为样本是一致的,通过新的损失函数对网络继续训练网络,从而得到更好的结果,具体损失函数如下

其中

 1\left \{ \cdot \right \}是指示器函数,下式是计算他们的相似度。

(z^{a}_i)^{T}z^{k}_j=sim(z^{a}_i,z^{k}_j)

 最终,C3算法如下

深度聚类方法之跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)_第3张图片

 一些实验结果

深度聚类方法之跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)_第4张图片

C3方法比CC方法有改进。

不同的超参数设置对结果的影响

深度聚类方法之跨实例引导的对比聚类(Cross-instance guided Contrastive Clustering,C3)_第5张图片

总结:如果有大量的集群,那么最好是选择一个较大的\zeta。另一方面,如果数据有少量的集群,那么首选更小的\zeta(但不是太小,譬如\zeta=0.6),因为它训练得更快。

你可能感兴趣的:(深度聚类,聚类,算法)