SNN相似度计算

共享最近邻相似度SNN原理

如果向个点都与一些相同的点相似,则即使直接的相似度度量不能指出,我们也认为他们相似。

SNN主要解决两类问题:1.传统相似度在高维的相似度计算中,低相似度的问题。2.密度不同。

SNN相似度就是两个点之间共享的近邻个数,前提:两个点互相包含。

伪代码

if 点x 和 点y 不是互相的k-近邻 then
sim = 0
else
sim = 相同近邻数

SNN相似度计算_第1张图片
image.png

优点:

1.解决了直接使用传统的相似度计算相似度值低的问题。
2.簇的密度不同,在低密度的簇中,点与点之间的距离相对较大,而 SNN只依赖于共享的近邻个数。

你可能感兴趣的:(SNN相似度计算)