SimRank--基于结构的相似度度量方法学习笔记

详见:Glen Jeh 和 Jennifer Widom 的论文SimRank: A Measure of Structural-Context Similarity

1. 目前主要有两大类相似性度量方法:
        (1) 基于内容(content-based)的特定领域(domain-specific)度量方法,如匹配文本相似度,计算项集合的重叠区域等;
        (2) 基于链接(对象间的关系)的方法,如PageRank、SimRank和PageSim等。最近的研究表明,第二类方法度量出的对象间相似性更加符合人的直觉判断。
2. SimRank--完全基于结构信息,且可以计算图中任意两个节点间的相似度。
3. 
SimRank--基于结构的相似度度量方法学习笔记_第1张图片

(1)如果在G中,a指向c,b指向d,则在G^2中node(a,b)指向node(c,d)。
(2)从G^2中{Univ,Univ}=1开始顺着指向顺序,依次迭代、循环计算,直到所有的相似度值趋于稳定为止。
(3)
4. 论文的详细python代码实现见博客   http://www.cnblogs.com/zhangchaoyang/articles/4575809.html

你可能感兴趣的:(算法,网络,相似度,SimRank,网络结构信息)