节点中心性度量

中心性(centrality):哪个节点的影响力更大?
1.Centrality度量方法:Degree
节点中心性度量_第1张图片
Degree是运用最广泛的centrality之一,因为它计算简单,可理解性强

局限:邻接节点的重要性没有考虑
举个例子,微博上某账户买僵尸粉增加粉丝量,可以使该账户节点的in-degree非常大,但是并不意味着该节点的影响力就大。

2.Centrality度量方法:Eigenvector
影响力大的人不仅仅是朋友多,而且他的朋友也是重要的
节点中心性度量_第2张图片
节点中心性度量_第3张图片
可以看出,v7节点的重要性,是由和它相边的v1,v4,v6三个节点的重要性来决定的,也就是说,如果v1,v4,v6的重要性越高,那么v7节点的重要性也就越高。
其中,? 是矩阵的特征根

3.Centrality度量方法:Katz
eigenvector方法在无向图上的表现非常优异
但当出现在有向无环图时,其中节点 eigenvector centrality变成0
节点中心性度量_第4张图片
Katz提出了一个改进方法,即每个节点初始就有一个centrality值
这样,上图中v6和v5节点的centrality计算方法就变成了:
节点中心性度量_第5张图片
4.Centrality度量方法:PageRank
Katz在计算时,每条出边都会带上起始节点的完整中心性值,这是否合理呢?
显然是不合理的,举个例子,导航网站hao123,它指向了许多其它网站,在katz方法中,该网站每条出边的值都是一样的,但显然,雅虎和其它小网站的重要性是不一样的。

为此,Google的Larry Page对Katz的方法提出了进一步的改进,称为PageRank算法。

PageRank算法在Katz的基础上,假设一个节点的出度是n,刚每条出边附上1/n的起始节点的中心度量值
节点中心性度量_第6张图片
节点中心性度量_第7张图片
节点中心性度量_第8张图片
进行了一轮迭代计算之后
节点中心性度量_第9张图片
经过多轮迭代,直到centrality值收敛,即得到每个节点的centrality

5.Centrality度量方法:Betweenness
betweenness则从路径这个维度来度量节点的centrality.

对于网络中的两个节点A和B,他们之间的最短路径可能有很多条。计算网络中任意两个节点的所有最短路径,如果这些最短路径中有很多条都经过了某个节点,那么就认为这个节点的Betweenness Centrality高
节点中心性度量_第10张图片
节点中心性度量_第11张图片
从直观上讲,图中左边的这些节点和右边的这些节点都必须通过A ,F两个点来连接。因此这两个点的betweenness centrality也会更高。

6.Centrality度量方法:Closeness
Closeness的centrality 度量方法思想是:如果节点到图中其它节点的最短距离都很小,那么我们认为该节点的Closeness Centrality高。

节点中心性度量_第12张图片
这个定义其实比Degree Centrality从几何上更符合中心度的概念,因为到其它节点的平均最短距离最小,意味着这个节点从几何角度看是出于图的中心位置。

举个例子,在社交网络中,Closeness Centrality高的节点一般扮演的是八婆的角色(gossiper)。他们并不是明星,但是乐于在不同的人群之间传递消息。

你可能感兴趣的:(基础)