分析社交网络的首要方法是衡量网络中各节点的影响力和重要性。换句话说,我们要求的是,在社会网络中,谁是中心角色(具有影响力的用户)
在社会网络拓扑图中一般认为节点中连接边的数目(入度或出度)越多,该点在网络中便占据重要地位,当然这只是最简单的一种度量情况
下面简单的介绍下几种中心性的度量方法:
1.度中心性(发现名人)
度中心性是理解杂乱无章的网络数据一种最简单的度量方式,现实生活中节点的度越大一般是比较受欢迎的人,通常这样的人非常少,并且他们的受欢迎程度与其他人相比呈现指数量级的差异,普遍的网络拓扑图度的分布图一般呈现长长长尾的趋势。
在无向图中,结点的度中心性是节点上边的个数。
在有向图中,我们既可以计算入度或出度,也可以将两者之和作为度中心值。
2.亲近中心性(发现群众的closer)
在社交网络拓扑图中每个节点获取信息和向其他人传递信息的能力很大程度上由它和网络中其余节点的距离决定。亲近中心性越高意味着这些结点满足与其他结点之间有最小的平均最短路径(简单的说就是它们能更快速地到达其他的结点)
亲近中心性的计算步骤:
1.使用Dijkstra算法计算每对节点间的最短路径,并将这些距离存储在一张表中。
2.对每个节点:a. 计算所有其他节点的平均距离 b.除以最大距离 c.亲近性=1/平均距离
其结果是一个介于0到1的数值:值越高意味着亲近中心性更大(平均距离越低)。
3.居间中心性(发现传播瓶颈或社群桥梁)
居间中心性是分辨谁是跨界者(那些在两个或多个群体中扮演着不可或缺的桥梁作用的个体)。居间中心性是常用来进行中心性测度的指标,它是指网络中经过某点并连接这两点的最短路径占这两点之间的最短路径线总数之比。
居间中心性(计算大型网络时相当耗时),一个结点充当“中介”的次数越高,它的居间中心度就越大。
4.特征向量中心性(发现幕后大Boss)
一个节点的重要性既取决于其邻居节点的数量(即该节点的度),也取决于其邻居节点的重要性。在现实中,拥有更多朋友并不能确保这个人就是重要的,拥有更多重要的朋友才能提供更有力的信息。特征向量中心性(计算大型网络时不现实计算量太大)