复杂网络中Ego Network(自我中心网络)部分指标的计算

由于科研需要,简单研究了一下自我中心网络中指标的计算方法,这里做一个简单的总结。关于Ego Network的概念,可以参考周涛老师的博客:http://blog.sciencenet.cn/blog-3075-1072943.html

我需要在实验中对比10年前这篇ICSE文章中使用的指标:

Zimmermann, Thomas, and Nachiappan Nagappan. "Predicting defects using network analysis on dependency graphs." Proceedings of the 30th international conference on Software engineering. ACM, 2008.

应该说这篇文章的引用数还是挺多的(我搜的时候google scholar中有445次)。在论文中作者使用的Ego Network指标如下:

复杂网络中Ego Network(自我中心网络)部分指标的计算_第1张图片

 这里简单介绍一下部分指标的计算方法。按照上面这篇论文中的介绍,关于这些指标的介绍,可以看看一本在线的教程:http://faculty.ucr.edu/~hanneman/nettext/ ,这本在线教程的第9章就是介绍Ego Network的。

结合这本书中给出的例子,我们可以看看部分指标的计算方法。这本书中的第九章:http://faculty.ucr.edu/~hanneman/nettext/C9_Ego_networks.html 主要是以ucinet自带的Knoke information这个网络为例子的(Ucinet 6\DataFiles目录下的KNOKBUR.##H文件)。对于这个网络,其可视化可以表示为这样:

复杂网络中Ego Network(自我中心网络)部分指标的计算_第2张图片

感觉这个网络密度真大啊…… 如果我们要分析节点1的out-neighborhoods组成的Ego Network(也就是从节点1出去的边, 以及对应的节点,加上节点1构成的子图),可视化如下图所示:

复杂网络中Ego Network(自我中心网络)部分指标的计算_第3张图片

从节点1出发有4条边,对应有4个节点9527(呵呵) 。接下来举例分析一些指标:

Size:is the number of nodes that one-step out neighbors of ego, plus ego itself. 这是上面那本书的解释,但是对照一下上面那本书和ucinet的界面,可以看到这个指标明显解释错了。如果加上Ego自己的话,那么节点1的Size这个指标应该是5,而书上写的是4,ucinet中给出的结果也是4。

对应的,我们看看ucinet中给出的解释(http://www.analytictech.com/ucinet/help/14u2rgz.htm):

Size: The number of actors (alters) that ego is directly connected to. 所以这个指标应该是Ego直接连接的节点的个数才对。

对于第2个指标Ties,在线教程中解释:is the number of connections among all the nodes in the ego network

而ucinet中给出的解释是:The total number of ties in the ego network (not counting ties involving ego). 我们可以看到,出过构成ego的边,共有11条边,所以还是ucinet的解释是正确的。

第3个指标是Pairs,两种解释分别是:is the number of possible directed ties in each ego network 和 The total number of pairs of alters in the ego network -- i.e., potential ties,对于上面这个例子,就是节点9、5、2、7直接的可能的有向边的个数。很明显,还是ucinet中的解释更准确一下,这个值按照排列公式,应该是12个。

这时候第4个指标就已经很明显了:The number of ties divided by the number of pairs, times 100. 11/12=91.67%

后面的这些指标也就可以依次计算了,总体商量来讲,那个在线教程的解释不太靠谱,而ucinet的解释太过简单,需要两者结合起来比较好。

你可能感兴趣的:(NetworkX学习笔记,论文点评)