Community structure in social and biological networks

Community structure in social and biological networks
(社会和生物网络中的社团结构)
概念总结:
(1)社团结构(community structure):简单来说就是用点(vertices)来表示对象(比如:人,动物,蛋白质,IP地址),用边(edge)表示对象与对象之间的关系(比如:人与人的社交关系,动物之间吃与被吃的关系,蛋白质之间的相互作用,IP之间的关系即网络连接等等)所形成的复杂网络,我们时常听到的社会网络(social networks)
、合作网络(collaboration networks),食物网络(Food Web)等都是复杂网络,我们使用一系列的方法所发现的网络当中的规律,也就是我们寻找的社团结构。
(2)聚类系数(clustering coefficient):在图论中,集聚系数(也称群聚系数集群系数)是用来描述一个图中的顶点之间结集成团的程度的系数。具体来说,是一个点的邻接点之间相互连接的程度。例如生活社交网络中,你的朋友之间相互认识的程度。文章中将聚类系数(聚集度)定义为:
论文结构:
1.I ntroduction
2.Detecting Community Structure
2.1 Traditional Method
2.2 Edge “Betweenness" and Community Structure
3.Tests of the Method
3.1 Computer-Generated Graphs
3.2 Zachary’s Karate Club Study
3.3 College Football
4. Applications
4.1 Collaboration Network
4.2 Food Web
5. Conclusion
注:这个论文结构只是我个人划分的,仅供学习参考。
下面主要就文章的第二部分检测社团结构(Detecting Community Structure)予以简要的介绍,文章中采用类比的方法分析了传统方法以及作者自己提出的方法,我们首先来看一看传统的社团检测方法:
传统方法(Traditional Method)
传统方法进行社团检测所采用的是层次聚类(hierarchical clustering)的方法。层次聚类算法,要么是自底向上聚集型的,即从叶子节点开始,最终汇聚到根节点;要么是自顶向下分裂型的,即从根节点开始,递归的向下分裂。
Community structure in social and biological networks_第1张图片                                            Community structure in social and biological networks_第2张图片
首先,我们计算任意两个顶点i,j之间的权重W,权重W表示顶点i和j之间的紧密程度;紧接着我们从网络之中选择出n个顶点(n个顶点之间没有边),按照顶点对之间权重由大到小的次序依次为顶点对增加边;随着边的增加,结果图中可以看到越来越大的组件的嵌套集,也就是我们所称的社团。
至于权重的衡量,文章中提到了三种方法:
(1)顶点对之间独立于节点的路径的个数;(所谓独立于节点的路径就是说连接顶点i和j的两条路径除了开始节点和终止节点相同之外,再没有任何公共的顶点)
(2)顶点对之间独立于边的路径的个数;
(3)顶点对之间所有的路径条数,但是由于任意两个顶点之间的路径条数是无限个,设定长度为l的典型加权路径的参数为a**l,其中a是可以调节的参数,因此路径个数的加权计数是收敛(converge)的,A是网络的邻接矩阵,则权重矩阵为:
 注释:为了使W收敛,我们必须选择一个比邻接矩阵A的最大特征值的倒数还小的a(阿尔法)

边介数和社团结构(Edge “Betweenness" and Community Structure):
为了避免层次聚类算法的缺点,作者提出了一种交替逼近的方法检测社团结构,作者没有构造度量一条边距离社团中心
的指标,而是将注意力集中到那些远离中心的边,那些在社团之间的边;并且与之前相反,作者构造社团结构是通过
删除原始图当中的一些边得到。边介数:两个节点对之间通过边e的最短路径的条数。作者提出的识别社团结构的算法
步骤如下:
1. Calculate the betweenness for all edges in the network.
2. Remove the edge with the highest betweenness.
3. Recalculate betweennesses for all edges affected by the removal.
4. Repeat from step 2 until no edges remain
至于文章当中的应用请你自己看看,其实也是为了支持自己的算法的优点所做的一些论述。

你可能感兴趣的:(社团检测)