聚类系数计算——GCC&LCC

聚类系数计算

在图论中,集聚系数是图中的点倾向于集聚在一起的程度的一种度量。证据显示:在多数实际网络以及特殊的社会网络中,结点有形成团的强烈倾向,这一倾向的特征是有一个相对紧密的连接(Holland and Leinhardt, 1971[1]; Watts and Strogatz, 1998[2],后者是提出了小世界网络模型)。在实际网络中,这种可能性比随机生成的均匀网络的两个结点间连接的可能性大(Holland andLeinhardt, 1971; Watts and Strogatz, 1998)。
  这一度量有两种版本的方法:全局的和局部的。全局的方法旨在度量整个网络的集聚(性),而局部的(方法)给出了单个结点的嵌入性的度量。
Global clustering coefficient(全局集聚系数)
  全局集聚系数是基于结点三元组的。一个三元组是其中有两条(开三元组)或三条(闭三元组)无向边连接的三个结点。一个三角由三个封闭的三元组构成,(三角)集中在每一个结点上。全局集聚系数是所有三元组(包括开和闭的)中封闭三元组的数目。定义如下:
Clustering coefficient(集聚系数)

Local clustering coefficient(局部集聚系数)
  图中一个结点的局部集聚系数表示了它的相邻结点形成一个团(完全图)的紧密程度。Duncan J. Watts和Steven Strogatz在1998年引入了度量一个图是否是小世界网络的方法。

定义
  G = (V, E) : 图G包含一系列结点V和连接它们的边E.
  eij : 连接结点i与结点j的边.
  Ni = {vj : eij∈E ∩ eji∈E} : vi的第i个相邻结点.
  ki : vi相邻结点的数量.

结点vi的局部集聚系数Ci是它的相邻结点之间的连接数与它们所有可能存在连接的数量的比值。对于一个有向图,eij 与 eji是不同的,因而对于每个邻结点 Ni在邻结点之间可能存在有 ki(ki − 1)条边(ki 是结点的出入度之和)。
因此,有向图的局部集聚系数为:
Clustering coefficient(集聚系数)

无向图的为:
Clustering coefficient(集聚系数)

定义λG(v), Clustering coefficient(集聚系数)为无向图G中三角形的数量。λG(v)是G的有三条边和三个结点的子图的数量,其中一个就是v。定义τG(v)为Clustering coefficient(集聚系数)中三元组的数量。也就是说,τG(v)是有两条边和三个结点的子图(并不要求是入射)的数量,其中一个是v,这样有v两条入射边。那么我们可以定义集聚系数为:
Clustering coefficient(集聚系数)

很容易证明以上两种定义是等价的,因为
Clustering coefficient(集聚系数)

Network average clustering coefficient(网络的平均集聚系数)
  整个网络的集聚系数由Watts和Strogatz定义为所有结点n的局部集聚系数的均值:
Clustering coefficient(集聚系数)

如果一个图的平均集聚系数显著高于相同结点集生成的随机图,而且平均最短距离与相应随机生成的随机图相近,那么这个图被认为是小世界的。
  有更高平均集聚系数的网络被发现有着模块结构,同时在不同结点中还有更小的平均距离。

转载:http://blog.sina.com.cn/s/blog_439371b501012lgw.html

你可能感兴趣的:(机器学习)