图论中的聚类系数(Clustering coefficient)简单介绍

目录

  • 前言
  • 介绍
    • 局部聚类系数
    • 全局聚类系数

前言

在GraphSage论文的理论分析部分,涉及到一个概念叫做“Clustering coefficient”,直译过来就是聚类系数,解释为“节点的一跳邻域内封闭的三角形的比例”,本文对其做一个简单的介绍。本文参考了 Wiki百科-Clustering coefficient。

更:关于GraphSage论文详解,请参见博文《GraphSage-《Inductive Representation Learning on Large Graphs》论文详解》

介绍

在图论中,聚类系数是图中节点倾向于聚类在一起的程度的度量。相关论文表明1 2,在大多数现实世界的网络中,尤其是社交网络中,节点倾向于创建紧密结合的群体,其特征是联系密度相对较高;这种可能性往往大于两个节点之间随机建立联系的平均概率。

聚类系数主要有两种度量方式:局部和全局。


局部聚类系数

一个节点的局部聚类系数量化了它的邻居节点离成为(clique,即每两个不同的顶点都是相邻的。参见wiki百科-clique)有多近,简单来说就是,节点的一跳邻域内封闭的三角形的比例。

举个例子说明:
图论中的聚类系数(Clustering coefficient)简单介绍_第1张图片

图1 无向图上的局部聚类系数计算示例

图中的灰色线表示节点A与邻居的连接,黑实线是邻居之间的连接,红色表示图1(2)和(3)相比于图1(1)去掉的连接。
节点 A 的局部聚类系数计算为:其邻居之间实际实现的连接与所有可能连接的数量的比例,或者为节点A的一跳邻居内封闭的三角形的比例。

  • 邻居之间实际实现的连接与所有可能连接的数量的比例: 如图1所示,A的邻居为(P1,P2,P3),P1,P2,P3之间最多可以有3个连接,图1中的(1)(2)(3)的P1,P2,P3之间分别有3个,1个和0个连接,所以聚类系数 C C C 分别为 1,1/3和0。

  • 邻居内封闭的三角形的比例: 如图1所示,A的邻居为(P1,P2,P3)与A最多形成3个三角形: Δ A P 1 P 2 \Delta AP_1P_2 ΔAP1P2, Δ A P 2 P 3 \Delta AP_2P_3 ΔAP2P3, Δ P 1 P 2 P 3 \Delta P_1P_2P_3 ΔP1P2P3,图1中的(1)(2)(3)符合条件的三角形分别有3个,1个和0个,所以聚类系数 C C C 分别为 1,1/3和0。

全局聚类系数

全局聚类系数是封闭三元组(或3个三角形)在三元组(开放和封闭)总数上的数量。

这部分待更新…


  1. P. W. Holland & S. Leinhardt (1971). “Transitivity in structural models of small groups”. Comparative Group Studies. 2 (2): 107–124. doi:10.1177/104649647100200201. S2CID 145544488 ↩︎

  2. D. J. Watts & Steven Strogatz (June 1998). “Collective dynamics of ‘small-world’ networks”. Nature. 393 (6684): 440–442. Bibcode:1998Natur.393…440W ↩︎

你可能感兴趣的:(专栏03-图神经网络,图论,图神经网络)