在论文中经常读到的motifs是什么意思?

在许多领域的论文,尤其是生物和计算机类的论文中,我们经常会见到motif,那么motif是什么意思?本文将通过最最原始的一篇论文《Network Motifs: Simple Building Blocks of Complex Networks》来介绍一下motif的来龙去脉,包括检测方法,以及其出现在复杂网络中的本质内涵。

论文地址:Network Motifs——《Science》

motifs旨在发现诸如“小世界现象”和“scale-free网络”等复杂网络特征的背后的机理。本文提出了一种检测network motifs的算法,这种方法可以适用于几乎任何网络。

motifs定义

假设网络是有向的,具有许多潜在的n-node subgraphs(n这里取3和4)。我们说motifs就是与随机网络相比出现次数较多的n-node subgraph结构。

检测方法

构造一个用于对比的随机网络。注意两点:一,其上的每个结点具有和真实网络一样的特性,即每个结点的入度和出度与真实网络中的对应结点相同;二,生成具有相同(n-1)-node的子图结构,以保证motif不会因为其子模式的重要而重要。(这里比较绕,就是说生成与原始网络数目相同(n-1)-node结构,这样你检测出来的motifs才具有统计意义。)
在论文中经常读到的motifs是什么意思?_第1张图片
此图红色虚线表示一种feedforward loop motif模式在现实网络中出现五次,而在随机图上出现次数很少。

由此,为了方便统计,定义“network motifs” 为在【随机图中出现的次数大于或等于在真实网络】的概率小于一个截断点(cutoff value)P=0.001。(这里就理解为motifs在真实网络中出现的概率较大)

算法在几个网络上的实验结果

下面是算法的应用,最左栏是不同的网络,右侧三栏就是挖掘出来的频繁motifs结构。
在论文中经常读到的motifs是什么意思?_第2张图片
在论文中经常读到的motifs是什么意思?_第3张图片

  • 转录基因网络
  • 食物网
  • 神经元网络
  • 电路网络
  • 万维网

结论

结论不重要,就是说具有相同特征的网络中提取出来的motifs也是相同的,主要看一下提取出来的motifs的结构。

算法优点

对小数据集同样适用、对错误数据不敏感。

你可能感兴趣的:(科研从小白到菜鸡)