一复杂网络的特性
1.复杂网络的特性之------小世界特性:
(1)社交网络中任何一个成员和任何一个认识的人之间的间隔人数不会超过六个人。即通过小于六个人,总能找到社交网络中任何一个成员。
(2)小世界特性又被称为六度空间理论或者六度分割理论。
(3)具有小世界特性的网络成为小世界网络。小世界网络中大多数节点都是不相连的,但是只需要少部分节点就可以到达想要的节点。
(4)描述小世界特性的一个一个重要的指标是:集聚系数。(下面会有详细解释)
(5)小世界:大多数网络的规模很大,但是任意两个节点之间有一个相当短的路径。它反映了相互关系的节点的树木可以很少,但是却能连接世界。例如在社会网络中,人和人的相互认识的关系很少,但是通过其他人(少于六个人)就可以找到很远的无关系的其他人。
2. 复杂网络的特性之------幂律特性
(1)现实生活中,少数的节点通常会有大量的连接,但是大部分节点的连接数却很少,这样的节点度数的分布符合幂律分布。这样的网络特性被称为无标度特性,我们把分布符合幂律分布的复杂网络称为无标度网络。
(2)网络的无标度特性反应了复杂了该网络具有严重的异质性,各节点间的连接状态具有严重的不均匀分布性。
(3)同时,我们把这些少量的节点,但是却含有大量的边的节点,叫做富节点。这些节点倾向于彼此之间连接,构成富人俱乐部。这些富节点对于复杂网络的控制起着十分重要的作用,我们只要控制好这些少量的节点,就可以实现对复杂网络的控制了,能够让复杂网络维持一个较好的平衡。
(4) 再者,网络的无标度性和网络的鲁棒性有着十分重要的关系。(鲁棒性是英文单词Robust译来的,它表示强壮、健壮的意思,表示在异常和危险的情状下,系统生存的能力。如果系统在这种异常和危险的情状下,系统的生存能力一样很好,那么系统就含有很强的鲁棒性)。为什么呢?因为虽然无标度网络具有很强的容错性,但是它对于随机故障的鲁棒性和针对蓄意攻击的脆弱性,无标度网络的抗攻击能力特别差,因为高度数的节点的存在极大的削弱了网络的鲁棒性,一个黑客只需要选择攻击网络中很少一部分高度数的客店,就可以使网络瘫痪。
3.复杂网络的特性之------集群特性
(1)首先集群特性是指:描述网络集团化的程度,是网络的一个内聚倾向。
(2)集群特性依赖于社区划分,通过将网络节点按照起内在的拓扑结构连接的紧密程度划分为子图的过程。划分的意义在于:由于社区往往代表复杂网络中具有相同的或相似的元素的集合,而这些元素相互协作,共同完成整个系统中某个相对独立的功能。提取社区结构有利于我们揭示复杂网络内在的功能特性,理解社区内个体之间的联系。
二.当前复杂网络的研究方向
当前复杂网络的研究方向大致可以分为关键节点的发现、社区发现和链路预测。
1.关键节点发现:旨在发现网络的结构和功能中起关键作用的节点
评判标准:
(1)点度中心性:在网络分析中刻画节点中心性
1.点度中心性(Centrality)是刻画节点重要性的最直接度量指标。一个节点的节点度越大就意味着这个节点的度中心性越高,该节点在网络中就越重要。
2.用公式表示为:C=deg(x)/N-1;
其中x表示一个节点,deg(x)表示x的度数,且该网中有N个节点
(2)接近中心性(也叫做紧密中心性)
1.描述的是该节点与其他节点的紧密程度。
2.通过计算节点与该网络其他节点的距离的平均值,就可以得到信息在该网络中的平均传播时长,来确定节点的重要性
3.如果一个节点与网络中的其他节点的平均距离越小,那么该节点的接近中心性就越大,意味着该节点在网络中越重要。
4.节点的接近中心性越大, 那么该节点就越靠近网络中心。同时邻居节点重要的,该节点也会相应更加重要一点,也会获得更大的传播力。
5.同时,有较大度数的节点通常位于网络中心,而具有较少度数的节点通常是位于外围或者网络的末端。
(3)介数中心性:
1.介数的中心性包括边介数和点介数。
2.引入介数的原因:
由于我们在判断节点的重要性时,我们知道,判断一个节点是否重要的一个指标是判断节点的度数。但是具有相同度的节点,又该如何度量这些节点在网络中谁更重要呢?于是就引入了一个介数的概念。
(3)点介数:即网络中的所有最短路径经过该节点的路径越的比例,如果该比例越大,那么该节点就越重要。
(4)边介数:即网络中的所有最短路径经过某条边的路径的比例,如果该比例越大,那么该边就越为重要。
(5)介数的中心性刻画了节点的网络中沿最短路径传输的网络流的一个控制。
(4)特征向量的中心性
1.通过求解出矩阵的特征值和特征向量,将特征值作为向心度的大小,将该特征向量作为该相信度在各个连接上的分量。
2.给予特征向量的中心性,当一个节点具有较大的特征向量的中心性指数时,该节点的邻居节点也比较重要。
(5)破坏性即重要性
当我们在度量一个节点的重要性时,还可以使用破坏性即重要性的准则。即度量去掉该节点之后对网络的破坏性。如果去掉该节点对网络的破坏性很大,那么代表着该节点在网络中很重要。
2.社区发现
1.社区发现旨在发现复杂网络中的社团结构,一边对网络中的节点进行一个合理的划分。
2.非重叠社区:即网络中的每个节点只属于同一个社区,那么社区和社区之间就不会有交集,这样的社区叫做非重叠社区。
3.重叠社区:以兴趣爱好广泛的同学为例,假设他们在学校里面既参加了足球协会,又参加了排球协会,那么这个同学既属于足球社区协会,又属于排球社区协会。重叠社区也是十分重要的 ,因为它是两个社区之间联系的桥梁和纽带。
3.社区结构的层次:即多种不同层次的社区分布。许多大的社区包含小的社区,小的社区包含更小的社区。
例如:大学群中通过包含院的qq群,院的qq群里面又具体分为系的qq群,又可以细分为班级qq群等等。
4.社区的特征:社区内部联系紧密,但外部之间连接的相对稀疏。
5.社区发现实际上就是一个网络聚类的方法,同时模块度为我们对网络社区的划分提供了一个度量的方法。若通过某种社区检测划分出来的模块度越大,那么对应的社区划分就越合理。
3.链路预测:
链路预测之灾预测复杂网络中任意节点可能存在链路的可能性。
二重要的名词补充
节点:
我们知道,复杂网络是复杂系统的一个抽象,那么复杂网络的节点也对应的是复杂系统的一个个实体。
边:
用于表示复杂网络中节点与节点之间的关系,即对应复杂系统中不同实体的联系。同时边可以有权重,表示节点与节点之间连接的紧密程度;也可以有方向,表示不同节点之间的单向或双向连接。
路径:
两节点i,j之间的路径由其所需要经过的边组成。(能使i,j两节点联通的所有通路都可以称为这两个节点之间的路径)
两节点之间的距离:
相互连接的节点i,j之间变数最少的路径所包含的一个边数。
邻居社区:
某个节点的邻居所在的社区就叫做邻居社区。
度:
与节点直接相连的节点的个数。度值的大小通常可以直观的反应节点在网络中的重要性。同时,对于有向图来说,度有分为入度和出度。有向图的出度用于表示该节点传播信息的能力,有向图的入度是对该节点受当前节点的影响的一个度量。
聚类分析:
将相似的化为一类,通过这种划分方式可以实现类间元素的同质性的最大化和类与类之间异质性的最大化。即聚到同一个数据集的样本应该像相似,属于不同组样本的数据集应该尽量不相似。
聚集系数:
1.聚集系数有叫做集聚系数。描述的是网络中积聚的情况
2.该系数是描述小世界网络的重要参数。(聚类系数大,平均路径小的网络叫做小世界网络)
3.如果该聚集系数近似于1,那么该网络中的所有节点近似相连。
4.如果该聚集系数等近似为0,那么表示该网络中的连接是很松散的,几乎没有。
循环系数:
循环系数用于描述网络的流通度。网络的全局循环系数,是指网络中所有节点的循环系数的平均值。
模块性:
模块性是指系统的模块化的程度。若该模块高内聚,内耦合,那么就代表着该模块越好。(内聚性是指节点之间彼此结合的紧密程度)
模块化系数:
1.模块化系数用于度量网络中聚类的强度,取值区间为0~1
2.模块化系数反映的是:模块中的节点的集中程度,而不是所有模块之间的节点的随机分布。
3.当模块系数接近于0时,那么表明网络中不存在社团结构。
4.同时模块话系数定义了某个节点属于某一个社团的可能性,那么我们就可以根据该系数判断某个节点是否位于一个某社团之中。
网络的优先连接特性:
网络中的节点更倾向于与那些具有高度数的节点相连,这种现象称为富者更富,或马太效应。
互模型:
该模型通常用于衡量两个随机变量的依赖程度。不同于先行比较,该模型还可以捕捉到非线性统计到相关性,因为可以认为它可以真实的度量两个随机变量的依赖性。