复杂网络基本概念

复杂网络
理解:节点和边构成的网络图,比如社交网络、电力网络等等。每一个网络的有自己的拓扑结构。

复杂网络的类别

划分:
(1)规则网络、随机网络、两者之间的网络类型
(2)当节点类型数量|A|>1或边的类型数量|R|>1时,
这样的信息网络称为异质网络.反之为同质网络.
(3)稀疏网络、稠密网络(稠密网络的节点是边的小数倍)
判断稀疏图与稠密图
这个判断方式没有绝对的标准,可以依据定义来判断,比如边的条数|E|很接近|V|²,那么毫无疑问是个稠密图,但是写算法时经常要根据数据的特点选择使用邻接矩阵还是邻接表,所以我们可以从使用算法的复杂度出发,比如对于Dijkstra算法,朴素Dijkstra时间复杂度是n²,而堆优化Dijkstra时间复杂度mlogn,其中m是边的个数,所以单从算法效率上讲,稀疏图与稠密图的分界点大概就在m=n²/logn处,但是实际上复杂度是有系数的,所以单从式子上计算也是不太科学的,可以作为一个参考。

    现在主要的说法是以m=nlogn作为区别稀疏图与稠密图的标准,实际上这个说法也不是很准确,但是考虑到实际场景中的数据,我们构造的图的边大多数时候是很显然远大于nlogn或者远小于nlogn的,所以用这个方式判断也是合理的。

————————————————
版权声明:本文为CSDN博主「负壹」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_41685265/article/details/106828842

复杂网络中基本特征描述

集聚系数(也称群聚系数、集群系数)是用来描述一个图中的顶点之间结集成团的程度的系数。具体来说,是一个点的邻接点之间相互连接的程度。

整体集聚系数的定义建立在闭三点组(邻近三点组)之上。假设图中有一部分点是两两相连的,那么可以找出很多个“三角形”,其对应的三点两两相连,称为闭三点组。除此以外还有开三点组,也就是之间连有两条边的三点(缺一条边的三角形)。这两种三点组构成了所有的连通三点组。
在这里插入图片描述
局部集聚系数,图中的一个顶点 {\displaystyle v_{i}}v_i 的局部集聚系数 {\displaystyle C(i)}C(i) 等于所有与它相连的顶点之间所连的边的数量,除以这些顶点之间可以连出的最大边数
平均集聚系数,具体来说就是所有顶点的局部集聚系数的算术平均数:
在这里插入图片描述

平均路径长度也称为特征路径长度或平均最短路径长度,指的是一个网络中两点之间最短路径长度(或称距离)的平均值。从一个节点{\displaystyle s_{i}}s_{i}出发,经过与它相连的节点,逐步“走”到另一个节点{\displaystyle s_{j}}s_{j}所经过的路途,称为两点间的路径。其中最短的路径也称为两点间的距离,记作{\displaystyle \operatorname {dist} (i,j)}\operatorname {dist}(i,j)。而平均路径长度定义为:

在这里插入图片描述

这其中{\displaystyle N}N是节点数目,并定义节点到自身的最短路径长度为0。如果不计算到自身的距离,那么平均路径长度的定义就变成[7]:


度分布:节点所连接的的节点数目,分为出度和入度。度=k的概率
节点强度:则是它的边的加权和
介数:节点介数指网络中所有最短路径中经过该节点的数量比例,边介数则指网络中所有最短路径中经过该边的数量比例。介数反映了相应的节点或边在整个网络中的作用和影响力
社区结构:社区结构刻画的是信息网络中节点间连接边的关系的局部聚集特性,网络中的社区通常由功能相近或性质相似的网络节点组成。(同一个社区结构内的节点间联系紧密,不同社区之间的节点的联系稀疏)
社区发现:是基于网络的拓扑结构信息识别出具有相似特
征或相似行为的节点组。早期社区发现研究的是非重叠社区结构(见图2(a)),一个节点只属于一个社区.而在实际生活中,常常存在重叠社区结构(见图2(b)),例如同一个人可能既属于篮球俱乐部,也属于乒乓球俱乐部.在大规模复杂的社会网络中,不仅存在重叠社区结构,同时还常常存在基于某些中心性节点的社区结
构(见图2©),例如明星粉丝团、传销团、恐怖分子团等.这
些中心性节点也称为领袖节点,相对网络中其他参与者节点,
中心节点具有一定的领导功能.
自相似网络:对于一个简单图的邻接矩阵Am×m,分别用A的每一个元素aij(1≤ i ≤m,1 ≤j ≤m)乘以A的每一个元素所得的矩阵去置换元素aij,得到一个局部与整体相似的自相似矩阵,令此变换过程不断进行下去,得到一系列自相似矩阵(对应于A的迭代Kronecker积运算),这些自相似矩阵视为邻接矩阵,其对应的网络就是A的迭代Kronecker积图,也具有自相似特性,即是自相似网络.
超图:图的每一个连接只能包含2个节点,称为边,而超图的每一个连接却可W包含1个、2个,甚至多个节点。显然,超图是图的超集,而图是超图的特殊情形。

复杂网络基本概念_第1张图片

两种典型的网络

小世界网络:特征路径长度短,和高集聚系数,也就是网络的平均路径长度 L 随网络的规模呈对数增长,即 L~lnN。
无标度网络:少数结点连接了较多的节点,多数节点连接较少,比如电影明星网络。无标度网络的度=k时,其度分布是k的概率等于k的负数次方,成为幂律分布,一般是根据长尾分布判断。无尺度网络的度分布是呈集散分布:大部分的节点只有比较少的连接,而少数节点有大量的连接。由于不存在特征度数,因此得名“无尺度”。
(随机网络度分布服从的是正态分布,度出现次数最大的一个成为特征度)
BA模型成功的为无尺度网络找到了一个简单而合理的形成机制。然而,BA模型也有其自身的局限。例如,它只能描述{\displaystyle \gamma =3}\gamma =3的无尺度网络,对于真实网络的一些非幂律特征如指数截断(exponential cutoff)、小变量饱和(saturation of small variables)等无法描述[2]:33。因此,各种BA模型的推广、变化版本开始出现。Bollobás在2001年提出了线性弦图模型(LCD模型),允许节点自己与自己相连[13]。而后又出现了只允许重复连线而不允许自连线的模型[14]与不允许重复连线、自连线而是在选中的旧节点的邻域随机联线的模型[15]。

适应度模型
在BA模型的制造过程中,人们发现,存在越久的节点具有越高的度数。然而,现实生活的网络中并非存在越久的元素就能有更多的联系。BA模型并没有包括“后起之秀”的现象[2]:33。于是,出现了基于BA模型的适应度模型。适应度模型主要是修正了优先连接的机制,对每个节点加上一个吸引因子{\displaystyle \mu _{i}}\mu _{i},这样新节点的相连概率改正为:

{\displaystyle \mathbb {P} _{i}={\frac {\mu _{i}d_{i}}{\sum _{j=1}^{n}\mu _{j}d_{j}}}}{\mathbb  {P}}_{i}={\frac  {\mu _{i}d_{i}}{\sum _{​{j=1}}^{n}\mu _{j}d_{j}}}[16]

局域世界演化模型
另一种基于BA模型的推广版本是局域世界演化模型。这个模型假设每个新节点在引入时并不能在全域进行优先连接。比如说一家新上市的公司可能只会与同地区或同国家的公司展开贸易联系,居民搬入新社区时只会与同一幢楼的人开始认识等等。局域世界演化模型将BA模型优先连接的机制改为:新加入的节点时,先选择全部节点的一部分(随机选取的{\displaystyle M}M个节点)作为局域世界,然后再在局域世界中进行优先连接。模拟结果指出,当{\displaystyle M}M从{\displaystyle m}m变化到{\displaystyle n_{0}+t}n_{0}+t时,产生的网络从服从指数分布逐渐过渡到服从幂律分布[17]。

复制模型
在BA模型中,度分布实际上是和增长的时间{\displaystyle t}t(或说增长次数)相关的,只是在{\displaystyle t}t十分大时近似于度分布。复制模型是一个与增长时间无关的模型。复制模型的做法是每次随机地“复制”一个原有的节点:即随机选定一个节点{\displaystyle i}i,再加入一个新节点,然后新节点按照i与其它旧节点连接的方式与旧节点相连,最后与{\displaystyle i}i也相连[18]。

分层模型
主条目:分层网络

图6.分层网络构造过程,n为模体级数,绿色为根节点
2001年,Barabási提出了第一个确定性的分层网络模型。这个模型是为了解释生物学中{\displaystyle \gamma \approx 2.2}\gamma \approx 2.2的代谢网络。分层模型的想法是从模体(motif)出发,通过自相似的层次叠加而得到复杂网络。这种思想类似于分数维图形。Barabási的模型是:

建立一个根节点,以及两个一级节点,并分别于根节点相连,这形成一个一级模体(右图6中n=1的阶段);
以一个一级模体作为根模体,再建立两个一级模体,将它们的一级节点(一共4个)与根模体的根节点相连,这样得到一个二级模体(右图6中n=2的阶段);
对二级模体重复前一步的操作(见右图n=3的阶段)。

图7.伪分形图构造过程,第一步为红边,第二步为粉边,第三部为绿边
这样形成的网络是无尺度网络,Barabási算出它的{\displaystyle \scriptstyle \gamma ={\frac {\log {3}}{\log {2}}}}\scriptstyle \gamma ={\frac {\log {3}}{\log {2}}}[19]。后来有使用5节点4连结作为模体,得到{\displaystyle \gamma =1}\gamma =1,而4节点3连结作为模体得到{\displaystyle \scriptstyle \gamma =1+{\frac {\log {4}}{\log {3}}}\approx 2.26}\scriptstyle \gamma =1+{\frac {\log {4}}{\log {3}}}\approx 2.26,近似于代谢网络。需要注意的是此模型中不少度数是0概率的,所以需要使用补分布绕过。类似的确定性模型还有伪分形图(pseudofractal scale-free network)[20]以及阿波罗模型(Apollonian network)[21]。
复杂网络基本概念_第2张图片
BA网络模型的实质是增长和择优,由此导致节点度数呈幕律分布。BA网络模型隐含着一个假设,一个节点可W与任意多个节点建立连接,即节点度数是没有上限的。而在实际情况中,一个节点维持与另^个节点的连接是需耍消耗能源与资源的,不可能与任意多个节点建立连接,必然存在最优连接数目与最大节点数目。(复杂网络构建及特性分析——论文)

网络动力学

复杂网络是对我们要研究的复杂系统,用结点和边将他们抽象成一张关系网络图,而动力学就是在“外部刺激”的推动下,或者是“内部消息”的触发下,网络中结点自身信息状态发生改变(消息的传播),或者结点间连接关系(反映在网络拓扑结构图:增长或退化)的变化,从而导致整个网络发生明显或者不明显的“质变”,这种改变可以是在某种规则约束下执行的,也可能是随机的。
————————————————
版权声明:本文为CSDN博主「米兰心雨」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/xinyumilan/article/details/7875835
同步是动力学研究中的一类,同步是网络中的不同节点的信息和状态渐趋相同的过程,与网络的拓扑结构有关。
(1)复杂 网络 的拓 扑结构 与复杂 网络 的同步
能力 之间 的内在关 系.过去 10年里,这方面 的工作取得 了很大 的进展,如 小世 界和无标度复 杂 网络 同步 能力的究;但很多基本 的 问题仍然没有解 决,如复杂 网络 的社 团结构与 同步能力之 间的内在联系.
(2)复杂 网络 的节点动 力学与复杂 网络 的同
步 能力之 间的内在 关系.过去 10年 里,几乎所有 的研 究工作都假定复杂 网络具有相 同的节点.但事实上,绝大多数实
际的复杂 网络 的节点之间或多或少的存在一些差异性或误差,并不完全相同,如 电力 网络.幸运地,对于非恒等节点的复杂网络 同步的研究 已经 引起了很 多研 究人 员的高度关注,如最近人们研究 的串同步 问题.
(3)复杂 网络 的同步能力 的优化 与调控.
(4)复杂网络 同步 的应用

复杂网络稳定性

鲁棒性:网络鲁棒性是指网络遭到随机故障或蓄意攻击时仍能维持其功能的能力
脆弱性:
抗毁性:复杂网络的抗毁性指网络功能在各种失效模式下持续作用的能力,往往被定义为网络在发生失效。网络抗毁性考虑的都是在一定破坏策略下,网络在若干部件出现故障后持续作用的能力。
后网络整体性能的下降值。
稳定性:
Holme等在其工作口]中对 网络 的攻击策略进行 了总结 ,
包括节点攻击与边攻击。每种攻击又包括四种不同的策略:
①ID移 除策略。对初始 网络按节点 或边的度大小顺 序来
移除节点或边 。② IB移除策 略。对初 始网络按 照节点
或边的介 数大 小顺序来 移除 节点或边。③ RD移除 策
略。每次移除的节点或边是当前 网络中节点或边的度
最大 的节点 。④ RB移除策略。每次移除的节点或边是
当前网络中节点或边介数最大的节点。

复杂网络研究关心的问题

总体而言,复杂网络研究关心的问题可以分为如下四个子类,各个子类之间并非完全独立,而是具有相互继承的关系。

首先,复杂网络研究关注如何建立一个复杂网络。
其次,我们关注如何定量刻画复杂网络,如何描述复杂网络的结构及其性质,我们开发了多种方法,例如统计网络的度分布情况,集聚系数等。
进而,我们关注网络是如何发展成这种结构的,也就是网络的演化过程如何描述。
最后,我们可以思考网络这种特定的结构的后果是什么。例如,网络的这种结构是否具有鲁棒性?网络上的动力学行为如何刻画等等。
值得注意的是,最后一个问题通常被我们称为正问题,即在已知结构的情况下去分析网络的性质。而第一个问题则是复杂网络中的反问题:在许多情况下,我们并不知道网络结构,因此我们首先要通过某种方式(例如网络重构方法)去建立网络结构。
。钱学森给出了复杂网络的一个较严
格的定义:具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络
称为复杂网络。复杂网络的复杂性主要表现在结构复杂性、节点多样性、动力学复杂
性、连接多样性、网络进化、多重复杂性融合等方面。复杂网络涉及到的研究领域主
要包括图论、计算机网络、社会学、生态学、统计物理学及经济学等。
复杂网络的研究内容主要包括:网络的化何性质、网络的模型性质、网络的演化动力学机制、网络的结构稳定性、网络演化的统计规律、网络的形成机制等。其基本测度包括:度、度的相关性、度的分布特征、最短距离及其分布特征、集聚程度及其分布特征、介数及其分布特征、连通集团的规模分布等

从事复杂网络研究的研究人员可划分为理论派别和实验派别两个派别,理论派别方面的研究人员主要对复杂网络模型及其相关理论进行研究,如对求解复杂网络度
分布的理论与方法的研究等;实验派别方面的研究人员主要对真实网络的结构和功能
进行研究,如对互联网、航空网络、电力网络、电信网络、通信网络、社会网络、生
物网络、病毒传播网络等真实网络的研究及对无标度网络的实证、建模和功能特征的
研究等。对复杂网络特定动力学的研究包括同步动力学、传播动力学、交通动力学、
演化动力学等,对复杂网络特定结构的研究包括时间结构、空间结构、社团结构、模
块结构等

复杂网络基本概念_第3张图片复杂网络基本概念_第4张图片复杂网络基本概念_第5张图片

你可能感兴趣的:(网络,算法,机器学习)