本文主要针对数模美赛中复杂网络模型的相关知识进行了总结,此外,其余需要使用复杂网络的情况也可以参考本文
目录
分类
均匀性分类
关联性分类
一些基础
复杂网络上的传播机理与动力学分析
免疫网络
免疫模型
免疫类型
复杂网络的传播动力学
复杂网络上的相继故障
复杂网络中的搜索:(搜索需要的数据)
复杂网络中的社团结构(可区分层次)
分裂模型
凝聚算法
复杂网络中的同步
无标度网络的完全同步
局域世界演化网络模型的完全同步
应用
各因子与完全同步的关系
改进复杂网络同步的方法
相位同步
复杂动态网络的控制
应用
描述节点间相互作用
各种模型
路网可达性
节点重要性
度中心性(degree)
接近中心性(Closeness Centrality)
中介中心性/中间中心性(Between Centrality)
特征向量中心性(Eigenvector Centrality)
度的分布(常为幂律分布)
复杂网络的性质分析
衡量影响度
排名算法汇总
PageRank
Hits Algorithm
TrustRank
均匀网络(如WS小世界模型) 度数分布较均匀
非均匀网络(如BA无标度网络) 度数分布极度不均匀
无关联网络:任何一个节点的度与它的邻居节点的度是相互独立的
关联网络:节点的度与它的邻居节点的度不是相互独立的
鲁棒性和脆弱性并存。有限支撑、无限支撑“赢者通吃”。
病毒、灾难、火灾、通信网络中的堵塞都可作为对象。
慢动态 负荷缓慢增长 |
快动态 描述相继故障发生和传播,速度很快 |
网络中具有很多类似的节点,并且各自具有随机的初始负荷及初始扰动 |
某一结点过载后会失效并将一个固定大小的负荷传给其他节点 |
应用 社会网络中两个人之间的最短关系链寻找最短关系链寻找、WWW中网页的搜索和P2P网络结构及其搜索技术。
改进方法:1、迭代加深 2、有向广度优先搜索 4、K遍历器随机游走
派系过滤算法:
一个社团从某种意义上可以看成是一些互相连通的“小的全耦合网络”的集合,这些“全耦合网络”成为“派系”。
大量的看似巧合的同步行为可以用数学来给出解释,每个个体是一个动力学系统,而诸多的动力学个体之间存在着某种特定的耦合关系。
Lyapunov指数
类型1、2、3网络需要判断为哪一种网络
假设网络是连通的,那么只要网络的耦合强度充分大,类型1网络就一定可以实现同步;
而只有当耦合强度属于一定范围时的类型2网络才会同步,也就是说,太弱或太强的耦合强度都会使类型2网络无法实现同步。
同步最优网络: 同步化性能要比BA无标度网络的同步化性能强,但由于存在极少量的‘hub’点,这样在恶意攻击下它要比BA无标度网络更容易奔溃。
同步优先网络:对于随机去除节点和恶意攻击都很鲁棒的同步优先网络模型。
一般来说,与无标度网络相比,局域世界演化网络能够在保持鲁棒性的同时,还能提高网络对恶意攻击的抗脆弱性。
最近邻耦合网络在N趋近∞时不可能达到同步,但通过加入少量的长程边将网络的平均路径明显缩短,它的同步化能力便会有明显提高。
对于小世界网络,当加边或重连概念不断变化时,会对应产生多个具有不同网络基本特性的小世界网络模型;随着概率的增加,网络变得更加非均匀,无论是新加入长程边(NW小世界)或是重新连接长程边(WS小世界),网络中度的最大值都会增加。
对于无标度网络,当幂律指数不断变化时,也会得到多个不同的无标度网络模型;随着幂律指数的增大网络度分布变得比较均匀,因此网络的平均路径就会增加,同时平均度变小。
单纯用度的大小、度分布或平均路径长度等指标都无法统一表征复杂网络的同步化能力。
想要提高网络的同步化能力应该降低节点的最大介数。
如果两个耦合节点的相位之间以一定的比率锁定,那么就称这两个节点达到相位同步。相位同步是一类同步化程度比较弱的同步现象,发生相位同步时,各节点的相位可能已经锁定,但幅值却会完全不同
牵制控制利用无标度网络结构的非均匀行,有针对地对网络中的少数关键节点施加反馈控制,由此牵一发而动全身,从而能够将规模庞大的复杂动态网络稳定到平衡点,获得很高的控制效率。
规则网络时空混沌的牵制控制
可将时空混沌控制到周期轨道和非混沌状态,可控制达到混沌状态或强混沌状态。
社团检测:潜在客户挖掘、关联群体风险分析等;
网络中心性分析:网页排名(PageRank),供应链核心企业识别,信息传播枢纽节点识别等;(PageRank无法解决悬空节点问题)
网络传播预测:流行病传播,金融风险传播,舆论传播;
网络关系渗透:节点之间的关系(三度影响);
关联交易分析及投融资黑洞:虚假交易,担保圈分析等。
这些模型都具有预测能力。
也可以用显式的网络结构来确定网络的局部和全局性质,或者忽略任何一种网络结构,用经典的数据挖掘和元素聚类来标识属性。
路网可达性是城市小区或路网节点相互之间居民出行或车辆行驶平均时间的倒数。表示交通难易程度的一项技术指标,计算值愈大,则可达性愈好。1959年,汉森首次提出了交通可达性的概念,这被定义为接受道路网络中节点之间相互作用的机会。
Freeman’s research[1979] 详见2014C—25318 P6
度中心性(Degree Centrality)是在网络分析中刻画节点中心性(Centrality)的最直接度量指标。网络中与该节点直接相连的节点个数,一个节点的节点度越大就意味着这个节点的度中心性越高,该节点在网络中就越重要。
反映在网络中某一节点与其他节点之间的接近程度。某点到网络中其他点的距离总和。将一个节点到所有其他节点的最短路径距离的累加起来的倒数表示接近性中心性。即对于一个节点,它距离其他节点越近,那么它的接近性中心性越大
主要描述某个节点在整个网络中的中心程度,说明整个网络的集中程度,即整个网络围绕某一结点或一组节点来运行的程度。以经过某个节点的最短路径数目来刻画节点重要性的指标。中介中心性指的是一个结点担任其它两个结点之间最短路的桥梁的次数。一个结点充当“中介”的次数越高,它的中介中心度就越大。如果要考虑标准化的问题,可以用一个结点承担最短路桥梁的次数除以所有的路径数量。
一个节点的重要性既取决于其邻居节点的数量(即该节点的度),也取决于其邻居节点的重要性。
用中心度的时候最好都把这几种中心度进行说明,然后说明我们为什么选择这一种中心度
选择中心度的时候都说明了这几者的对比,表明了选择某一项的理由
信息流网络考虑重要性时需考虑度数大的点,“桥”的作用的点,非流网络考虑度数大的点
Newman提出的模块度具有两方面的意义:
当然,模块度的概念不是绝对合理的,它也有弊端,比如分辨率限制问题等,后期国内学者在模块度的基础上提出了模块度密度的概念,可以很好的解决模块度的弊端,这里就不详细介绍了。
常用的社区检测方法主要有如下几种:
“小世界”网络在信息传递和处理的过程中具有相对高的局部效率和全局效率; 而无标度网络中节点的重要性具有极端的两极分化, 表明网络中存在超级重要的核心节点, 这些核心节点在维持整个网络的完整性和连通性中发挥着不可估量的作用。 这两大重要发现引发了复杂网络研究的热潮。 越来越多的研究表明来自不同领域的网络, 包括社会网络、经济网络、生物网络等都具有“小世界”性和无标度性。 这使得人们认识到, 真实网络既不同于规则网络, 也不同于随机网络, 而是介于规则网络和随机网络之间, 具有与两者不同的统计特征的复杂网络。
实际上小世界和 random network 的度分布相似,点与点之间的连接是随机的,所以都是钟形正态分布,但是小世界的点点之间路径最短。
无标度网络有巨集团和剩余度的涌现,也就是说巨集团基本代表网络的连接密度,少数的点有大量的连线,大多数点有少量或没有连线。无标度的度分布也引发了相关的对自组织临界和熵厥的讨论,是当今研究主要课题。
分析完是否是小世界/无标度之后,写出其性质。还有一些基本性质,比如有向无向,有权无权,有环无环
GOOGLE PageRank最为广泛使用
Hilltop 算法
ExpertRank
HITS
TrustRank
可计算,特征向量中心性(Eigenvector Centrality):一个节点的重要性既取决于其邻居节点的数量(即该节点的度),也取决于其邻居节点的重要性。
PageRank无法解决出度为零的节点(悬空节点)的问题
传统的PageRank只适用于点有权值的图。对于加权边的图,可以根据边的权值制定一套规则转化为点的权值进行修正,然后PageRank可以适用于(可以参考2014C--25318)
HITS算法通过两个评价权值——内容权威度(Authority)和链接权威度(Hub)来对网页质量进行评估。其基本思想是利用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),具有计算简单且效率高的特点。HITS算法认为对每一个网页应该将其内容权威度和链接权威度分开来考虑,在对网页内容权威度做出评价的基础上再对页面的链接权威度进行评价,然后给出该页面的综合评价。内容权威度与网页自身直接提供内容信息的质量相关,被越多网页所引用的网页,其内容权威度越高;链接权威度与网页提供的超链接页面的质量相关,引用越多高质量页面的网页,其链接权威度越高。
HITS算法也有其明显的不足。首先是权威性的确定因为权威页面必须针对某一主题或关键词而言。例如某一页面对一确定主题具有较大权威性,但这并不意味在其他与其无关的主题方面同样具有权威性。其次是非正常目的的引用。
以前依靠链接和相关性来决定排名的方式,已遭到了各种各样作弊行为的挑衅,Spam的横行,直接导致了Google必须找到一种新的反作弊机制,以确保高质量的站点来获得搜索引擎的青睐。这种情况下Sandbox和TrustRank被提了出来。意图确保好的站点能获得更高的搜索表现,并加强对站点的审核。Google自己关于TrustRank的最初论述也提到了这些。
这些都是商业网站和博客所应有的素质,而不是那些利用垃圾内容和虚假入站链接赚些快钱的网站所具备的