Hefei University of Technology
专业名称: 交通工程专业
年 级: 2019级
学生姓名: 曾培圣
学 号: 2019210025
指导教师: 王世广
学院名称: 汽车与交通工程学院
完成时间: 2022年1月
**一、 **实验所属课程名称
复杂网络导论
二、 实验名称
公交网络分析
三、实验时间
2021年12月——2022年1月
熟悉交通网络的建模方式,认识多种网络视角下的家乡城市道路网或公交线网特征;并基于GIS课程识别的常发性拥堵路段,分析网络指标与交通状态之间的关系。
可选两个不同年份的城市道路网、一个城市道路网和一个公交线网进行分析。
五、实验所用部分软件
ArcGIS 10.5、Gephi、Python等
六、实验过程及内容
2019年韶关市拥有公共汽车200辆。以换算系数1.0计,折合标准车200标台。可以算出韶关市公交车服务人数为2957人/标车,相应为人车辆拥有率为3.38标车,远低于国标(GB50220-95)中大城市10~12.5标车/万人标准。与国内同类城市相比,处于较低水平。
目前韶关公交站场设施较为缺乏,只有火车站广场公共汽车站与南郊金沙小区内公共汽车维修站场两处。因此存在公交车辆没有停车专用场地、停车场严重不足、停车场与保养场分离问题严重。
历史统计资料显示,韶关市公交线网发展处于缓慢增长状态。1996年已达到111公里,到2019年才增长为153公里,年增长率仅为4%,线路长度年均增长点仅为4,7公见。其中2019-2019年间,公交线路长度处于零增长状态。目前韶关公交线路平均长度为119公里。韶关市历年公交线路长度发展趋势。
表 1历年公交线路长度变化
年份 | 1996 | 2019 | 2019 | 2019 | 2000 |
---|---|---|---|---|---|
公交线路长度(公里) | 111 | 111 | 108 | 127 | 127 |
年份 | 2019 | 2019 | 2019 | 2019 | 2019 |
公交线路长度(公里) | 127 | 127 | 132 | 153 | 153 |
目前在城市中心区公交线路网密度约为3.3km/km2,达到规范要求3-4km/km2而指标。而城市边缘地区线路网密度则远没有达到2-2.5km/km2标准。韶关目前公交线网重复系数约为2.9,亚复线路最多道路如解放路部分路段存12条公交线路经过,而西河大桥与武江桥各有12条公交线路经过,公交线布设普遍集中在干道上,根据调查线网情况,去除部分远郊线路,根据统计剖析,全市公交线路平均非直线系数为1.49,高于国标值。
韶关市公交客运量一直呈上升趋势。从1996年至2019年年均增长292.7万人次,年均增长率为34.6%其增长幅度超过公交车辆规模、线路长度增长,表明目前公交车内拥挤桯度比以前高了。从韶关市历年公交车辆拥有量及客运变化趋势可看出,总体来说,韶关市公交运输能力发展迅速,为城市社会经济发展提供了重要支撑。公交客流最大集散点为火车站,这与火车站地区布设大量公交线路有关,同时也是最大公交枢纽站。
打开高德地图API,登录自己的账号,进入控制台。新建应用,选择Web端(JS API)。
新建成功后,得到一个Key。
使用公交线路获取小工具:Run Main Window。
在软件中输入获取的Key和城市名称,线路数输入1-999,随后等待软件成功获取完成公交线路数据。
图 1控制台密钥获取
图 2获取数据的软件
图 3获取公交数据
以公交站点为节点,如果相邻的公交站点间存在着公交服务,则节点之间存在一条连边。网络为无向网络,边权为站点之间的公交车辆数。
以公交站点之间的连边作为节点,如果公交线路之间存在交点,则节点之间存在连边。
将获取的数据导入Arcgis中,并进行x,y坐标显示,可以得到基于WGS1984坐标系下的公交站点图。
利用Arcgis中的点集转线工具,可以在公交站点间进行连线,并且通过字段线路,连接该线路的公交站点;最终形成公交线路网。
图 4Arcgis中韶关公交线路网络
图 5韶关公交站点图
图 6获取的公交站点数据
图 7整理后的点数据表格
图 8整理后的边数据表格
图 10导入数据
图 11选择GBK格式
图 12导入点数据后
图 13导入的点数据
图 17使用Geo layout
图 18使用使用Geo layout后
图 21边的颜色
3.1 多种网络的呈现
Gephi布局是根据某种策略对节点和边进行排布,使图形既具有特定需要的合理性,也易于视觉识别。它们的核心都是平衡一个网络中节点的斥力和引力关系。
一般来说,布局应满足:
默认布局(12种)大致可分为两类:
表 2布局特点
布局类型 | 描述 | 参数配置 |
---|---|---|
force atlas | 使布局更加紧凑,可读性更强 | 1、惯性:值越大,图摇摆幅度越大 2、斥力强度:节点排斥其他节点的强度,值越大,节点距离越大 3、吸引强度:连接节点的吸引力强度,值越大,有连接的节点越被拉进 4、重力:值越小,图越分散;值越大,图越被压缩 5、速度:布局运动的速度,值越大,图布局的速度越快 |
force atlas 2 | 改进的 force atlas,速度更快 | 1、缩放:节点的斥力强度,值越大,斥力越大,图越稀疏 2、更强的重力:已定义好的较强的重力 3、重力:自定义的重力值,可以比更强的重力更强 4、劝阻 hubs:只有输入的边会被推到边缘 5、LinLog 模式:线性和对数模式的切换 6、防止重叠:将重叠的节点展开7、容差(速度):布局速度的选取,较小的值速度慢,但精度更高 |
Fruchterman Reingold | 布局 FR 布局,基于再次改进的弹性模型 | 1、区:定义图形的幅度,值越大图越大,越稀疏 2、重力:定义重力值,值越大重力越强,节点越被中心吸引 3、速度:布局的速度,值越大布局速度越快,但越不精确 |
Noverlap(交叠) | 可防止节点重叠,但不考虑节点标签重叠 | 1、速度:速度越快,精度越差 2、节点间距:间距为 1 时,节点会连接在一起,间距为 2 时,节点会分开;间距为 1.1 时,间距增加 10%,小于 1 时允许节点重叠 3、幅度:增加幅度半径,幅度为 0 时,没有余量,幅度为 10 时,节点分开至少 20 像素,负幅度允许重叠 |
Openord | 支持多核、并行,适合处理节点较多的图 | 布局阶段分为 liquid、expansion、cooldown、crunch 和 simmer 5 个过程 |
Rotate | 顺/逆时针旋转 | 将图形从整体上做顺时针或逆时针旋转 |
Yifan Hu | 在多层级力引导算法中引入超节点概念 | 1、最佳距离:值越大,整个图的尺寸越大 2、相对强度:值越大,节点越稀疏 |
扩展/收缩布局 | 对图形做整体上的放大或缩小处理 | 比例因子为 1,图保持原状; 大于 1:图放大,值越大,放大比例越大; 小于 1:图缩小,值越小,缩小比例越大 |
标签调整布局 | 防止节点标签重叠 | 1、速度:值为 1,可较缓慢地把标签重叠的节点躲避开,使节点标签没有重叠,值越大,速度变快,但躲避的幅度会较大 2、包括节点的大小:勾选后,会使重叠的节点也躲开 |
随机布局Gephi | 初始导入数据时的模式,将节点随机散步在正方形内 | 空间大小可以设置随机散步节点的正方形的边长 |
根据点数据的经度和纬度坐标进行布局,一般选择墨卡托投影坐标系。
图 22Geo layout布局
首先是,使用预设置进行分布的Force Altas布局图。
图 23Force Altas布局
其次是,勾选<吸引力分布>和<由尺寸分布>功能后,重新进行分布的Force Altas布局图。
图 24重新分布的Force Altas布局
然后是,调整斥力强度为:900,再重新进行分布中,选取合适的界面进行分布的Force Altas布局图。
图 25调整斥力强度
图 26Force Altas2布局
勾选<劝阻Hubs>,
图 27重新分布Force Altas2布局
3.2 网络指标计算与分析
主要选择Geo layout布局形式进行分析。
3.2.1 原始网络的统计分析
平均度:
图 30平均度
平均加权度:
图 31平均加权度
网络直径(平均路径长度):
图 32网络直径1
图 33网络直径2
图 34网络直径3
图 35网络直径4
图 36网络直径5
图密度:
图 37图密度
点击次数:
图 38点击次数1
图 39点击次数2
图 40点击次数3
模块化:
图 41模块化
PageRank:
图 42 PageRank
连接部件:
图 43连接部件
平均聚类系数:
图 44平均聚类系数
特征向量中心度:
图 45特征向量中心度
表 3原始公交站点线路网络指标
属性 | 平均度 | 平均加权度 | 网络直径 | 图密度 | 模块化 | 连接部件 | 平均聚类系数 | 平均路径长度 |
---|---|---|---|---|---|---|---|---|
值 | 2.406 | 3.641 | 47 | 0.005 | 0.836 | 21 | 0.072 | 14.445 |
图 46原始公交站点线路网络指标1
图 47原始公交站点线路网络指标2
图 48原始公交站点线路网络指标3
模块化:Modularity Measure(模块化度量值),由Newman等人提出,是目前常用的一种衡量网络中社区稳定度的方法。模块度值的大小主要取决于网络中结点的社区分配,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度来获得最优的网络社区划分。
从图中可以看到该图的模块化结果为0.836,比较接近1,所以社区结构的强度是较高的。度和平均度相差不大,网络直径接近50,平均路径长度较小。
3.2.2 过滤网络的统计分析
首先对节点度大的点进行过滤,即只显示度较小的点。选择拓扑⇨选择度范围⇨选择1~3。
图 49度过滤操作
过滤后图:
图 50度过滤后
二者对比图:
图 51原始公交站点线路网络与过滤网络对比
表 4原始网络与过滤网络指标指标对比
属性 | 平均度 | 平均加权度 | 网络直径 | 图密度 | 模块化 | 连接部件 | 平均聚类系数 | 平均路径长度 |
---|---|---|---|---|---|---|---|---|
原始值 | 2.406 | 3.641 | 47 | 0.005 | 0.836 | 21 | 0.072 | 14.445 |
度1~3 | 1.378 | 1.875 | 19 | 0.003 | 0.985 | 129 | 0.022 | 5.107 |
图 52指标对比1
图 53指标对比2
图 54指标对比3
从各类图中可以看出,连接部件在只留下度为1~3的节点时,急剧上升。连接部件是确定网络中连通分量的个数。在所有参数中,平均度、平均加权度、网络直径、图密度、平均聚类系数、平均路径长度均有一定的幅度减少,而连接部件提高很大,模块化有一定的提高,更接近于1,说明强度更高了。
表 5原始网络与过滤网络指标对比
属性 | 平均度 | 平均加权度 | 网络直径 | 图密度 | 模块化 | 连接部件 | 平均聚类系数 | 平均路径长度 |
---|---|---|---|---|---|---|---|---|
原始值 | 2.406 | 3.641 | 47 | 0.005 | 0.836 | 21 | 0.072 | 14.445 |
度1~3 | 1.378 | 1.875 | 19 | 0.003 | 0.985 | 129 | 0.022 | 5.107 |
度5~10 | 1.444 | 3.056 | 8 | 0.041 | 0.744 | 13 | 0.25 | 2.8 |
图 55过滤后图
图 56实际地图
图 57原始公交站点线路网络与过滤网络对比
图 58指标对比1
图 59指标对比2
图 60指标对比3
对度为510的节点进行过滤筛选,可以发现度大的节点数量比度为13的节点数量少许多。同时,将过滤后的图对比实际的道路地图,发现度最大的节点即为韶关东站。这在现实中也是符合情况的,韶关东站不仅是许多公交线路的起点和终点,也是客运站的出发点。同时韶关东站地理位置关键,是三河两岸中的其中一岸,起着交通枢纽的作用。
3.3 网络鲁棒性分析
随着科技的发展,我们的生活中到处充满着复杂系统,复杂网络逐渐成为科学家们研究的热点。复杂网络给我们的生活带来了很大的便利,但是复杂网络无时无刻不受到各种攻击,包括随机攻击和恶意攻击。因此,复杂网络的抗毁性研究变得尤为重要,其中复杂网攻击策略是抗毁性研究的关键。
指数网络都具有很强的鲁棒性,在静态攻击下至少移除80%的节点网络才濒临崩溃,即使在最有效的攻击策略RBC的攻击下也要移除40%的节点。BA无标度网络在受到攻击时比较脆弱,静态攻击下只需移除40%的节点网络就陷入瘫痪,而在动态攻击下仅仅移除20%的节点网络就瘫痪。
无标度网络对随机破坏具有很强的抗毁性,但是对于蓄意攻击却十分的脆弱。本文将渝渗理论和优化方法相结合,分别给出了在一定网络平均度约束下无标度网络对随机破坏和蓄意攻击的鲁棒性优化策略。数值结果发现,无标度网络对于随机攻击在最小节点度m=1时,网络的抗毁性最强。当网络同时遭受随机破坏和蓄意攻击时,如果网络平均度〈κ〉=3,那么最小度为1的情况下,网络的鲁棒性最好;如果网络平均度κ大于3,那么网络的鲁棒性随着最小节点度的增大而增大。
网络的攻击策略主要有两种,一种是蓄意攻击,一种是随机攻击。
许多复杂系统对于随机攻击表现出令人惊奇的容错性。Barabasi等证明了无标度网络对随机攻击具有鲁棒性,但是对蓄意攻击却很脆弱。以往,关于对无标度网络进行攻击的大部分研究都是考虑直接删除掉节点。
表 6蓄意攻击后网络指标
属性 | 平均度 | 平均加权度 | 网络直径 | 图密度 | 模块化 | 连接部件 | 平均聚类系数 | 平均路径长度 |
---|---|---|---|---|---|---|---|---|
原始值 | 2.406 | 3.641 | 47 | 0.005 | 0.836 | 21 | 0.072 | 14.445 |
蓄意攻击 | 2.185 | 3.265 | 51 | 0.005 | 0.869 | 30 | 0.063 | 14.977 |
图 61蓄意攻击后网络
图 62蓄意攻击后网络指标对比1
图 63蓄意攻击后网络指标对比2
图 64蓄意攻击后网络指标对比3
由图表可以得知,网络的直径大小在去除较大节点后,提高较大,也就是说网络中的最短路径变长了。同时也可以看到,平均集聚系数和平均路径长度都有所下降,但是下降的幅度不大。
表 7随机攻击后网络指标
属性 | 平均度 | 平均加权度 | 网络直径 | 图密度 | 模块化 | 连接部件 | 平均聚类系数 | 平均路径长度 |
---|---|---|---|---|---|---|---|---|
原始值 | 2.406 | 3.641 | 47 | 0.005 | 0.836 | 21 | 0.072 | 14.445 |
随机攻击 | 2.267 | 3.339 | 51 | 0.005 | 0.868 | 26 | 0.074 | 15.218 |
差值 | 0.139 | 0.302 | 4 | 0 | 0.032 | 5 | 0.002 | 0.773 |
图 65随机攻击后网络
图 66随机攻击后网络指标对比1
图 67随机攻击后网络指标对比2
图 68随机攻击后网络指标3
可以看到随机攻击,对网络影响不大,但是有的指标变化幅度比其他变化幅度要大,例如连接部件和网络直径。应该是在随机攻击时,不可避免地也会攻击到一些较为重要的节点,从而导致网络的一些指标大幅度变化。
文中考虑了两种攻击策略的情况,蓄意性攻击实际上对公交网络的破坏性更为严重,所以在未来的研究中可以进一步考虑蓄意性攻击的影响及应对措施。
3.4 网络结构与功能的关联规律
图 69公交站点网络指标对比
表 8公交站点网络特征
网络基本指标 | 原始网络 | 过滤网络 |
---|---|---|
无标度指标 | 4.07 | 2.88 |
连通度 | 0.53 | 0.48 |
复杂度 | 1.55 | 1.33 |
3.5 拥堵的结构性解释
图 70韶关交通态势图
图 71度大节点过滤图
根据之前进行的交通态势数据获取,再结合网络线路分析。再进行节点过滤时,发现城市中心主要拥堵路段,大部分为度较大的节点。节点的度是该点的邻边数,度越大,说明该点与其他节点的连接越多。度为4~10的节点以及更大的节点主要在城市中心,与拥堵地段相匹配。这一点反应在交通方面上,可能理解为度大的节点即许多路径要通过的节点,如果车流量大,则该点汇聚多处车流,容易发生拥堵。
3.6 网络的不同展示
统计分析里面的不同算法→选择不同的渲染模式→最终图形,可以展示网络不同的一面,有利于我们从另一个角度去分析网络的特点。
PageRank算法主要应用在搜索引擎的搜索功能中,其主要用来计算网页的重要程度,将最重要的网页展示在网页的前面,此算法主要围绕以下两个假设:
①如果存在一个网页,它被许多其他的链接链接到,则说明这个网页比较重要,则此网页的PageRank值比较高。
②如果存在一个网页,它本身的PageRank值比较高,且此网页又链接了一个网页,则这个被链接的网页比较重要,其PageRank值较高。
进行连接部件计算,为后续使用Component Id进行分类显示打下基础。
图 74连接部件计算
图 75节点颜色-Component Id
可以看到通过几个不同的色块,将一些连通性强的节点显示了出来,而且其他节点连通性相比较弱,为大面积的紫色。而中间连通性强的点,也是度较大的点,同时也是会发生拥堵的路段附近的公交站点。
图 78Force Altas2布局
3.7实验心得
通过这次的实验,主要让我了解了Gephi的使用,以及加深了对课程上所学知识的理解。对复杂网络的性质和指标有了更深层次的认识。同时,也掌握了在Gephi中构建复杂网络的能力,可以通过对网络的调整,布局逐步分析网络,发现网络的性质。同时与生活中的网络联系起来,解决实际问题,如这次选择的韶关公交站点线路网络;可以在网络分析的过程中分析韶关公交线路网络的性质,如关键站点;以及配合韶关交通态势图,对公交线路的相互影响。