交通预见未来(16) 基于图卷积神经网络的轨道交通流量预测
《Predicting Station-Level Short-Term Passenger Flow in a Citywide Metro Network Using Spatiotemporal Graph Convolutional Neural Networks》。
2019年中国海洋大学的几位老师发在IISPRS International Journal of Geo-Information上的一篇文章(地学4区,IF:1.84)。
本文提出了一种基于深度学习的方法STGCNNmetro (spatial - temporal graph convolutional neural networks for metro),用于同时预测城市全网每个地铁站的进站流量和出站流量。具体地说,STGCNNmetro不再使用网格表示地铁站,而是将城市地铁网络转换成一张图,并使用图卷积神经网络(graph convolutional neural networks, GCNNs)进行预测。首先,我们应用立体图卷积运算来无缝地捕捉沿地铁网络的不规则时空依赖关系。其次,构造了一个由GCNNs组成的深层结构来捕捉城市层面上的时空依赖关系。最后,我们整合三个时间模式(最近的、每天的和每周的),并融合从这些模式中捕获的时空依赖关系,形成最终的预测值。STGCNNmetro模型是一个端到端框架,可以接受原始客流量数据,自动捕获全市地铁网络的有效特征,并输出预测。通过对中国上海城市轨道交通短期客流量的预测,验证了该模型。实验表明,STGCNNmetro模型优于7个已知的基线模型(LSVR、PCA‐kNN、NMF‐kNN、Bayesian、MLR、M‐CNN和LSTM)。此外,我们还探讨了模型对其参数的敏感性,并讨论了预测误差的分布。
整个城市的地铁网络可以表示为一个图,其中地铁站为顶点,地铁线路为边。每个站点顶点都有一个由客流历史值组成的特征向量,可以定义一个邻接矩阵来编码站点之间的成对依赖关系。因此,地铁网络不需要用网格来表示地铁站,也不需要用CNN来捕捉特征,而是可以用一个通用的图形来描述,利用GCNN可以有效地捕捉地铁网络层面而不是网格层面上不规则的时空依赖关系。
(1)用图表示地铁网络客流量的时间序列
根据前面M次观测,我们可以预测后续时间步长的客流量,在这项工作中,我们在一个图表上定义了一个城市范围的地铁网络,并关注结构化的时间序列客流量。如图1所示,V,E,W分别代表顶点,边和加权邻接矩阵。其中顶点Vt 代表t时刻所有地铁车站的客流量向量。
(2)图卷积操作
常规网格的标准卷积显然不适用于一般图。目前研究如何将CNNs推广到结构化数据形式的一种基本方法是利用图的傅里叶变换在频域中进行操作。其介绍了将卷积应用于光谱域的光谱框架,即通常所说的谱图卷积。一些后续研究通过将计算复杂度从O(n2)降低到线性成本,使得图卷积更加有效。本文使用的图卷积如下:
图卷积算子 “*g”是谱图卷积的概念,表示图信号x与核函数Θ的乘积。K表示从中心节点确定卷积的最大半径,ɑ卷积核参数, L是归一化的图拉普拉斯算子,σ是激活函数(例如ReLU)。(搞明白这个公式推荐阅读Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering)
(3)利用立体图卷积来捕捉不规则的时空依赖关系
在构建了上一节所述的图结构地铁网络数据之后,我们使用GCNN提取了地铁网络的局部不规则时空依赖关系。以顶点i为例,图2给出了核大小为1的传统图卷积(K = 1)。实际上,这是用一阶邻接进行的卷积计算。显然,顶点i与其5个一阶相邻顶点之间的空间依赖关系捕获(在图2中标记为1、2、3、4和5)。该操作要对所有顶点执行。针对地铁网络客流量时间前M个时间段的序列数据,我们构造了一个立体卷积核来无缝提取时空相关性。M个历史流量图被叠加在时间维度上。在立体图卷积中,卷积在空间和时间维度上都是无缝执行的,如图3所示。定义了时空图卷积算子“*g’”为图信号x’与立体核函数Θ’的乘积。对于顶点i,立体图卷积之后,能够捕获其一阶空间邻接顶点及其M阶时间邻接中包含的不规则时空依赖关系。
(4)使用深度GCNNs捕捉全网层面遥远的时空依赖关系
在地铁网络结构中,高阶邻接可以通过低阶邻接累积。例如,二阶邻接可以通过积累两个一阶邻接来获得。通常,一个城市地铁网络的空间规模很大,从市中心到郊区有很多车站。从直观上看,相邻车站之间的客流量可能会相互影响。这可以由一个GCNN层有效地处理,该层显示了强大的分层捕获空间结构信息的能力。此外,由于地铁系统连接两个相距很远的位置,这导致了遥远的车站之间的时空依赖关系。由于一个卷积层只考虑位置相近的站之间的依赖关系,为了捕获距离较远的站之间的时空依赖关系,需要叠加多个GCNN层来形成一个深度GCNN结构。
(5)利用时空GCNNs预测全市地铁车站短期客流量
提出的基于深度学习新模型STGCNNmetro的总体框架如图5所示。显然,地铁系统的客流包括进出站。在本研究中,进站流量为给定时间间隔内进站的总客流量,出站流量为出站的总客流量。我们首先将历史上的全市地铁进站流量图和出站流量图在每个时间间隔上转换为结构化的时空时间序列。由于时空依赖具有不同的模式,历史流量时间序列分为近期、每日和每周模式。然后,构建了三个基于GCNNs的子模型来捕捉这三种模式的特征。在参数矩阵的基础上,对三种输出进行融合,对不同车站不同模式的分析结果赋予不同的权重。最后,选择ReLU函数激活融合结果,给出最终的预测值。
其他部分不做解释。
文章画的图很漂亮,另外,文章的结果讨论特别详细。
关注微信公众号《当交通遇上机器学习》,
后台回复“数据”即可获取高达175G的四个月的滴滴GPS数据和滴滴订单数据的获取方式,以及从数据处理(Oracle数据库)、模型构建(机器学习)、编程实现(python)到可视化(ArcGIS)等一系列视频教程。
后台回复“纽约”获取美国纽约10年的出租车轨迹数据以及7年的共享单车轨迹数据下载地址。
公众号以交通大数据为主线,专注于人工智能、机器学习、深度学习在道路交通和轨道交通领域内的科研前沿与应用,在交通大数据与机器学习的道路上越走越远!