1.文章信息
《Metro Passenger Flow Prediction via Dynamic Hypergraph Convolution Networks》,这是今年4月发表在 IEEE Transactions on Intelligent Transportation Systems 上的一篇文章。
2.摘要
地铁客流预测是智能交通系统中缓解交通压力、协调运营时间、规划未来建设的战略性需求。基于图的神经网络在交通流预测问题中得到了广泛的应用。图卷积神经网络(GCN)根据已建立的连接捕获空间特征,但忽略了车站与乘客出行模式之间的高阶关系。文章利用一种新的表示方法来处理这个问题-超图,提出了一种用于客流预测的动态时空超图神经网络。在预测框架中,利用地铁系统拓扑结构构造初级超图,然后利用从多时段行人出行模式中发现的高级超边对初级超图进行扩展。在此基础上,提出了基于超图卷积和时空块的时空特征提取算法,实现了节点级预测。在北京和杭州的历史数据集上进行的实验验证了该方法的有效性,并取得了比现有方法更高的预测精度。
3.介绍
文章提出了一种新的数据表示结构——超图,代替了现有流量预测算法中的数据建模方法。超图是传统图的一般化,表示具有超边的顶点之间的非配对关系。因此,超图可以模拟高阶数据之间的内在关系。对于道路交通流预测的基于图的神经网络模型,明确了每个边连接两个节点。然而,地铁车站之间的连接比点对点的连接带有更多的信息,因为所有的连接都属于相应的地铁线路。这些线路在时间间隔、运行时间和车辆数量方面彼此不同。举例来说,北京机场特快两班车之间的时间大约是30分钟。而10号线的时间间隔是5分钟左右。传统图的边仅限于成对关系,不能携带高阶信息。然而,超图可以用超边来模拟它,如下图所示。此外,文章还设计了一个动态机制,利用超图的可扩展性来描述旅客的不同出行模式。利用地铁的拓扑结构构造主超图,并从乘客的出行路径中提取高级超图。为了动态地处理地铁流量预测问题,将这两种超边结合起来。这种机制可以动态地结合空间和时间特征,以实现更准确的流量预测。
文章的贡献有以下三点:
(1)提出了一种新的轨道交通数据超图表示方法。该方法充分考虑了地铁的特殊结构和乘客出行方式,建立了初始超图和高级超边。文章提出的超图表示不仅描述了高阶拓扑关系,而且模拟了旅客的动态出行模式。
(2)提出了一种用于轨道交通流量预测的多层时空超图神经网络。通过图的卷积运算和超图学习,得到了超图的谱卷积。然后将具有超图卷积层和时间卷积层的时空块进行叠加,建立流量预测框架。
(3)在北京和杭州历史全尺度地铁流量数据集上进行了大量的实验研究。对比实验包括全时、高峰期和异常情况。完成了消融实验和时间消耗实验。通过与现有基线的比较,验证了该模型的实用性和有效性。
4.方法
该方法的基本思想是首先通过超图表示对地铁客流预测问题进行建模。超图谱卷积是从超图学习理论中推导出来的。利用动态机制设计了超图神经网络框架,实现了节点级客流预测。
(1)总体框架
客流预测的目标是是根据以往从某些观测地点收集到的数据,估计未来某个时间的流量。该论文的客流预测问题描述如下:
通常,超图表示用基于特征的方法或基于结构的方法对问题进行建模。基于特征的方法通过聚类特征挖掘顶点之间的相关性来构造超边。基于结构的方法利用数据集本身固有的拓扑结构。只使用其中一种方法可以简化原有的结构信息,但是文章将这两种方法结合起来,丰富了超图表示的内涵。
此外,动态机制的灵感来自乘客的出行模式。通勤者在工作日往返于工作场所和他们的住所。当旅客数量达到一定规模时,相应的站点之间将存在强烈的动态相关性。
文章设计了动态时空超图卷积网络(DSTHGCN)。下图演示了所提出模型的结构。如框架所示,原始输入数据包括地铁流量数据和轨道网络结构。首先根据原始输入数据建立动态超图。然后,将超图的拉普拉斯矩阵和地铁流量数据输入到STHGCN中,其中包含超图的卷积层和时间卷积层,以获取超图中每个顶点的光谱和时间特征。最后,融合三个时间跨度的预测,输出预测结果。
(2)超图构造
超图的定义:对图进行推广,其中超边可以表示为某些顶点的集合。超图具有顶点集合,超边集合以及权重,超图表示如下:
关联矩阵为:
对于超图中的顶点 υ ∈ v,度被定义为所有连接到顶点 υ 的超边权 ω (e)的总和:
超边的度数定义为由它连接的顶点数:
本文将超图的构造分为主超图的构造和高级超图的构造两个步骤。
主超图用来表示城市轨道交通网络的基本拓扑结构,超图中的顶点为地铁站,超图中的超边根据地铁线路建立,同一轨道线路上的车站具有相同的特点,因此得到主超图:
高级超图旨在获取乘客 OD 模式背后的更多空间信息。OD 是origin-destination 的缩写,通常在过境中用于确定一段时间内的出行模式。由于乘客的出行方式随时间不断动态变化,因此他们的 OD 也随之变化。因此文章提出了一种具有不同超图的动态机制来捕获更多的时间特征,如图 3 所示。
首先分析整个地铁网络的客流信息,生成不同时间跨度的OD矩阵,并使用热力图来可视化 OD 矩阵并挖掘内部模式。地图上热值高的区域说明相关车站客流量大。低热值说明车站的客流量较小。通过对热力图的分析,不同时间跨度的出行OD揭示了同期大部分人的出行轨迹,即大部分乘客进入哪些站点,然后从哪些站点出站。根据这些信息,通过聚类算法 DBSCAN 构造高级超边 Eh。使用 DBSCAN 的主要原因是可以有效处理噪声点并找到任意形状的空间簇。与其他一些聚类方法(如 K-Means)相比,无需预设聚类数。
(3)超图卷积
介绍了利用基于图形的神经网络来预测地铁流量。然而,图卷积不能直接应用于超图。超图谱卷积是由超图学习理论和传统的图卷积推导而来的。归一化超图割的谱超图分割问题是超图理论中的一个基本问题。在超图划分问题的研究中,提出了超图拉普拉斯算子,为超图学习提供了一个桥梁。文章该部分为超图卷积理论的介绍,公式居多,不再进行详细描述。
(4)动态时空超图神经网络
在推导出谱超图卷积之后,构造时间卷积层以捕获时间维度的客流特征并组成时空卷积块,这是整个模型的主体部分。模型框架下图所示。网络的输入是三个不同时间跨度的重归一化超图拉普拉斯算子和地铁客流的训练数据集。模型主要是由超图卷积层和时间卷积层组成的时空块。时空块的输出是节点级别的预测,最后将其融合,输出每个站点的预测结果。
时空块由两个时间卷积层和一个光谱超图卷积层组成。光谱超图卷积层提取空间特征,能够很好的描述地铁拓扑结构。时间卷积层旨在提取特征用来描述客流沿时间轴的变化。时间卷积层在每个顶点上采用并行的自适应剩余门控线性单元(GLU)。对于输入y = [y1, y2,…,yt],算法首先对输入同时进行两个一维卷积运算。这两个卷积操作在格式上是相同的,但是权值是不同的。在卷积之后,一个结果将被sigmoid函数激活,而另一个结果不被激活。这个方程可以表示为:
用扩展卷积代替普通的一维卷积,使模型能够捕捉到长距离的特征。由于第一个卷积不被激活,因此门控结构可以处理梯度消失的问题。由于输入和输出的维度相同,残差结构可以集成到单元中,如下图所示,然后信息可以通过多个通道传输。
时间卷积表示为:
时空卷积块由空间层和时间层组成,可以描述为状态更新公式:
节点级预测结果将通过一个全连接层输出,将多通道映射为单个通道。然后将三个不同时间跨度的结果与权重融合。训练超图神经网络的过程也是训练融合权重的过程:
因此,模型的最终损失函数可以表示为:
5.实验
对北京和杭州的历史全尺度地铁流量数据集进行了实验研究。首先介绍数据集的细节。首先进行了全天候实验,并与现有基线进行了比较,对模型进行了整体评价,验证了模型的实用性和有效性。然后重点介绍了对当前智能交通系统最具有指导意义和实际应用价值的峰值和平峰期的实验。通过消融实验来评价所提出的骨架的各个组成部分。异常情况下的实验和时间消耗实验表明了该方法的可行性。
Attention
如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!