基于物理-虚拟协同图网络的客流预测

1.文章信息

本周阅读的论文是题目为《Physical-Virtual Collaboration Modeling for Intra- and Inter-Station Metro Ridership Prediction》的一篇2022年发表在IEEE Transactions On Intelligent Transportation Systems(TITS)的基于多时空图的地铁客流预测文章。

2.摘要

‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍

由于在实际场景中具有广泛应用,地铁客流预测在智能交通系统(ITS)中是一项重要且充满挑战性的任务。然而,传统模型要么忽略地铁网络的拓扑信息,要么直接学习物理拓扑性,均无法充分探索客流演变模式。为了解决这个问题,文章将地铁系统建模为具有多种拓扑结构的图,并提出了一个统一的物理-虚拟联合图网络(PVCGN),该网络可以有效地从定制图中学习复杂的乘车模式。具体来说,根据所研究地铁系统的现实拓扑结构直接构建物理连接图,在车站间客流相似性和相关性的指导下,通过虚拟拓扑构建相似图和关联图。这些互补图被合并到一个图卷积门控循环单元(GC-GRU)用于时空表示学习。另外,一个全连接门控循环单元(FC-GRU)被用于捕捉全局演化趋势。最后,作者建立了一个含有GC-GRU和FC-GRU的Seq2Seq模型预测未来地铁客流序列。两个大型地铁数据集(上海地铁和杭州地铁)上的实验表明该模型在车站级地铁客流量预测方面具有一定的优越性。此外作者将提出的PVCGN用于在线OD对预测,实验结果表明模型的普适性。

3.介绍

地铁是都市中一种高效、经济的出行方式,同时在居民的日常中扮演重要角色。庞大的地铁客流量给城市交通带来巨大的挑战,任何交通管理的疏忽都可能导致全市范围内的拥堵。为提高地铁系统的服务效率,一个基本的问题是如何准确预测每个车站的客流(进站或出站流),即站点级地铁客流量预测。由于其在交通调度和路径规划方面的潜在应用,该问题已成为智能交通系统领域(ITS)的热点研究课题。

早期研究中,通常将每个时间区间的原始交通状态数据转化为向量或者序列,并采用时间序列模型进行预测。然而,这种数据形式无法维护位置的空间信息和两个位置节点之间的拓扑连接信息。近年来,深度神经网络(例如LSTM或者GRU等)被广泛应用于城市级交通预测,这类工作通常以地理坐标为基础,将研究的城市划分为规则的网格地图,并将收集到的交通状态数据组织为2D或3D欧式张量,可以直接输入到卷积网络进行自动表示学习。然而,这种方式不适用于地铁系统,因为其拓扑结构是不规则的图形,其数据构架是非欧式的。虽然地铁系统的交易记录可视为网格图,但从网格图中学习乘客演变模式的效率很低,因为图结构非常稀疏,不能保持两个站点的连接信息。

通常来说,地图客流预测的挑战主要是如何有效建模地铁系统的非欧式结构并充分捕捉客流演化模式。虽然近年来出现的图卷积网络已被证明可以作为常见的方式进行非欧几里得的数据嵌入,如何在GCN中构造合理的图仍然是一个有待解决的问题,并且在不同任务的构造策略也不同。一些近期工作将GCN应用于交通预测,大部分都是直接基于所研究交通系统的物理拓扑关系建立地理信息图。然而,这类简单的构建策略对地铁客流预测而言是次优的,因为他只能学习相邻节点间的局部空间依赖性,无法充分捕捉地铁系统的客流模式。因此,除了物理拓扑关系,应该构建一些更合理的图,如下:

站间客流相似性:直观来看,如果位于不同区域的两个地铁站点具有相同的功能(如办公区),它们的客流演化模式可能相似。即使这些车站在现实世界中的地铁系统并不直接相连,但我们可以在GCN中利用GCN将它们进行相连,共同学习演化模式。

站间客流相关性:通常来说,两个站点间的客流是不均匀的,客流方向隐含表示了两个站点之间的相关性。例如,如果(Ⅰ)a站的大部分进站流流向站点b;或者(Ⅱ)站点a的出站流主要来自站点b,则认为站点a和站点b是高度相关的。这种情况下,同样可以将这些站点通过虚拟线连接起来以了解站点间的乘客互动情况。

基于上述讨论结果,文章提出了一个联合的物理-虚拟协同图网络(PVCGN)以一种端到端的形式实现未来地铁客流预测。为充分探究客流的演化模式,文章使用地铁物理拓扑信息和人类领域知识构建三种互补图。首先,根据所研究的地铁系统实际拓扑结构直接构建物理图;接着根据不同车站客流相似性和关联性分别构建带有虚拟拓扑信息的相似性图和关联性图。具体来说,两个站点间的相似性分数通过利用Dynamic Time Warping(DWT)计算两个站点间的翘曲距离来获得;而相关率则由客流历史OD分布决定。这些预先定义的图被整合输入图卷积门控循环单元以协同捕捉客流的演化模式。另外作者提出一个全连接门控循环单元以学习全局演化趋势的语义特征。最后,作者使用Seq2Seq模型依次预测下个时间段的地铁客流。为了验证PVCGN的有效性,作者在两个大规模数据集上进行实验(上海地铁和杭州地铁),评估结果表明模型在各种环境下比现有的先进模型表现更好。为了验证模型的普遍性,作者进一步研究PVCGN在线预测OD客流的效果,结果表明PVCGN在OD流预测的有效性。文章的主要贡献点如下:

  1. 作者提出了一个统一的物理-虚拟协作图网络(PVCGN)以解决站点级地铁客流预测。具体来讲,PVCGN将一个物理图、一个相似性图以及一个关联性图整合到图卷积门控循环单元以促进时空表征学习。

  2. 物理图是基于地铁系统实际拓扑关系建立的,而另外两个虚拟图则是根据人类领域知识所构建以充分探索客流的演化模式。

  3. 在两个真实地铁客流数据集上的实验表明,PVCGN在站点级客流预测方面全面由于目前存在的最先进的方法。

  4. 作为一个通用模型,PVCGN可以直接用于探索在线OD客流预测并且取得更优的预测效果。

4.模型

这篇文章作者提出了一个新兴的物理-虚拟协同图网络(PVCGN)用于站点级地铁客流预测。基于地铁系统的物理拓扑结构和人类领域知识,作者构建了一个物理图、一个相似性图以及一个关联性图,并将三者整合输入至图卷积门控循环单元(GC-GRU)用于局部时空表示学习。接着,一个全连接门控循环单元(FC-GRU)被用于学习全局演化特征。最后,作者提出了一个带有GC-GRU和FC-GRU的Seq2Seq框架预测每个地铁车站的客流。

首先定义客流预测的基本知识。第t个时间段第i个站点的客流数据定义为93bf6854e54049abe71ef364715074f1.png,两个值分别表示客流的进站流和出站流。整个地铁网络的客流可以表示为1d6f9a4a6654864f9b204aec2b202e48.png,其中N表示站点车站的数量。给定一个历史客流序列,客流预测的目标是预测未来时间段的客流序列:

256371f6a8465f4baee3445437f7ffd0.png

其中,n表示输入序列长度,m表示预测序列的长度。为了便于后期讨论,定义车站i整个历史客流数据为向量34e77c1381a77a0795bffa4eb7210639.png,其中T表示一个训练集中的时间步。

1)Physical-Virtual Graphs

该章节讨论了如何构建物理图和两个虚拟图。根据图定义,一张图主要由节点、边以及边的权值组成。在本论文中,物理图、相似性图以及相关性图分别定义为388ac9b1f7f42d7b3b6365c2a76dfad2.pngacb9baa55b72da44337344e138a0599c.pngc7cd0aeca368ef6db1a3dbcf1c31d265.png。V表示节点的集合50608f715b9791cd84db7a5b550cdc5d.png,每个节点表示一个真实世界的地铁车站。需要注意的是,这些图共享相同节点,但具有不同的边和边的权重。4b903e475eaab3848181ecd5f94ddbf3.png以及分别表示不同图的边集合。对于一个特定的图cfb377b38c6c2aedde36efc97e615876.pngbcb1f2d17d0e5d23ef904990a754eff1.png表示所有边的权重,具体来说,5b3df91e1be68907f430ef66a81381e5.png表示节点j到节点i的权重。

Physical Graph:是根据地铁系统的物理拓扑结构直接构建的。如果在真实世界中对应站点i和j是连通的,则在中形成一条边连接节点i和j。为计算边的权重,作者首先构建了物理连接矩阵a34ee63866419b493785dfa73e78e11c.png。如图1-(a,b)所示,如果节点间存在边则60b6685da1ceb78f5519d85919e50590.png;否则为0。为避免重复计算图的自环,对角元素直接设置为0,自环在最后的多图计算中计算一次即可。最后,边的权重通过线形行归一化获得,964a98686f6b7b2b024e5effbb1a3536.png具体计算如下:

41073d361dcf3c4ceb1a5ccac8bde7c9.png

Similarity Graph:地铁站点的相似性用于指导的构造。首先,作者通过计算每两个车站的客流相似性构造了一个相似性分数矩阵c5ff4ce592f78f8e654c402d59c49ff5.png。具体来说,站点i和站点j的分数92327af580baa29e792380ef6fb7335e.png由Dynamic Time Warping(DWT)计算得到:

873b68da528ded477f89317f039ed831.png

其中,DWT是一种衡量两个时间序列距离的常见算法。同样将对角线元素取值设为0。基于矩阵S,选择一些车站对建立边。这些选择策略是比较灵活的。例如,这些虚拟边可以通过预定义的相似度阈值所决定,或者选择top-k对具有高相似分数的车站对构建。最终,通过行归一化计算得到边的权重:

65a2aa498591b59299295c94384f70cf.png

其中,如果节点i和节点k存在一条边连接6b55ecf2b0ebd54779b3e45c105579fa.png,否则取值为0。一个相似性图的简单例子如图1-(d,e,f)所示,可以看出矩阵S是对称的,但矩阵是非对称的由于行归一化。

Correlation Graph:作者利用客流的OD分布构建虚拟图。首先,构建一个相关率矩阵cddeff43e9d9fbb2955b6d8d411fe0fd.png,具体计算如下:

68b0a9585312c4011a105fbb73e8cb9d.png

其中,2943df637a302c96f536960ac8940975.png表示在整个训练集中由站点j到站点i的客流总数。值得注意的是,对角线元素03ce36995c08c60bf40ef6210173ec5f.png在该图中是可以计算的,因为仅有少数乘客会在同个站点进出站。文章使用与相似性矩阵计算过程中一致的选择策略以选择部分车站对构建边。最终,边权重计算如下式。图1-(d,e,f)为相关性图,可以看出是一个有向图,因为673cf34f35d31bddb77ca500813e71e8.png

4ea9cc0ee9d4f65bf3b2ba1e8ce82acc.png

基于物理-虚拟协同图网络的客流预测_第1张图片

2) Graph Convolution Gated Recurrent Unit

作为LSTM的变体,门控循环单元(GRU)被广泛应用于时间建模,通常通过标准卷积或全连接实现。文章整合了物理-虚拟图以提出一个统一的图卷积门控循环单元(GC-GRU)用于时空特征学习。

文章首先使用卷积操作处理提出的物理-虚拟图。假设图卷积的输入为660f819856ac34232073a156a00f685e.png,其中可以为客流数据或者其特征。图卷积的参数可以定义为。通过定义卷积,输出特征d8ba0e1bc601cadf6e5ab6c1e4826f95.png由以下部分组成:

基于物理-虚拟协同图网络的客流预测_第2张图片

其中,表示Hadamard乘积而0a5e5fa884754f74e4fe75f1c7d2a75c.png。具体来说,6ec1b04e5113b7830726970ced541c1b.png表示所有图的自环,是可学习参数。表示物理图的参数,08c7f7bb04dbf7eb2d3d6d726093cb83.png表示节点i的邻接节点集。其他参数5d7754bfb7130532e6dfdd1f8a32bcaf.png具有相似的语义信息。D是特征81aceb359acc23c5f79b0ac63cf147ce.png的维度。在这种方式下,节点可以动态地接收一些高关联性节点的信息。为方便起见,图卷积在接下来的内容中可以简短表示为1e3a6211955412ff4d679b074a921b5f.png

由于上述提到的操作是从空间角度进行的,作者将物理-虚拟图卷积嵌入到门控循环单元(GRU)中以学习时空特征。具体而言,重置门为103550413fa74234292d7a7dbd23edf2.png,更新门为1b990d480798739a25f021de6d50c34c.png,新的信息为,隐藏状态为2aadc147b16377a899639a3e6397b5f5.png,分别可以由以下公式计算得到:

基于物理-虚拟协同图网络的客流预测_第3张图片

其中表示Sigmoid激活函数,表示上一次迭代的隐藏状态。表示 和之间得图卷积参数,表示 和之间的图卷积参数。其他参数88ce0b57465f911c09755e6d01b74b15.png有相同的含义,8694c3ba45fd35e3a057bc69cc322fb6.png表示偏差。特征1f5007bf25cbeecd927a5e0859a7e95e.png的维度同样设置为d。为方便起见,将GC-GRU的公式记为如下。由于GC-GRU,模型可以从地铁客流数据中有效学习到时空特征。

b1e0c2eac34f841418c44ee1fb1dca2e.png

3) Local-Global Feature Fusion

先前的工作中,全局特征被证明对于交通状态预测同样有用。然而提出的GC-GRU在局部空间上采用卷积操作,无法捕捉全局信息。为了解决这个问题,作者提出了全连接的门控循环单元(FC-GRU)以学习所有车站的全局演化特征并通过融合GC-GRU和FC-GRU的输出得到一个全面的特征。提出的融合模块被称为协作门控循环模块(CGRM),其框架图如下:

基于物理-虚拟协同图网络的客流预测_第4张图片

具体而言,CGRM的输入为和,其中为最后一次迭代的输出。对于GC-GRU而言,使用的累积信息更新隐藏状态,因此GC-GRU的计算过程可以调整为:

5e17d8321073bb90b0fd2a24885eae47.png

对于FC-GRU而言,首先将61c1fff9b4447980b85d15ef6378a08c.png通过两个全连接层转化为嵌入78a1dad983240c0dd05b04326b8cdcdf.png。接着将其放入带有全连接的GRU中以生成全局隐藏状态18da826159bf8f7a91c362837cc1e2f8.png,该过程可以表示为:

57658e831302362f9b2cc8199a041c77.png

最终,通过全连接层整合834bf749afa60f88ef5cbea42f59ab19.png以生成全面的隐藏状态68120864af724120e9e42c70a2f98b66.png

69feb03b0a85f1be32c119576e4bf6b0.png

其中表示特征拼接操作。包含客流的局部和全局信息。

4)Physical-Virtual Collaboration Graph Network

该章节作者采用上述提到的CGRUs搭建一个物理-虚拟联合图网络(PVCGN)用于地铁站点级客流预测,并采用Seq2Seq框架搭建模型,如图2所示。具体来说,PVCGN有一个encoder和一个decoder组成,均包含两个CGRMs。在Encoder中,客流数据1adffec1f5435b1352d2889b784993c1.png依次输入至CGRMs以累积历史客流信息。在第i次迭代,最底部的CGRM将6e1f11b3a9d87df9ad1c568be69ae2a2.png作为输入,其输出的隐藏状态输入至顶部的CGRM以学习更高维度的特征,所有CGRMs的初始隐藏状态在第一次迭代时设为0。在Decoder中,第一次迭代,输入数据同样设置为0,encoder中最后的隐藏状态用于初始化decoder的隐藏状态。未来客流预测通过将上述CGRM输出的隐藏状态输入到全连接层实现。在第i次迭代,底层CGRM将eb2147e37bacce741bddb47944dd77bc.png作为输入数据,上层CGRM使用全连接层预测得到。最终得到未来客流序列e1c11f72f5a9559681ec3385bc976252.png

基于物理-虚拟协同图网络的客流预测_第5张图片

5.实验分析

文章在两个真实世界数据集SHMetro和HZMetro上验证模型预测效果。

(1) Datasets and Experiment Settings

SHMetro:该数据集基于上海地铁系统构建,一共包含811.8万条交易记录,从2016年7月1日至2016年9月30日,每日客流大概为8.82万人次。每条记录包含客流ID信息,进出车站以及相关时间戳。在该时段上,一共包含288个地铁车站,通过958条边相连接。对于每个车站,作者以15分钟为时间粒度统计进出站客流。前两个月的客流数据和最后三个星期的客流数据分别用于训练和测试,剩下的客流数据则用于验证。

HZMetro:包含2019年1月1日到1月25日,杭州地铁80个站点的客流数据。一共包含80个正常运营的车站以及248条物理边,该地铁系统每日客流为2.35万人次。时间粒度同样设置为15分钟。与SHMetro数据集相似,该数据集分为三个部分,训练集包括1月1日到1月18日;验证集包括1月19日到1月20日;测试集为1月21日到1月25日。

基于物理-虚拟协同图网络的客流预测_第6张图片

Implementation Details:由于物理图具有明确的拓扑信息,仅需要介绍另外两种虚拟图的细节。在SHMetro数据集中,为减少GCN的计算消耗,对于每个车站,仅选择10个具有高相似性分数或关联率的车站构建虚拟图,因此相似性图和关联性图均具有2880条边。在HZMetro数据集中,由于其地铁站点数远低于SHMetro,并且其计算消耗并不大,因此可以构建更多的虚拟边以学习更复杂的客流模式。具体来说,作者分别设置相似性分数阈值和关联性阈值为0.1/0.02,最终相似性图和关联性图分别有2502条和1094条边。

(2) Evaluation Metrics and Baslines

文章根据MAE、MAPE和RMSE来评估STTN和其他基线模型的预测性能。基线模型主要为Historical Average(HA)、Random Forest(RF)、Gradient Boosting Decision Trees(GBDT)、Multiple Layer Perceptron(MLP)、Long Short-Term Memory(LSTM)、Gated Recurrent Unit(GRU)、Attention Based Spatial-Temporal Graph Convolution Networks(ASTGCN)、Spatial-temporal Graph to Sequence Model(STG2Seq)、Diffusion Convolution Recurrent Neural Network(DCRNN)、Graph Convolution Recurrent Neural Network(GCRNN)以及Graph WaveNet(GWN)。

(3) Comparison on the Whole Testing Sets

文章首先在测试集上比较所有模型的预测性能(包括不同时间粒度和不同车站),在SHMetro和HZMetro两个数据集上的表现总结如表Ⅱ和表Ⅲ。可以看出,基线模型HA在所有时间粒度下取得了最差的MAPE指标(在SHMetro上为31%以及在HZMetro上为20%)。与HA相比较,RF和GBDT在时间粒度较小的预测中取得更好的预测结果。然而随着时间粒度增大,这两个模型的MAPE指标逐渐变差,甚至大于HA的MAPE指标,这是因为这两个传统模型学习客流分布的能力较差。通过从数据中自动学习深度特征,常见的神经网络(MLP,LSTM以及GRU)可以显著提升预测效果。例如,在15分钟时间粒度下的预测中,LSTM分别在SHMetro数据集上的MAPE取值为18.76%,在HZMetro数据集上的MAPE取值为14.91%;而GRU在60分钟时间粒度下的预测中,在SHMetro和HZMetro数据集上分别取得 21.03%和17.20%的MAPE。受益于图学习的优点,DCRNN和GCRNN取得了更好的预测表现,SHMetro数据集上的MAPE下降到17.82%,HZMetro数据集下降到14.00%。然而这些方法都是基于物理拓扑结构直接构建图结构。为了充分捕捉客流的复杂模式,PVCGN根据物理拓扑结构和人类领域知识构造了物理/虚拟图,因此实现最优的预测性能。例如,PVCGN在SHMetro数据集的不同时间粒度上,MAPE均提升了至少1%。在HZMetro数据集上,PVCGN的表现优于基准模型中表现最好的模型DCRNN、GCRNN和GWN,在所有指标上都具有较大优势,这充分解释了PVCGN的优越性。

3e4a5ce60153d37fba0da112a5a7ab0e.png

基于物理-虚拟协同图网络的客流预测_第7张图片

(4) Comparison on Rush Hours

由于精确的预测效果对地铁高峰小时的排班非常重要,本节内容研究高峰小时的客流预测效果。文章定义高峰小时为7:30-9:30和17:30-19:30.所有模型的预测效果如表四和表五所示。可以看出,PVCGN在两个数据集中的表现均优于其他基准模型。在SHMetro数据集,PVCGN在15分钟粒度下的客流预测指标MAPE为13.16%,而DCRNN和GCRNN的MAPE分别为13.93%和14.07%。其他深度学习模型(例如MLP、LSTM和GRU)表现最差。在60分钟时间粒度的情况下,PVCGN的MAPE为15.08%,表现相较于DCRNN和GCRNN至少提升9.04%。

在HZMetro数据集上,模型也存在类似的预测性能情况。例如,在15分钟时间粒度下,PVCGN的MAPE为9.72%,毫无疑问优于DCRNN和GCRNN,二者的MAPE分别为10.37%和10.36%。当预测60分钟时间粒度下的客流时,PVCGN取得了10.43%的MAPE指标,而DCRNN和GCRNN的预测性能严重退化。总而言之,在SHMetro和HZMetro数据集上的大量实验验证了模型在高峰时段的有效性和鲁棒性。

基于物理-虚拟协同图网络的客流预测_第8张图片

基于物理-虚拟协同图网络的客流预测_第9张图片

(5) Comparison on High-Ridership Station

除了高峰时段预测,文章同样关注具有大客流车站的预测效果,因为这类车站的需求通常需要优先满足。在该章节中,作者基于训练集中所有地铁车站的历史客流对车站进行排序,选取了客流量最大的前1/4的车站进行预测。SHMetro数据集的预测性能如表6所示,可以看出PVCGN在所有模型中预测性能最优。当预测未来15分钟的客流时,PVCGN的RMSE为74.80,MAPE为10.62%。相比之下,其他基准模型中表现最好的指标分别是RMSE为80.72,MAPE为12.23%。在60分钟时间粒度的情况下,PVCGN 仍然取得了最佳预测效果,MAPE为13.61%。

如表7显示,PVCGN在HZMetro也取得了良好的预测效果。在15分钟时间粒度下,PVCGN的RMSE和MAPE分别为60.56和9.97%,而基准模型中表现最好的模型GCRNN的RMSE和MAPE分别为65.29和10.59%。在60分钟时间粒度的情况下,PVCGN的预测性能出现较小的退化。例如,其RMSE和MAPE分别增长至69.25和12.54%。相同情况出现在GCRNN模型上,分别增长至80.34和14.74%。因此,可以推断PVCGN在预测大客流量车站的客流时具有良好的有效性和鲁棒性。

基于物理-虚拟协同图网络的客流预测_第10张图片

基于物理-虚拟协同图网络的客流预测_第11张图片

(6) Efficiency Comparison

作者比较了五种深度学习模型的学习效率。需要注意的是所有模型在型号相同的GPU上训练,其运行时间如表八所示。可以看出LSTM和GRU是最有效率的模型,而GCRNN和DCRNN平均每次迭代消耗0.0121~0.0156秒。虽然PVCGN需要处理三个图,仍然取得可观的训练效率。总而言之,所有模型均可以实现实时预测,学习效率不是这个任务的瓶颈。

基于物理-虚拟协同图网络的客流预测_第12张图片

(7) Component Analysis

Effectiveness of Different Graphs文章的创新点之一是将一个物理图和两个虚拟图整合至门控循环单元(GRU)以协同捕捉复杂客流模式。为了验证每个图的有效性,作者提出PVCGN的五种变体,分别如下:

P-Net:该模型仅使用物理图实现客流预测;

P+S-Net:该模型利用了物理图和虚拟相似性图以实现客流预测;

P+C-Net:与P+S-Net相似,该模型基于物理图和关联性图搭建;

S+C-Net:与上述模型加入了物理图不同,该模型仅考虑了两种虚拟图(相似性图/关联性图);

P+S+C-Net:该模型为文章提出的PVCGN模型,同时利用了物理图和两种虚拟图。

所有变体模型的预测效果如表9所示。为了预测下一个时间段(15分钟)的客流,基准模型P-Net在SHMetro数据集上的预测指标MAPE为19.04%,在HZMetro数据集上的预测指标MAPE为14.84%,在所有变体中的预测效果最差。整合了物理图和任意一个虚拟图的模型中,P+S-Net和P+C-Net在所有预测指标中取得了显著提升。例如,P+S-Net在SHMetro数据集的预测指标RMSE由50.45下降至47.38,在HZMetro数据集的预测指标RMSE由41.80下降至38.89.另外,含有两个虚拟图的模型同样取得良好的预测效果,即使没有包含物理图。最后,P+S+C-Net通过整合了物理图和所有虚拟图而取得最好的预测效果,这是由于物理/虚拟图网络学习到的增强时空表示。这些比较充分说明了预定义图在单个时间粒度预测下的有效性。

基于物理-虚拟协同图网络的客流预测_第13张图片

Influence of Local and Global Feature:如前文所述,图卷积门控循环单元(GC-GRU)可用于局部特征学习,而全连接门控循环单元(FC-GRU)则用于学习全局特征。该章节文章训练了两种变体以研究每种特征对于客流预测的影响。第一种变体模型仅包含GC-GRU,第二种包含GC-GRU和FC-GRU。预测结果表总结如表十,可以看出第一种变体模型的预测效果良好,其原因是通过预定义的物理/虚拟图可以有效学习客流的局部特征。第二种变体模型通过融合GC-GRU以及FC-GRU的局部和全局特征,在一定程度提升了预测性能。这些实验表明局部特征在客流预测中起到主导作用,全局特征则为客流预测提供辅助信息。

0cee8ca0b111b026ddac3e7a1bebd2e2.png

Stability Verification该部分研究PVCGN的稳定性。除了前文对模型的充分评估,作者实现了另外四种形式的PVCGN,因为一些随机参数(参数初始化、样本打乱)可能会影响最后结果。由于篇幅有限,作者在补充材料中对模型的详细性能进行介绍,感兴趣的读者可以自行查看。表11总结了所有模型的平均值和标准差,可以看出所有模型的平均性能非常接近,标准差非常小。另外,PVCGN中表现最差的模型仍然比其他模型表现效果好,表明PVCGN的预测性能是稳定的。

基于物理-虚拟协同图网络的客流预测_第14张图片

(8) Apply To Online Origin-Destination Prediction

该章节作者研究了PVCGN在SHMetro数据集的在线OD客流预测。与出租车OD需求预测相比,地铁OD流预测更具有挑战性,因为完整的OD分布无法立刻从在线地铁系统中获得。例如图4,共有385名乘客在过去15分钟进入第i个车站,其中有244名已经到达他们的目的地,其余乘客的目的地是不确定的。因此,作者仅可以基于已完成的OD出行对构建一个不完整的车站i的OD向量。由于OD分布非常稀疏,作者仅考虑从站点i到乘客最有可能到达的前十个站点的客流量,以及其他车站的总客流量,所以OD向量的长度为11。具体来说,268e465cb800efb738fc0846b5342018.png表示第j个最相关车站的客流,而dec9a48a5a9ffd3da9fb7dbb1a3b153f.png表示剩余车站的客流。为了方便描述,在时间段t所有车站不完整的OD客流表示为322d7f85ae7ec1aa623024f94a121121.png。给定一个历史不完整OD客流序列,作者的目标是预测未来完整OD客流序列:

e07ef7f7b3998b95f16bae6f6ed07fb0.png

其中,1fdcafc633281c5dcfef00103edd658f.png表示车站i的预测OD客流,序列长度n和m分别设为4。在评估MAPE时,作者进一步将一些实际客流量低于10的OD对筛选除去,因为MAPE对于小客流比较敏感并且对于小客流场景并无需过多重视。

文章比较了PVCGN与一个基线模型和四个深度学习模型的在线OD流预测。如表12所示,PVCGN在所有时间粒上取得了最佳的表现,远优于其他模型的预测效果。这是因为PVCGN可以从物理图和虚拟图中有效学习OD模式。实验表明PVCGN用于在线OD客流预测的普适性。

6.结论

在这篇文章中,作者提出了一个统一的物理-虚拟联合图网络以解决站点级地铁客流预测。与先前工作中要么忽略地铁系统拓扑信息要么根据物理拓扑直接建模不同,文章构建了一个物理图和两个虚拟相似性/关联性图以充分捕捉客流演化模式。具体来说,物理图是基于地铁实际拓扑结构构建的,相似性图和关联性图则是根据不同车站历史客流间的相似性和关联性构建的。模型将这些图整合输入至图卷积门控循环单元(GC-GRU)以学习时空表征,并使用一个全连接门控循环单元(FC-GRU)以捕捉全局演化趋势。最后使用GRUs构建了一个Seq2Seq模型用于预测每个车站的客流。为验证模型的有效性,作者在两个真实世界地铁数据集(SHMetro和HZMetro)上进行大量实验,实验结果表明了PVCGN的优越性。

在未来的工作中,可以继续研究在线OD流预测,存在以下一些提升值得考虑。首先,OD流预测中不完整的OD对数据同样可以提供一些有用的信息,可以尝试估计潜在的OD分布。其次,地铁客流分布具有周期性,可以利用OD流的周期性分布促进表征学习。另外一些额外因素(例如天气和假期事件等)可能对客流分布存在潜在影响,因此可以整合这些因素以动态预测客流。

Attention

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

你可能感兴趣的:(大数据,算法,编程语言,python,计算机视觉)