1 导读
本论文于2022年发表于人工智能顶刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》。文章对两种特定类型的跨站客流类型,即OD流和DO流展开研究,利用历史客流的异质信息联合学习OD流和DO流的演化模式,同时提出一个对偶信息Transformer模型建模OD-DO的因果关联性,最终实现未来OD和DO流的同步预测。在两个大规模的地铁数据集上的实验充分验证了模型的有效性。
文章信息
作者:Lingbo Liu, Yuying Zhu, Guanbin Li, Ziyi Wu
标题:Online Metro Origin-Destination Prediction via Heterogeneous Information Aggregation
文献来源:IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022.
2 摘要
地铁OD流预测是智能交通系统中一项重要同时充满挑战性的时间序列分析任务,旨在精确预测两种特殊的跨站客流,即OD流和DO流。然而,前一时刻的完整OD矩阵无法在在线地铁系统中实时获得,传统预测模型只能利用有限的信息分别预测未来OD流和DO流。在这篇文章中,我们提出了一个全新的神经网络模块-异质信息聚合机(HIAM),用于充分挖掘历史数据的异质信息(不完整的OD矩阵,未完成的出行向量以及DO矩阵)以联合学习OD流和DO流的演化模式。具体而言,OD建模分支用于估计未完成出行的潜在目的地以补充不完整的OD矩阵信息;DO建模分支将DO矩阵作为输入以捕捉DO流的时空分布。另外,作者提出对偶信息Transformer模型传递OD特征和DO特征的信息用以建模OD-DO的因果性和相关性。基于提出的HIAM,作者提出一个统一的Seq2Seq网络实现未来OD流和DO流的同步预测。文章在两个大规模地铁数据集上进行大量实验以验证模型在实时地铁OD预测上的有效性。
3 介绍
时间序列预测是人工智能领域最活跃的研究课题之一。这篇文章中,我们关注其在交通管理中的实际应用,例如,提高城市地铁系统的运营效率。巨大的地铁客流量为地铁运营带来巨大挑战,这种情况下,准确预测未来的客流量对于地铁调度和线路规划至关重要。
由于地铁客流预测的重要应用,近年来已引起学术界和工业界的广泛关注。然而大多数传统工作针对站点级预测,即地铁车站的进/出站客流预测,如图1-(b,c)所示。这类进/出站流的信息过于粗糙无法准确反映客流的流动性。为了挖掘更多有价值的信息用于地铁优化,我们专注于一项更具有挑战性的任务,即地铁OD流预测,其目标是预测未来几个时间段任意两个车站间的客流量。具体来说,文章考虑了两种特殊类型的站间客流:
OD流:对于每个车站,我们旨在预测未来时间段的进站客流量和即将前往的车站。例如,时间段的OD流可以表示为一个矩阵,其中车站数。更具体来说,表示在时间段内由站点到站点的客流量,如图1-(d)。
DO流:文章还旨在预测未来每个车站的出站客流量以及这些乘客的出发地。相似地,DO流在时间段可以表示为一个矩阵,如图1-(e)。具体来说,在时间段进入车站前往车站的乘客数量。
图1 OD流和DO流区别
直观来说,文章利用历史OD/DO流预测未来的OD/DO流。然而,在在线地铁系统中,完整的历史OD矩阵无法实时构建。图2为一个显著的例子。假设有228个乘客在过去15分钟内进入站点,且目前为止有136个乘客到达目的地。然而,其他乘客的目的地是未知的,直到他们到达出站站点。这种情况下,只能根据已完成的行程构造一个不完全OD矩阵。当大部分乘客仍然在前往目的地的路上时,这种不完全矩阵是非常稀疏的,包含的信息量及其有限,这增加了建模OD流分布的难度。
图2 不完全矩阵
目前仅有少量模型被提出用于在线地铁OD流预测。传统研究要么以不完整的OD矩阵作为输入,要么直接使用DO矩阵预测未来的OD矩阵,主要存在以下缺陷。首先,这些研究没有挖掘未完成出行的信息。实际上,人们的出行具有周期性,我们可以在某种程度上估计这些未完成出行的潜在目的地,从而获得更有价值的信息用于OD预测;其次使用历史DO信息粗略预测未来的OD矩阵是次优的,因为前者并不是影响后者演化的关键要素;第三点,目前现有的方法并没有意识到OD流和DO流之间的交互信息,即分别对OD流和DO流展开预测。实际上,先前的OD流会显著影响未来的DO流,在本文中这被称为OD-DO的因果性。另外,过去的DO流同样与未来的OD流存在关联。例如,住宅区和办公区的潮汐车站间的DO流和OD流存在一个负相关关系,称之为DO-OD关联性。总的来说,先前的研究方法仅挖掘了有限的信息,无法有效的建模地铁客流的分布。
为了解决上述问题,文章提出了一个统一的神经网络模块异质信息聚合机(HIAM),可以充分聚合历史客流的异质信息以学习未来OD流的演化趋势。具体来说,HIAM由以下部分组成:两个用于建模OD流和DO流的并行分支以及用于建模OD-DO交互信息的对偶信息Transformer。不同于现有研究中忽略了未完成的出行记录,文章从这些未完成出行中挖掘信息以补充不完整的OD矩阵。具体来说,OD分支用于挖掘长短时历史目的地的分布以估计正在出行乘客的潜在目的地矩阵,将该矩阵与不完整的OD矩阵整合输入至图卷积门控循环单元(GCGRU)以生成一个紧凑的OD隐藏状态。同时,DO分支将相关的DO矩阵输入至图卷积门控循环单元以生成DO隐藏状态。为了建模OD流和DO流的内在相互作用,作者使用对偶信息Transformer以对偶形式传播OD状态和DO状态的互补信息从而增强它们。这些增强的隐藏状态分别输入至GCGRU中用于高阶时空表示的学习。基于提出的HIAM,作者设计了一个统一的在线地铁OD流预测框架,以联合预测未来几个时间步的OD流和DO流。最终,作者在两个大规模数据集上(上海地铁和杭州地铁)进行大量实验,实验结果表明文章提出的模型在OD流预测和DO流预测上均优于现有的模型方法。文章的主要贡献如下:
文章提出了一种新的异构信息聚合机(HIAM)用于在线地铁OD流预测,该模块充分利用了不完整OD矩阵、未完成出行信息以及DO矩阵等异质信息以预测未来站点间的客流。
为充分挖掘未完成出行的信息,HIAM挖掘了长短时历史分布以估计未完成出行乘客的潜在目的地,进一步补充不完整OD矩阵的信息。
文章引入对偶信息Transformer以传播OD特征和DO特征间的交互信息,从而更好建模OD流和DO流的相互作用。这是第一次尝试应用异质Transformer解决时间序列预测问题。
在两个大规模数据集上进行的大量实验表明,该方法对在线地铁系统的OD客流量预测和DO客流量预测都是有效的。
4 预备知识
这个章节简要介绍了在地铁OD流预测中一些主要的符号和定义,具体如表1所示。
表1 符号定义
1)交易数据:在在线地铁系统中,随着时间的推移,会有大量的旅行交易。对于每个完成的交易记录,我们可以了解到其进出车站以及对应的时间戳。然而,对于正在进行的交易,只有进站站点和进站时间是可知的。
2)矩阵压缩预处理:值得注意的是一些车站间的客流通常很小甚至为0,因此本文仅考虑具有较高客流的OD对。具体来说,对于每个起始站点,作者衡量进站乘客的目的地分布,然后选择目的地概率最高的前个车站. 所以,我们可以生成一个OD映射矩阵,其中是地铁车站的数量。更具体来说,对于起始站点,表示第个客流量高的站点的索引。另外,,表示剩余目的地站点的索引。作者以相同的方式生成一个DO映射矩阵,其中表示与目的站点第相关的起始站点索引。在这篇文章中,这些映射矩阵用于指导OD和DO矩阵的压缩。
3)压缩OD/DO矩阵生成:在时间段,我们衡量了各种类型交易的数量以生成下列的向量和矩阵。
(1)不完整的OD矩阵:具体来说,表示在时间段进入车站,然后从站点出去的乘客数量,其中。另外,表示由站点进入,并且由剩余车站离开的客流总人数。
(2)未完成订单向量:该向量用于记录正在出行订单的信息。具体来说,表示在时间段进入车站但还没有到达目的地的乘客数量。这类信息在先前相关研究中尚未被挖掘。
(3)完整OD矩阵:与矩阵不同,这个矩阵记录了完整OD客流,通常作为研究的预测目标。具体来说,表示在时间段进入车站,并且会从站点出去的客流。
(4)DO矩阵:该矩阵表示在时间段完成的DO矩阵。具体来说,表示在稍早的时间段内进入站点,且在时间段离开站点的客流量。
定义1(在线地铁OD流预测):假设当前时间段为,我们旨在利用过去个时间步的历史客流信息预测未来个时间步的完整OD流和DO流:
5 模型
在该研究中,作者提出一个统一的神经网络模块,即异质信息聚合机(HIAM),可以充分捕捉多种信息(如不完全OD流,未完成订单信息,DO流)以有效建模地铁OD分布。如图3所示,HIAM由OD建模分支、DO建模分支以及对偶信息Transformer组成。具体来说,OD分支将不完全OD矩阵和两个由未完成出行所获得的估计目的地矩阵输入至图卷积门控循环网络中学习压缩的OD隐藏状态,用以记录OD演化模式;同时,DO分支将相关DO矩阵作为输入以生成DO隐藏状态,用以记录DO演化模式。接着,对偶信息Transformer通过挖掘OD状态和DO状态的交互信息实现OD状态和DO状态的增强。基于HIAM,作者设计了一个在线地铁OD流预测框架以联合预测完整的OD流和DO流。
图3 HIAM框架
地铁系统本质上是一个具有非欧式拓扑架构的复杂交通系统。近年来,GCN已被证明可以有效实现非欧式数据嵌入。因此,作者将地铁网络视为一个有向图,并将其整合至图卷积门控循环网络已学习地铁客流的时空表达。
在本研究中,作者直接利用所研究的地铁系统的物理拓扑来指导图网络的建设。根据定义,一个图由节点、边以及边的权重组成,即。具体来说,表示个节点的集合,每个节点表示地铁网络内的站点。是一个边连接矩阵,等于1如果站点和站点在地铁网络直接相连的话,否则设为0.接着,通过对每一行使用线性归一化获得边权重矩阵:
图4介绍了地铁网络系统的物理拓扑图构建过程。文章整合了图卷积和门控循环单元用于表示学习。假设节点的输入数据为,其中可以为不完全的OD矩阵、未完成的出行信息、DO矩阵或者他们的特征。此处使用空间卷积聚合邻阶节点的信息。具体来说,节点的卷积特征:
接着作者将图卷积嵌入到门控循环单元用于时间建模。需要注意的是GRU网络中所有初始的常规卷积被替换为图卷积。利用该网络计算得到的隐藏状态可以定义为:
使用该图卷积门控循环单元,可以从非欧式地铁系统的客流中有效学习到时空特征。
图4 地铁网络拓扑图构建
在HIAM中,作者提出一个OD建模分支,该分支利用多个并行GCGRU联合挖掘未完全的OD矩阵和未完成的出行向量的信息从而学习OD流的分布。图3左侧子图展示了OD分支的整个结构。
具体来说,考虑到乘客出行的周期性,作者基于未完成出行的长短时历史分布估计两个潜在的目的地矩阵。假设当前时间段为,以的目的地估计为例,研究估计实现机制。如图5所示,历史未完成出行的两个目的地分布计算如下:
短时目的地分布:昨天相同时间段未完成出行分布被用于估计最近时间间隔正在出行乘客的目的地。具体而言,表示在昨天时间段进入车站,但在时间段仍未到达目的站点的乘客比例。
长时目的地分布:上周相同时间段未完成的出行分布被用于估计正在出行乘客的目的地。假设今天是周一,是训练集中所有周一的时间段进入车站,但在个时间段后尚未到达目的地的乘客比例。
图5 目的地矩阵计算
需要注意的是,在周一和周六可能不稳定,因为工作日和周末的客流分布是不一致的。另外,可能会比较平稳而无法反映近期的客流分布。因此,文章使用长短时分布估计目的地。具体来说,根据以下的公式生成两个潜在的目的地矩阵以及:
这些估计矩阵和相关的未完全OD矩阵被输入到三个独立的GCGRU用于生成隐藏状态:
每个节点的隐藏状态和接着通过一个卷积层进行融合,其输出进一步用于完善的隐藏状态并生成一个紧凑的OD隐藏状态,该过程可以描述如下:
其中表示特征拼接操作,且为卷积层的参数。如图3所示,我们接着通过一个对偶信息Transformer(DIT)增强紧凑的OD状态。增强的隐藏状态进一步输入至后续的GCGRU和DIT以学习高阶时空特征,具体过程如下:
其中和是的隐藏状态。
HIAM提出了一个DO建模分支用以学习客流的DO分布,如图3右边的子图所示,DO分支由两个堆叠的GCGRU构成,每个GCGRU后接着一个对偶信息Transformer。具体来说,在第次迭代,第一个GCGRU将DO矩阵作为输入以生成一个初始的DO隐藏状态:
文章根据章节5.2中的公式,与的OD信息进行交互以增强DO状态,增强的DO状态接着输入第二个GCGRU,并输出DO隐藏状态:
与OD分支类似,接着通过另一个对偶信息Transformer细化。根据文章设计的OD-DO交互机制,模型在历史OD信息的协助下可以有效学习DO演化趋势。
在过完研究中,OD流和DO流被分开建模,然而二者通常具有显著的因果性和关联性。OD-DO因果性指的是历史OD流实际上会影响未来的DO流,因为后者是前者的时空演化结果。另外,我们可以基于DO-OD关联性推出未来的OD流。例如,一些潮汐车站的DO和OD流通常呈负相关,即当近期的DO流减少/增加时,未来的OD流会相应增加/减少。考虑了OD和DO流的因果性和关联性,我们提出一个对偶信息Transformer模块,该模块通过一种对偶方式传播他们的交互信息以联合建模OD和DO流的分布。在完成交互后,OD和DO特征更适用于客流预测。
如图6所示,DIT以两个交叉分支的Transformer构成,其中右边的一个将OD分支的信息传输到DO分支,左边的将信息沿相反方向传播。以OD特征和DO特征解释DIT的交互机制。具体来说,OD特征和DO特征分别输入三个线性层实现查询向量、键值向量以及值向量的嵌入:
其中,所有线性层通过带有独立参数的卷积层实现。这些查询/键值/值特征的维度与和保持一致。基于注意力机制,两个传播系数和,可以动态决定OD特征和DO特征间信息传递量:
具体来说,表示由转移到的信息的权重,的含义与其类似。最终,交叉分支信息的传播通过下列公式实现:
完成上述交互后,OD状态和DO状态不仅相互增强,通过可以更好捕捉OD流和DO流的内在因果性和关联性。简单来说,DIT可以表示如下:
图6 对偶信息Transformer
最后,我们基于提出的HIAM开发一个统一的在线地铁OD预测框架用于同时预测未来几个时间步的OD和DO流,该框架基于Seq2Seq架构搭建,如图7所示。
具体来说,我们的框架由编码器和解码器构成,编码器和解码器均基于多步HIAM。在解码器中的HIAM移除了两个用于估计目的地矩阵的GCGRU,因为在预测阶段不存在未完成的出行。具体来说,编码器中,异质信息被输入到HIAM用于学习OD演化信息。所有GCGRU的初始隐藏特征设置为0,而最后的隐藏特征被用于初始化解码器的隐藏特征。在解码器中,第一次迭代的输入数据设置为0,HIAM的输出特征分别输入全连接层以预测未来下一步的OD矩阵和DO矩阵。在之后的迭代中,HIAM采用前一次迭代中的预测客流矩阵继续预测下一步的OD矩阵和DO矩阵。在次迭代后,可以获得未来的OD矩阵和DO矩阵序列。具体实验过程和结果分析此处不展开介绍,读者可以自行阅读原文。
图7 在线地铁OD流预测
6 总结
这篇文章专注与一个重要且具有挑战性的任务,即在线地铁OD流预测。然而传统模型要么直接使用不完全OD矩阵的有限信息进行预测,要么忽视OD流和DO流直接的因果性和关联性。为解决该问题,文章介绍了一种新的异质信息聚合机(HIAM),通过充分利用历史客流的异质信息联合学习OD流和DO流的时空特征。基于HIAM,提出了一个Seq2Seq网络以同时预测未来OD流和DO流。最后,在两个大型数据集上对模型性能进行广泛实验验证,实验结果表明文章提出模型的预测效果在在线OD流预测中优于现有的其他先进的模型。
7 Attention
如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!