并行学习框架下基于GAN的城市道路网短时路段交通预测方法

240ec08efa49a6c380324ab26170886d.png

文章信息

74a64094b61ba4affd838bafe893c4d5.png

《A GAN-Based Short-Term Link Traffic Prediction Approach for Urban Road Networks Under a Parallel Learning Framework》是2022年发表在期刊IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS上的一篇文章。

eb470c80b9d8be83b4ecd97be72697fa.png

摘要

eaf726d106d6b1e705e400a75cffe0da.png

在城市交通网络的运行中,路段速度是衡量交通状态的重要指标。不仅实时交通需求,而且信号配时和其他当地规划因素也是主要影响因素。本文提出了一种用于城市道路网的短时交通速度预测方法PL-WGAN,该方法被认为是交通控制与运行并行学习框架的重要组成部分。所提出的方法使用Wasserstein生成对抗网络(WGAN)进行鲁棒的数据驱动流量建模,该建模使用生成神经网络和判别神经网络的组合。生成神经网络使用混合图形块对相邻交叉口的道路连接特征和交叉口的控制参数进行建模。此外,通过堆叠图形卷积网络(GCN)、递归神经网络(RNN)和注意机制来捕获时空关系。进行了全面的计算实验,包括将模型预测和计算性能与几种最先进的深度学习模型进行比较。该方法已在中国杭州大规模城市路网中实施并应用于短时路段交通速度预测。结果表明,它为城市道路网提供了一种可扩展的、有效的交通预测解决方案。

8c4ca2b10a073e221a03e2dd06c906d5.png

介绍

19beb2301fcd37b8fb2ef78080272002.png

过去十年间,交通数据,尤其是浮动车数据(FCD)的爆炸式增长,推动了智能交通系统(ITS)技术的发展。如今,FCD数据已被广泛用于大型网络的道路交通监控和运营。在城市环境中,网络交通状态通常由路段行程时间或交通速度来表示。此外,在工程实践中,路段交通速度被认为是城市交通控制和管理的重要措施。道路路段的交通状态通常与其相邻路段具有一定的空间和时间相关性。在交叉路口,交通转向运动模式会对相关的道路连接产生复杂的时空影响。在相邻交叉口,一条道路对其他相关道路交通速度的影响会随着时间的推移而变化。城市网络上的交通流量通常由信号控制来管理。因此,路段交通速度不仅受相关路段交通状况的影响,还受交叉口交通控制参数和其他规划因素的影响。

在本研究中,提出了一种基于深度学习(DL)的方法来预测城市道路网的路段交通速度,该方法利用Wasserstein生成对抗网络(WGAN)来制定DL模型的结构。两个深度神经网络(DNN)分别被部署为生成器和鉴别器,并使用对抗机制来执行机器学习过程。主要思想是基于WGAN的模型可以实现更稳健的预测性能。此外,研究还采用了图卷积网络(GCN) 、递归神经网络(RNN) 来模拟链路交通状态的时空相关性。

研究补充了之前的研究,并在一个全面的机器学习框架下解决了数据驱动的交通建模,称为并行学习(PL)框架,用于高级城市交通控制和管理。图1简要描述了PL的概念框架。PL框架将真实世界的交通系统与人工交通系统同步。三个学习过程在框架内制定:描述性学习,预测性学习和规定性学习。交通状态、派生的知识和控制动作形成一个抽象的循环。该框架旨在通过自推进过程来迭代地改进实际交通系统的操作执行。这个循环从一个描述性的学习过程开始,形成一个自洽的系统,与来自现实世界的观察相一致。为了指导真实的交通系统,循环以规定的学习过程结束,在该过程中,在人工模拟系统中确定最佳控制策略,该策略可以同时在真实系统中采用。所提出的方法侧重于预测学习过程的PL连接描述性学习和规定性学习。研究探讨了交通状态(即路段速度)和交通控制(即信号配时)之间的关系。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第1张图片

ad6b073dc654e12e449a9411f3565b82.png

方法

b11cd7ad383b92565b7a138efce6df8e.png

(1)问题定义

本研究旨在建立一个DNN模型fdnn,该模型能够对大型道路网络进行短期路段交通预测。与信号交叉口相关的道路路段的交通速度是使用过去的观测值来预测的。基于信号周期平均长度的预测范围标记为Tc。过去的观察结果包括相关交叉路口及其相邻交叉路口的链路交通速度和交通信号数据。

设xt,σt,和y分别代表交通输入向量、信号定时和与当前时间t相关的预测道路交通速度向量。假设该模型预测θ*TC时间步长的预测周期内的路段交通速度。然而,模型中用于预测的数据来自先前α *Tc时间步长。该问题可以解析地表示为

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第2张图片

(2)模型结构

为DNN建模体系结构设计了三个基本步骤,包括数据采集、数据预处理和预测。首先,将历史交通和其他数据(包括道路网络信息、链路交通状态和信号配时数据)收集到数据库中。然后通过几个程序对获得的数据进行预处理:数据插补,空间和时间对齐,以及速度趋势聚类。其中,使用速度趋势聚类的目的是将所有的历史数据分成若干个聚类(数据集),每个数据集在时空模式上都有其独特的特征。然后,使用混合GCN模型将每个簇中的数据用于预测短期链路速度。

图2呈现了基于WGAN框架的链路流量预测模型,该模型由生成器(即,生成神经网络)和鉴别器(即,鉴别神经网络)的集成来驱动。这里,输入生成器的附加条件信息指的是历史交通模式,包括路段交通数据和交叉口交通信号数据。该模型训练生成器来创建预测的链路速度,并且鉴别器认为它们是真实的。这项研究同时训练发生器和鉴别器,同时通过最小-最大游戏的优化过程来调整模型参数。损失函数在文献中有详细介绍。在基于GAN的模型被数据训练之后,生成器被应用于预测链路流量速度。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第3张图片

生成神经网络被设计成具有混合图形块,该混合图形块包括微观建模单元和宏观建模单元。这两种类型的单元采用不同的输入数据。微观建模单元使用交叉点数据来捕捉交叉点内的影响。而宏观建模单元利用网络范围的数据对相邻交叉口的影响进行建模。每个单元包括三个技术组件:时空注意机制(STA)、图形卷积网络(GCN)和递归神经网络(RNN)。STA调整不同时间和空间内容的重要性。GCN学习复杂的拓扑结构来捕捉空间关系,RNN学习交通数据的时间变化。生成神经网络的建模细节将在本节稍后介绍。

(3)速度模式聚类

在应用基于GAN的模型之前,聚类算法将链路流量数据分类为不同的簇,每个簇被认为具有唯一的速度模式。然后,使用所提出的基于WGAN的框架,将每个簇中的数据用于建立链路流量预测模型。通常,聚类算法通过最大化一个聚类内的观察值的相似性以及来自其他聚类的观察值的不相似性来确定不同的聚类。研究测试了三种常用的聚类模型,即时间序列k-means 、k-shape和带有k-means的快速全局比对核。对于时间序列k-means方法,研究还测试了三种距离度量,它们是欧几里德、动态时间弯曲(DTW)和软动态时间弯曲。

为了评估聚类模型的性能,应用了三个指标:Calinski-Harabasz (CH)、Davies–Bouldin(DB)和剪影系数(SC)得分。CH值越高,表示建模结果的聚类分配越好。CH指数由簇间离差和簇内离差的方差比表示:

41d57f9676e0765ce9034f85d9e760db.png

较低的DB值与聚类之间具有较好分离的模型相关,并且分数计算如下:

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第4张图片

较高的SC分数表示同一聚类中的数据样本彼此尽可能接近。然而,属于不同聚类的数据样本通过以下等式尽可能彼此远离:

503f8bcc8ff944ab218fd73b25b14917.png

c1f83e26cb65a6932ff6de3d4ce38a4c.png

(4)WGAN框架

通过在网络和交叉路口级别聚合空间和时间交通信息,用宏观模型描述聚合的交通状态。单个路口的交通特征由微型模型捕捉。在经过几个混合图块的处理之后,来自宏观和微观生成网络的输出特征通过完全连接的层被集成用于最终预测。对单个交叉点进行特征整合。也就是说,对于同一道路交叉口,来自宏观模型的隐藏状态信息与来自微观模型的隐藏状态信息相融合。由全连接层执行的融合操作被表示为

96c6c0a24f5df189f9860c08f58ff0d6.png

在机器学习过程中,由生成器预测的链路交通速度不被鉴别器直接用作输入。相反,受TrafficGAN 的启发,执行转换操作以将每次的链路交通速度合并到交通矩阵中。要构建流量矩阵,需要整个网络的即时链路速度以及网络拓扑。图3给出了一个简单的例子,展示了如何用交通矩阵来表示一个由4条路段组成的道路网络的路段交通速度。本质上,给定一个具有N条链路的道路网络,产生MN×N的交通矩阵。如果链路I没有连接到上游的链路j,则Mi,j用0表示,或者如果链路I连接到链路j,则用链路I的流量速度表示。流量矩阵包含了比链路流量速度更多的信息(即网络拓扑和行进方向),因此在鉴别器的操作中产生了更好的性能。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第5张图片

可以使用不同时间的流量矩阵为鉴别器编译真实和虚假样本:

4b9450b6d2710ab0d2aa76f27020168b.png

真实和虚假样本之间的唯一区别是最后一个元素:相应的矩阵是分别从真实或预测的链路流量速度生成的。鉴别器采用真实或虚假样本数据,Mt的每个切片首先由卷积神经网络(CNN)处理,然后由选通递归单元(GRU)处理。通过加权求和过程计算输出:

84f60ac700d2b0f5a16c6222ef0e8044.png

此外,该生成器具有三个技术组成单元,即时空注意(STA)、图形卷积网络(GCN)和递归神经网络(RNN),将在下文中描述。

1)时空注意(STA)

STA的想法是为输入数据分配权重,以更准确地提供上层表示。对于每个神经网络层,有一个输入数据块X ∈ RN×C×T,其中N是表示节点数量的空间维度,C是输入特征通道的数量,T是时间维度的长度。空间注意力矩阵As用于计算输入数据块的加权和:

a062ecd04525a0dbb78c329efbe6ceac.png

类似地,时间注意力调节矩阵由下式定义:

d6d8f057885374caa42a45779bb80296.png

通过softmax函数进一步规范化As和At,以确保每个节点的注意力权重之和等于1。空间注意力矩阵伴随有邻接矩阵J,以动态地调整节点之间的图链接的影响权重,并且归一化的时间注意力矩阵被直接应用输入数据块X,以生成捕捉更多内聚时间相关性的新输入数据。

2)图形卷积网络(GCN)

由STA操纵的输入数据被进一步馈送到GCN,以进一步捕获嵌入在输入数据的相邻节点中的空间和时间相关性。空间维度中的图卷积根据谱图理论来操作,该谱图理论通过分析拉普拉斯矩阵及其特征值来生成图属性。图的拉普拉斯矩阵是:

f14932b3247a9dbbe8baba2d758b176c.png

L的特征分解可以表示为:

fbdd19270aefc65f94e18c0ae9db8954.png

遵循GCN原则,每个节点通过以下方式进行更新:

7937ed4143193490aa398ab4b5eb5a1e.png

以时间卷积运算为例。时间维度中的卷积层被进一步堆叠,以通过合并相邻时间片的信息来更新节点的信号:

7b29d076f5861778bde8f92b8a418a88.png

3)递归神经网络(RNN)

RNN模型在其内部存储器中使用循环来处理顺序数据。在其结构中,隐藏层接收来自GCN时间卷积运算的输入向量,并生成输出向量。在每个时间迭代t,基于流量输入Xt和先前的隐藏状态ht-1来维护和更新隐藏状态ht1:

49aa7f074fc40f1a0a6a995ef50c8675.png

ee507ccb6089ce5374c9a54601d34f5c.png

实验

72b58e78eb1302e1433c472dde42153d.png

(1)实验设置

本文为城市交通控制系统提出了一个通用的并行学习框架。预测性学习方法是该框架的一个重要组成部分,也将在本节中进行演示。而其他两个组成部分(说明性和描述性学习)已经应用于其他三项研究。基于行为克隆的模型被用于模仿交通工程师在描述性学习概念中处理城市交通控制操作时的行为。此后,可以通过行为克隆模型生成大量的交通控制操作数据。然后,使用交通控制操作数据,预测模型在预测学习过程中探索交通状态和交通控制之间的关系。基于预测模型,智能控制模型根据透视学习过程提供考虑控制结果的最优控制策略。请注意,预测模型是使用收集的真实世界数据进行评估的,以证明其在实验中的有效性。

通过第三方导航系统高德(AutoNavi)测得的FCD数据被用于推导道路交通速度,道路交通速度被定义为在特定时间间隔内在相关道路上行驶的车辆的平均速度。然后,根据相关交叉口的相应信号周期,汇总估算路段交通速度。信号定时信息从部署的SCATS系统获得,这是一个自适应信号控制系统,能够在每个周期调整信号参数。如图4所示,案例研究网络由一百多个交叉口和数百个相应的路段组成。所有计算实验都是在计算机服务器上进行的,该服务器配有32个英特尔E5-2620 CPU处理器、4个GeForce RTX 2080 Ti GPU处理器和64 GB内存。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第6张图片

在实验中,节点和它们的特征分别为宏观和微观图模型定义,如前面部分所述。具体地,链路被建模为宏图中的图节点,并且它具有三种类型的速度统计作为特征,即

2059f0ef8b1c7d4303d231b45c06ea2f.png

为每个道路交叉口构建微图模型,以描述同一交叉口内车道之间的拓扑连接。一个节点用来表示一条车道,可用的转弯运动决定了车道之间的连通性。节点的特征不仅包含车道速度统计,还利用交通信号信息。显微图的时间间隔由信号周期决定,总共30个周期的数据用于构建模型输入xmicro。微型模型的特点是:

d139222271b16ab606065c81e243a19a.png

实验采用了2019年9月至12月的四个月交通数据,时间间隔为3分钟。在这项研究中,训练、验证和测试数据的分割比率设置为80%、10%和10%。训练过程由一种称为教授强制的方法指导,这种方法使用前一时间步的地面实况作为输入。训练过程应用对抗性适应来调节训练和预测阶段中的隐藏状态,以快速有效地训练基于GAN的预测模型。超参数由一个称为射线调整的高效超参数优化框架进行调整。对于宏观和微观模型,时间和空间卷积的核大小都设置为1×3,步长为1 × 1。每个混合图形块中的所有图形卷积层都有64个输出通道(滤波器),三个混合图形块被合并到生成网络中。鉴别器采用四层CNN(核大小均为2)和单层单向GRU,隐藏维数为64。

(2)数据分析

分析链路交通状态和交叉口信号配时数据,以提取空间和时间变化的数据集,用于训练基于GAN的预测模型。图5显示了一天内平均链路速度和绿灯持续时间的变化。每个速度样本都是使用30分钟的滚动平均窗口来估计的。一般来说,平均链路速度在工作日和周末的表现彼此相似。具体来说,速度从00:00开始逐渐上升,在04:00左右达到最大值,高速保持到早上06:00。然后,从早高峰开始的06:30开始,链接速度明显下降。速度一直降低到09:00。09:00-17:00之间保持相对低速廓线。平均链路速度从17:30开始下降,并在18:00达到最低值。此后,速度逐渐增加到30 km/h以上。道路连接的交通在工作日的夜间(从22:30到06:00)表现类似,并且在平均速度水平上具有有限的波动。周末的速度模式与平日没有明显不同。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第7张图片

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第8张图片

由于在该区域部署了自适应信号控制器,所有交通灯的绿灯持续时间根据相应交通流量的波动而同时改变。如图5(c)和(d)所示,平均绿色持续时间在早高峰08:30和晚高峰18:00左右达到局部最大值。这与白天交通需求的变化是一致的。与周末相比,交通信号灯在工作日的持续时间变化更大,这表明了研究区域交通流的潜在空间变化。

图6显示了选定道路(西苑街)上五个相邻交叉口工作日06:30至09:00的平均时空速度模式特征。四个月的数据用于计算该图中的平均链路速度。南行方向的链路速度一般小于相反方向的链路速度。在早高峰期间,由于下游交叉口的交通拥堵蔓延,可以观察到减速的普遍滞后。此外,如图6(b)所示,北行方向的传入流量需求在07:30左右出现有规律的增加,导致链路速度逐渐降低。比较其中的两条曲线,交通模式的变化表明,与信号交叉口相关的路段交通状态受到其相邻道路路段的影响,包括上游路段和下游。这种非线性的时间和空间相关性和依赖性为城市道路网络的实时交通预测带来了潜在的挑战。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第9张图片

(3)链路速度分析

图7显示了早晨06:30 AM和09:00 AM之间的高峰的一组链路速度时间序列的聚类结果的示例。所有时间序列在06:30 AM以大约40 km/h的速度开始,向不同的方向演化,然后向20 km/h下降。集群的数量是三个,这意味着实验网络识别出三种不同的时空模式。这些聚类中样本的比例分别为79.90%、10.40%和9.70%。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第10张图片

通过观察图5中平均链路速度的局部最小值和最大值来确定特征聚类的不同周期。对于每个周期,随机选择1000个样本,并且这样的选择被执行几次以确定最佳聚类模型。调整不同聚类模型的超参数(尤其是表示聚类数k的参数)后,表1总结了每个时间段的评估结果。具体而言,相同聚类模型(但聚类数不同)可以更好地识别上午和下午高峰的交通模式。

010e6c87f798dc7c59696a7f11b51e13.png

模型结果

d8976a7418e85d748560f2d247d54480.png

为了验证包含交叉口交通控制的建模效果,将所研究的模型分为两组。一组包括HA、ARIMA、SVR、GRU、GCN和ST-GCN模型,在这些模型中没有考虑交叉口交通控制。另一组包括T-GCN、A3T-GCN和提议的PL-WGAN模型,它们结合了用于链路速度预测的交叉口交通控制数据。表II的结果表明,考虑交通控制参数的模型比备选方案实现了更好的预测性能。此外,所提出的方法PL-WGAN在选定的性能度量方面实现了最佳的预测性能。

并行学习框架下基于GAN的城市道路网短时路段交通预测方法_第11张图片

4586deb342211f4c0c7a6b4fa2bb2fc2.png

Attention

6bddfa2110b1f5fded0e154809f66a27.png

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

你可能感兴趣的:(网络,大数据,算法,编程语言,python)