1.文章信息
《Curb-GAN: Conditional Urban Traffic Estimation through Spatio-Temporal Generative Adversarial Networks》。
2020年8月KDD的一篇文章。
2.摘要
给出城市的发展规划以及路网的历史交通观测数据,条件城市交通流量估计问题的目的是在规划部署之前估计产生的流量状态。这个问题对于城市发展和交通管理具有重要意义,而且非常具有挑战性。为了解决这个问题,我们提出了一种新颖的条件城市交通生成对抗网络,它能够基于不同的(史无前例的)交通需求提供连续时间段内的流量估计,因此能够使交通规划者在实施交通规划之前进行准确地评估。所提出的Curb-GAN通过几个新的想法采用并改进了条件GAN结构:(1)将不同的交通需求作为“条件”,产生相应的交通需求,(2)通过整合动态卷积层来捕捉底层道路网络的局部空间自相关,(3)采用自注意力机制捕获不同时间段的交通时间依赖。通过在两个真实世界的时空数据集上的实验显示在不同的条件下我们的Curb-GAN模型的估计准确性要优于主要基线模型,而且能够产生更有异议的估计。
3.简介
在给定城市发展规划(产生新的出行需求)、基础道路网络和历史交通观测数据的情况下,条件城市交通流量估计问题旨在通过估计连续时间段内新的出行需求下的交通状态来评估部署计划。
本文提出了一种新的条件城市交通生成对抗网络(Curb-GAN),它可以根据不同的出行需求在连续时间段内提供有效的交通估计。上图显示了解决方案框架,其中提出的Curb-GAN利用条件GAN结构来控制基于各种出行需求产生的流量,并使用训练良好的生成器来估计未来的流量。Curb-GAN具有一些新颖的设计,包括使用动态卷积层来捕捉道路网络的空间自相关,以及应用自注意力记住捕获不同时间段的交通时间依赖。我们的主要贡献有以下几点:
1)我们将条件交通估计问题建模为交通数据生成问题,并提出了一种新的深度生成模型Curb-GAN,该模型可以根据城市中任意区域的不同出行需求在连续时间段内生成未来交通估计。
2)设计了包含动态卷积层和自我注意机制的模块,以捕捉跨时空区域的交通状态如何根据时间变化、出行需求变化和基础道路网络结构演变的共享模式。
3)我们在两个真实世界的时空数据集(出租车流入和交通速度数据集)上进行了广泛的实验,以评估我们提出的Curb-GAN。
4.知识准备
上表列出了本文所使用的符号。
定义1:(网格单元)我们将城市分割成经纬度等边长的I×J网格单元。
定义2:(目标区域)目标区域是城市中的一个正方形地理区域,由网格单元组成,整个城市可以被划分成重复的多个区域,目标区域由一个位于左上角的锚网格单元和位于边上的l个网格单元定义。
定义3:(出行需求)一个地区的出行需求反映了一段时间内出发的总人数。一个网格单元内t时间段内的出行需求定义为dts,一个目标区域在一天内的出行需求定义为一个序列。
定义4:(交通状态和交通分布)交通状态表示交通的质量,可以用交通速度、交通流入/流出量、交通量等来衡量。在时间t内网格s的平均交通状态为mts,在一天内目标区域的交通分布记为一个张量。
定义5:(交通相关矩阵)一天内目标区域的交通相关矩阵记为一个张量,。
问题定义:一个城市区域被划分为几个地区,并给出历史交通观测天数内的出行需求序列和交通分布序列,我们的目标是基于给定的出行需求序列下预测连续时间内的某一个特定区域的交通分布。
5.方法
动态卷积层
动态卷积层的输入为交通状态矩阵H和交通相关性矩阵A,输出的矩阵是一个新的交通状态矩阵H。
标准卷积层中的过滤器应用到图像中,并且有固定的大小和规则的形状。动态卷积层中的交通相关性矩阵可以被视为一个过滤器,应用到交通状态矩阵,有不规则的形状和大小。如上图所示,标准卷积层中的过滤器能够覆盖没有道路或者有很低的交通相关性,所以不能准确地捕获道路,但是动态卷积层中的交通相关矩阵产生的过滤器能够准确地捕获道路结构,因为交通相关性矩阵能够控制过滤器的形状和大小,从而使它仅覆盖有很强交通相关性的网格单元。
自注意力机制
自注意机制主要应用于Seq2Seq模型中,在处理语言建模和机器翻译问题时取得了优异的性能。自我注意机制处理包括文本、音频和视频在内的序列数据,并从中学习时间依赖性。与LSTM和GRU相比,自我注意机制是并行计算的,训练时间更短,训练质量更高。
自注意层的输入和输出是两个向量序列。在自我注意过程中,输入序列中的每个向量线性转化为query、key和value三个向量。每个输出向量被计算为所有value的加权和,其中权重是softmax层的输出,softmax层的输入是相应query与所有key的点乘积。由于query、key和value的序列可以组合成Q、K和v的矩阵并行计算,因此自我注意函数的计算公式为:
dk为K的维度。
在本文中,我们采用多头注意力机制,及对quaries、keys和values进行h次线性变换,从而得到h个不同的注意,并将其串联起来,然后通过线性变换得到最终的值,一个双头的注意力机制如下图:
Curb-GAN的结构
上图为curb-GAN的结构图,包含一个generator G和一个discriminator D,generator G的目的是生成与真实时间段相似的连续时间段流量分布序列,使discriminator不能很好地区分生成的流量分布序列和真实时间段流量分布序列。
G的目的具体来说是根据特定区域的日出行需求序列生成日序列交通分布。生成器的输入有三部分:从高斯分布中随机抽样的一个噪声张量;一个条件张量,它定义了R的区域位置、出行需求和当前时间段;一个交通相关矩阵张量。
判别器的作用:如果输入是真实的流量分布序列,判别器D试图提高输出分数,如果输入是生成的流量分布序列,则试图降低分数。判别器的输入也有三部分:一天的交通分布张量;一个条件张量;一个交通相关矩阵张量。判别器输出一个标量,该标量表明输入流量分布张量是否为真实数据,以及与输入流量分布张量是否匹配。
Building Block 1由动态卷积层、批处理规范化和像ReLU或LeakyReLU这样的激活函数组成。在Building Block 1中,动态卷积层的个数为一天内分成的时间段的个数,所有动态卷积层都可以共享参数。
Building Block 2由一个多头自我注意层和一个由ReLU激活的由两个完全连接的层组成的前馈网络组成。对自注意层和前馈网络进行加法运算和层归一化。
6.评价
数据集介绍
第一个数据集为交通速度数据。每小时平均交通速度提取自2016年7月1日至12月31日中国深圳出租车的GPS记录。我们首先将深圳市划分为40 × 50个网格单元。每个网格单元中的交通状态是通过平均交通速度来衡量的,6个月有4416个时间段(即1个小时)。然后对每个时间段(即1小时),获取训练区域的交通分布和出行需求,利用训练区域的日交通分布序列和出行需求序列对模型进行训练。目标是在预期出行需求序列的条件下,估计测试区域R的交通分布序列。
第二个数据集是出租车进入流量数据。出租车流入数据同样来源于2016年7月1日至12月31日中国深圳的出租车。在每天的每个时间段(即一个小时),出租车流入是所有停留或到达每个网格单元的出租车数量。同样将整个深圳市划分为40×50网格单元,每个网格单元内的交通状态通过出租车流入量进行度量。利用所有训练区域的出行需求序列和交通分布序列,对于特定测试区域,给定预期出行需求序列,然后估计交通分布序列。
评估指标
我们使用平均绝对百分比误差(MAPE)和根均方误差(RMSE)来评估Curb-GAN算法。
实验设置
整个深圳市划分为40 × 50个网格单元,边长l1 = 0.0084纬度,l2 = 0.0126经度。每个区域的大小为10 × 10,即ℓ = 10,Ns= 100。因此,总共有1271个大小为10 × 10的可能目标区域。然而,使用所有1271个区域的数据来训练模型是不必要的,而且成本太高。我们选择63个覆盖整个深圳市的区域作为训练的目标区域,提取其随时间的交通分布和出行需求,并使用其余区域进行测试。
用于训练所有模型的数据的每日时间间隔是从7:00am到7:00pm,其中每个小时是一个时间段,我们每天有12个时间段,即Nt= 12。
Curb-GAN的结构如下: Building Block1堆叠4次,Building Block 2堆叠3次,使用双头注意力机制。
7.结果
本文主要是在模型总体的性能、在连续时间段内估计的准确性以及交通估计的可视化三个方面,将Curb-GAN模型与其他基线模型进行对比,说明了此模型能够更好的捕获时空相关性。此外,对Curb-GAN参数进行了评估,包括Building Block 1和Building Block 2的堆叠层数,噪声的初始尺寸,自我注意机制中的头的数量等。
8.创新点
1)考虑出行需求对区域交通状况的,对于潜在地避免因突发事件和新的城市建设等突发事件而引起的交通问题至关重要。
2)Curb-GAN考虑了时空相关性,并在连续的时间段内产生一个估计交通流量的序列。训练好的生成器能够在一个没有出行需求的区域生成真实的交通分布序列。
Attention
如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!