交通事故预测——《RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework》

1、文章信息

AAAI顶级会议,2020年的一篇关于利用深度学习模型进行交通事故预测的文章,文章标题为:RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework .译为:RiskOracle:一种时空细粒度交通事故预测框架(分钟级)。文章是开源的,代码可以从文章作者给的github地址上查看。

原文github地址:https://github.com/zzyy0929/AAAI2020-RiskOracle/
交通事故预测——《RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework》_第1张图片

2、摘要

研究内容:
实时交通事故预测(分钟级)
以往研究的局限:
小时级、只考虑区域间的静态相关性
本文要解决的问题:
由于道路网络具有高度动态特性,且样本中事故记录数本身很稀少,这会导致结果偏差和零膨胀问题。因此,提高预测的粒度仍然是一个挑战。
本文的主要研究思路:
提出了一个新颖的框架RiskOracle,以将预测的时间粒度提高到足够细的水平。具体来说,(由于神经网络往往易于训练连续型的函数)首先将标签中的所有风险为零的值转换为适合训练网络的连续值。然后,我们提出了差分时变图神经网络(DTGN),以捕获交通状况的瞬时变化和子区域间动态相关性。此外,我们采用结合多任务的区域选择方案来突出显示全市范围内最可能发生的事故子区域,从而弥合了具有一定偏置的风险值与零星事故分布之间的沟壑。

3、简介

文章首先对现有的研究情况做了深度分析,基本介绍了最近几年最流行的几个模型,并总结其优缺点,引出本文的研究内容,下面是一张总结的研究表:
交通事故预测——《RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework》_第2张图片

回到文章中,提到现有研究有如下三个重要问题在很大程度上被忽略了,导致这些模型不能直接应用到更短期的、分钟级的预测中:

  • 当预测任务的时空分辨率提高时,将出现零膨胀问题,将所有结果预测为零。如果没有任何解决此问题的策略,则训练数据中稀有的非零项将使模型无法生效。
  • 尽管可以通过卷积神经网络(CNN)了解静态的子区域关联度,但时变的子区域关联在全市短期事故预测中也起着至关重要的作用,即两个子区域在由于潮汐流动存在上午的相关性较低,下午的相关性较低的情形。
  • 在相邻时间间隔内同一子区域内交通状况的异常变化通常会引发事故或其他事件的发生。如果不考虑上述时空问题,以前的小时级预测模型的能力将受到严重阻碍。

针对以上问题文章的解决方案描述如下:

  • 在数据预处理阶段,提出了一种协同感知策略以最大程度地推断全局交通状况,然后基于先验知识的数据增强功能可解决零膨胀问题,以进行短期预测。
  • 在训练阶段,提出了多任务差分时变图卷积网络(Multi-task DTGN),其中时变总亲和度矩阵可以显式地对短期动态的子区域相关性进行建模,而差分特征生成器则在交通状况在同一区域的短期变化与事故之间建立更为高阶的关联,多任务方案解决事故预测中的空间异质性问题。
  • 通过在预测阶段利用学习到的多尺度事故分布,可以获得一组离散的最有可能的子区域。

4、模型

首先区域划分上就有所不同,尽可能做到了空间的细化:将一个城市图划分为q个中等大小的矩形区域,再将每个矩形区域划分成若干个子区域,总共m个子区域,同时整个城市地图看作为一个无向图G(V,E),V由一系列的子区域构成,E表示一系列具有相关联性的子区域的连接边。
同时从两个方面探讨特征:分别是静态的路网特征和动态交通特征
静态路网特征:
车道数量,道路类型,路段长度和宽度,除雪优先级以及高架电子标志的数量, 内部的所有路段都可以表示为固定长度向量。
动态交通特征:
交通流量,交通状态(速度),事故风险

模型框架如下图所示:
交通事故预测——《RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework》_第3张图片

在数据预处理过程中:
(1)空间异质性问题
由于大多数的交通事故往往发生在交通流量较大、具有较高风险值的市中心区域,导致严重的风险空间失衡,而忽视了农村地区相对高风险的地区。 要进行全市范围的预测,必须选择最可能发生事故的区域并解决空间异质性问题。因此,对城市以不同大小的尺度划分,中等的矩形区域负责收集粗粒度的事故分布而小的方形区域负责收集细粒度事故分布。 然后,将进一步分别高亮出每个中型矩形区域中的子区域。多尺度事故信息分布可视为一种空间层次性事故分布。
(2)零膨胀问题
如果训练标签中的非零项目非常少见,深度神经网络(DNN)会使得训练的权重为全0,从而使得模型失效、遭受零膨胀问题。采用一种基于先验知识的数据增强(PKDE)策略来区分训练数据集标签中的风险值。
(3)填充稀疏的感知数据
实时交通信息通常难以充分收集到以进行事故预测,但是,动态交通信息往往与静态空间路网结构具有交互作用。 因此,通过利用因子分解机(FM)的交互操作将xDeepFM修改为适合交通数据的时空深度分解机(ST-DFM),提出了一种协同感知策略。

DTGN模型实现细节:
交通事故预测——《RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework》_第4张图片

对比实验:
一共有5个baseline,也是近些年比较新的解决方案:
(1) ARIMA: 经典的机器学习算法,用于理解和预测未来值,尤其是时间序列预测;
(2) Hetero-ConvLSTM: 针对daily的事故预测模型,也是最新、效果最好的事故预测方法;
(3) ST-ResNet: 针对人流量预测提出的经典方法,也是潜在的能够用于事故预测的深度学习模型;
(4) SDAE: 针对短期事故预测,引入人流量(人类活动等)作为事故预测的指示;
(5) SDCAE: 针对短期事故预测的模型。

评估策略:
从回归(MSE)和分类(最高M的准确度)两个角度评估。
交通事故预测——《RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework》_第5张图片

5、总结

这篇文章采用的是图卷积神经网络,相对于传统的CNN,RNN网络理解起来可能比较困难些,具体可以深度下原文,文章的源代码博主目前还没有做实验,后续可能将补充。总结下这篇文章的几个关键点吧:
(1)首先是零膨胀,稀疏感知问题,文章给出了两种策略;
(2)空间异质性问题,多任务方案处理。

参考资源:
[1]Zhou, Z., Wang, Y., Xie, X., Chen, L., & Liu, H. (2020). RiskOracle: A Minute-level Citywide Traffic Accident Forecasting Framework. ArXiv, abs/2003.00819.
[2]https://www.jianshu.com/p/09ae9e392ccd

你可能感兴趣的:(科研论文,神经网络,python,人工智能,机器学习)