论文笔记(1) : Deep Multi-View Spatial-Temporal Network for Taxi Demand Prediction

这篇文章是作者在滴滴出行实习时做的一篇文章,投了AAAI2018.

1.Abstract

  • 出租车需求预测可以帮助城市资源预调度
  • 传统方法大部分都利用时序预测的技术
  • 现有的深度学习方法只考虑单一的时间(LSTM)或空间(CNN)的维度
  • 本文提出一个DMVST-Net,考虑了时间,空间,以及语义的维度

2.Introduction

  • 传统方法中:ARIMA(autoregressive integrated moving average )曾被广泛应用到交通预测问题中(2008,2012,2013),也有很多人研究如何借助其它因素来提高预测准确性。
  • 深度学习方法中中:也有很多人用CNN,LSTM来做交通预测,但是是没有人同时考虑时序列关系。
  • 在这篇论文中,同时使用了CNN,LSTM来捕捉复杂的时空关系。如果将整个城市看成一张图片不会达到很好的效果,所以本文提出了一个局部CNN模型,只考虑预测地点附近的区域。利用局部CNN来捕捉特征时会忽视两个地点距离很远但是它们的需求模式非常相近的情况。所以还使用了一个语义的信息(各个区域之间的相似关系)
  • 本文使用的时滴滴出行广州的数据,平均每天大约300000个请求。

3.定义

  • 整个城市分成不相交的区域L={L1,L2,..,Li,…,LN},将整段时间分成I={I0,I1,I2,…,It,..,IT} ,长度为30分钟。
  • 出租车需求:o=(o.t,o.t,o.u) ,o.t 代表时间戳,o.l 代表位置,o.u 代表用户的唯一ID。
  • 需求:yti ,在某一个 lt , Li 时间内o的次数
  • 预测问题:给 t 时间内的数据,预测 t+1 时间 的需求

4.方法

论文笔记(1) : Deep Multi-View Spatial-Temporal Network for Taxi Demand Prediction_第1张图片

  • 将地图分成一个个区域,对每个区域进行局部CNN,针对于一个特定区域,每个时间段CNN后的结果作为LSTM每个阶段的输入。(形成了时间和空间的概念)

  • 利用局部CNN来提取空间特征。

  • 利用LSTM来提取时间特征,输入为上下文信息和CNN的输出。
  • 利用局部CNN来捕捉特征时会忽视两个地点距离很远但是它们的需求模式非常相近的情况,所以根据每个区域的随时间变化的需求量序列(本文利用周平均需求序列来计算),利用Dynamic Time Warping (DTW) 计算两个序列(区域)之间的相似度,将区域看成节点,节点与节点之间的相似度看成连边。然后用Graph Embedding的方法求出每个区域的向量(mi),和LSTM的输出进行连接。
  • 个人理解:这一个模型是对所有的region都进行训练。也就理解了为什么在 c 区域只有将自己本区域的(mi) 与LSTM的输出进行连接。

5.结果

  • 和已有的方法进行对比
    论文笔记(1) : Deep Multi-View Spatial-Temporal Network for Taxi Demand Prediction_第2张图片

  • 与其它模型进行对比取得了很好的提升,XGBoost在对比方法中取得的效果最好。甚至要比ST-ResNet要好。

  • 和自己的模型进行对比

论文笔记(1) : Deep Multi-View Spatial-Temporal Network for Taxi Demand Prediction_第3张图片

  • 从结果来看,时间加空间的维度就已经取得了很好的效果,加语义模型后的效果提升微小。
  • 只有LSTM的效果就已经超过了全部的对比方法。
  • LCNN对模型的贡献度最大。

6.思考

  • 生硬的将向量concatenate是否是最优的联结方式?
  • 是否有更好的网络结构?
  • 实时的天气状况、实时的交通拥堵状况以及不同区域的繁华程度

你可能感兴趣的:(交通预测)