网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》

文献阅读笔记:《基于图卷积的出发地-目的地矩阵预测:旅客需求建模的新视角》

  • 摘要
  • 现有研究不足
  • 研究挑战(难点)
  • 本文的贡献
  • 准备工作
    • 定义1:格子
    • 定义2:时间片
    • 定义3:OD矩阵
  • 模型方法
    • 空间维度:网格嵌入法
      • (一)地理邻居
      • (二)语义邻居
    • 时间维度:多任务学习
      • (一)periodic-skip LSTM
      • (二)主要任务:预测OD需求矩阵
      • (三)两个子任务:预测出发地需求和目的地需求
  • 数据集
  • 实验结果

摘要

1、 起点—终点矩阵预测,及进行OD需求矩阵的预测,OD需求矩阵的预测比一般的需求预测更加具有挑战性,不仅要求预测一个地区的需求量,还要求模型预测乘客的目的地。
2、 数据具有稀疏性。针对数据稀疏的问题,提出了一个基于网格嵌入的多任务学习模型(GEML)。

现有研究不足

有很大一部分预测仅仅是简单的回归预测,只关注某一个区域的需求量。

研究挑战(难点)

1、既要了机某个区域的乘客需求量,还要预测他们所到达的目的地;
2、第二个挑战来自于时空特征融合;
3、OD矩阵的数据稀疏很常见,在特定的时间范围内,某一城市可能存在成千上万的需求,但是在某个特定的区域内,可能只有两位数甚至是个位数的需求,而且这些需求所要到达的目的地各不相同。

为了解决数据的稀疏性问题,基于地理第一定律,文章提出利用网格间的地理相关性来解决数据稀疏问题。在网格嵌入部分考虑了两种相邻点,即地理相邻点和语义相邻点,这两种相邻点是基于两个网格在地理上是否相邻接或者根据乘客需求进行连接的。前者用于度量网格与相邻网格之间的内在紧密度,而语义相邻网格则用于出发点和目的地之间的交通流语义强度。

本文的贡献

1、本文提出了OD需求矩阵预测问题,预测给定时间范围内的出发——目的地的欲求量,有利于网约车平台准备车辆进行调度;
2、本文将研究区域划分为网格状,在网格邻居之间通过图卷积对每个网络进行嵌入,通过模拟GCNs中的消息传递模式来模拟不同网格之间的流量传输关系;
3、通过LSTM来来捕捉乘客需求的时间趋势。两个子任务预测网络中单个输入和输出的需求,而主任务预测每个网络之间的需求;
4、在两个真实数据上验证,GEML模型的性能更优。

准备工作

定义1:格子

整个空间区域被划分为n多个不重叠的格子,定义为:
在这里插入图片描述

如下图(a)所示,本文将整个区域划分为了16个格子,每个格子由其经纬度的最大值、最小值来表示。
网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第1张图片
本文选择划分区域的方法是通用且边便捷的,一些研究使用道路网络来划分城市区域,但这道路网络数据并不总是完整,也不一定适用于每个城市;一些研究仅仅将poi作为数据的来源和目的地,这就加剧了数据的稀疏性,因为poi的粒度太小了。

定义2:时间片

任意两个连续时间槽位的时间间隔是常量。

定义3:OD矩阵

在这里插入图片描述

模型方法

网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第2张图片

首先,利用网约车公司提供的移动数据,提取出来OD需求矩阵,通过外部获取辅助数据——poi数据机和天气状况数据集。随后,GEML模型从地理邻居和语义邻居进行信息融合。接着,每个格子的向量按照时间顺序被投喂到多任务神经网络中来学习最近一个时间片的格子的表示。最后,这些格子的向量表示被用来生成OD需求矩阵的预测结果。

从时空角度来说,本文提出了基于邻居的网格方法通过融合每个格子的邻居的信息来学习每个格子的向量表示。从时间的角度上来说,本文设计了一个多任务学习框架为所有时刻乘客需求的动态趋势来建模。

空间维度:网格嵌入法

由于GCN在稀疏数据上提取特征具有局限性,本文对于在需求建模中提出两种邻域函数:地理邻域函数和语义邻域函数。它们分别用于度量网格域相邻网格之间的内在紧密度和网格中起点和终点之间的交通流语义强度,下图描述了两种邻居之间的聚合。
网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第3张图片

(一)地理邻居

地理邻居意味着,与每个网格地理邻接的格子。每个格子的地理邻居集合表示为:
在这里插入图片描述
在这里插入图片描述

(二)语义邻居

语义邻居不仅收到周围地理邻居的影响,还受到它交互模式(倾向于理解为交通连通关系)的影响。
在这里插入图片描述

因为 OD 需求矩阵预测问题是一个时间敏感型问题,所以在不同时刻,考虑不同格子之间的语义关系是至关重要的。例如,在早高峰的时间段,大量 的打工人从遥远的区域达到他们在市中心的工作场所。通过引入语义邻居这个概念,我们将 时间模式考虑到网格嵌入法中。

网格嵌入的预加权聚合器
在GEML模型中,我们通过融合第k时刻的地理邻居和语义邻居的信息来推断每个格子的向量表示。本文并没有直接训练每个格子的嵌入向量,而是训练了一个聚合函数,利用从格子的邻居中积累和选择特征信息。
聚合器的原始形式:
在这里插入图片描述
网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第4张图片
存在的问题:当融合格子们的特征时,无法区别每个邻居的重要性程度。直观地看,两个格子之间的地理距离越近,它们的属性就越相似;在语义集合中,邻接格子的受欢迎程度对聚合过程同样产生影响。

因此,本文提出了一个预加权聚合器,它可以为网格嵌入强调更加重要的格子邻居。对于地理邻居来说,公式如下:
在这里插入图片描述
网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第5张图片
语义邻居的表示也是同理,公式如下:
在这里插入图片描述
在这里插入图片描述

时间维度:多任务学习

每个格子的嵌入向量可以按照时间顺序来表示为一系列向量表示,在这里,我们运用了多任务学习模型。
网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第6张图片

(一)periodic-skip LSTM

由于LSTM要学习过去的时间段上的需求量,所以它更加注重对比较接近时刻k的需求量的学习,然而,每天相同时刻的需求量变化趋势大致相同,如果学习前面不相关时刻的需求量则会引入噪声。所以本文提出了periodic-skip LSTM模型,跳过了不相关时间序列的学习。
在这里插入图片描述

其中p代表的是跳过的隐藏层状态的数量,也就是跳过的时间段的数量。

(二)主要任务:预测OD需求矩阵

在这里插入图片描述
在这里插入图片描述

(三)两个子任务:预测出发地需求和目的地需求

在这里插入图片描述
在这里插入图片描述

数据集

网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第7张图片

实验结果

网约车需求预测文献阅读笔记(一)《基于图卷积的出发地—目的地矩阵预测:旅客需求建模的新视角》_第8张图片

你可能感兴趣的:(深度学习,OD需求矩阵,图卷积,网约车需求预测,文献阅读笔记)