利用主题子轨迹对出租车轨迹进行可视化分析

基于GPS定位的出租车轨迹数据挖掘对交通运输和城市规划具有重要意义。主题模型可以有效地从出租车轨迹中提取语义信息,用于分析城市道路的交通情况。而常用的LDA模型忽略了轨迹的方向,不能准确地挖掘出租车的运动模式,从而影响交通情况的分析粒度。因此,有必要在主题建模时考虑轨迹的方向信息

利用主题子轨迹对出租车轨迹进行可视化分析_第1张图片

为此,本文采用了二元主题模型,而不是传统的主题模型来分析文本化的轨迹数据,并考虑轨迹的方向信息。进而提出了一种改进的先验算法来提取主题子轨迹,并使用它们来表示每个主题。最后,我们设计了一个具有多个链接视图的可视化分析系统,以方便用户从主题和主题子轨迹中交互式探索运动模式。

 

轨迹主题提取

出租车轨迹由若干个GPS位置组成,本文首先将GPS位置与道路名相匹配来对轨迹数据进行文本化,然后利用bigram主题模型提取轨迹主题。由于bigram模型是根据前n-1个单词预测当前单词,因此将其结合主题模型用于在轨迹主题中提取包含的方向信息。

利用主题子轨迹对出租车轨迹进行可视化分析_第2张图片图1 bigram主题模型的建模过程,其中红色箭头表示与LDA模型的区别,即考虑单词顺序。

 

 

子轨迹提取

通常情况下,主题由多个单词表示,但是对于轨迹主题而言,单个道路名无法体现出方向信息。因此,本文利用子轨迹(即道路名序列)来表示轨迹主题。子轨迹类似于一般文档中的名词短语,但由于轨迹文本的特殊性,无法使用NLP中的词性标注提取子轨迹。所以,本文根据轨迹数据的特性修改Apriori算法用于提取子轨迹以表示轨迹主题。

 

系统界面

 

 

利用主题子轨迹对出租车轨迹进行可视化分析_第3张图片

图2 系统界面:控制面板(a)可调整主题建模和子轨迹提取的参数;主题概览图(b)展示轨迹在各个主题上的数量分布;子轨迹投影图(c)揭示子轨迹间的相似性;子轨迹地图(d)展示各个主题及其子轨迹的空间分布;子轨迹列表(e)可对子轨迹进行搜索和排序;时间热度图(f)展示时间和速度以及时间和距离上的轨迹数量分布。

 

 

案例分析

通过成都的出租车轨迹数据的案例证明了本文所提出系统的有效性。本文对比了各个主题的空间分布,发现有两对主题的子轨迹在方向上呈现相反状态。图3(a)中的子轨迹方向是从北到南,主要集中在西二环、人民南路和科华路,而图3(b)中的子轨迹方向则是从南到北,主要集中在东二环、人民南路和科华路。此外,图3(c)中的子轨迹方向是从西北到西南,图3(d)中的子轨迹方向是从西南到西北。由此证明轨迹的方向信息在出租车的运动模式分析中十分重要,且本文方法相比于LDA模型,能够更细粒度的提取轨迹主题。选择与机场相关的子轨迹进一步探索,图4展示了从机场到市中心(a)和从市中心到机场(b)的子轨迹列表。分析其时间热度图发现,从机场到市中心的高峰期集中在上午9点之后,而从市中心到机场的高峰期则集中在早上6点到8点和中午12点到下午5点。由于机场快线属于高速路,多数轨迹的速度都大于60 km/h。

 

利用主题子轨迹对出租车轨迹进行可视化分析_第4张图片

图3 子轨迹呈相反方向的两对主题。(a)和(b)、(c)和(d)中的子轨迹分布在相同的道路上,但其轨迹方向相反。黑色虚线表示与机场相关的子轨迹。

利用主题子轨迹对出租车轨迹进行可视化分析_第5张图片

图4 机场相关的子轨迹分析。从机场到市中心(a)和从市中心到机场(b)的子轨迹属于两个不同的主题,其时间和速度以及时间和距离上的轨迹分布也不同。

 

全文信息

Visual analytics of taxi trajectory data via topical sub-trajectories

BY:Huan Liu, Sichen Jin, Yuyu Yan,Yubo Tao, Hai Lin

Abstract: 

GPS-based taxi trajectories contain valuable knowledge about movement patterns for transportation and urban planning. Topic modeling is an effective tool to extract semantic information from taxi trajectory data. However, previous methods generally ignore trajectory directions that are important in the analysis of movement patterns. In this paper, we employ the bigram topic model rather than traditional topic models to analyze textualized trajectories and consider the direction information of trajectories. We further propose a modified Apriori algorithm to extract topical sub-trajectories and use them to represent each topic. Finally, we design a visual analytics system with several linked views to facilitate users to interactively explore movement patterns from topics and topical sub-trajectories. The case studies with Chengdu taxi trajectory data demonstrate the effectiveness of the proposed system.

Keywords: Trajectory pattern minning, Trajectory visualization, Visual analytics, Topic model

Link: https://www.sciencedirect.com/science/article/pii/S2468502X19300476

期刊信息:

*Visual Informatics*(中文名《可视信息学》)是由浙江大学主办、浙江大学出版社和Elsevier出版集团联合出版、在线发行、开放获取的国际学术期刊。该刊聚焦于面向人类感知的视觉信息的建模、分析、合成、增强与自然交互。主编是周昆教授、Hans-Peter Seidel教授。
Elsevier link (including First Online Articles): https://www.journals.elsevier.com/visual-informatics
Submit your paper:
https://www.editorialmanager.com/VISINF/default.aspx
Tel:(86-571)88206681-519
E-mail: [email protected]
Linked in:Visual Informatics
Official account on Wechat: visinf

 

你可能感兴趣的:(Open,Access,浙大CAD&CG国重)