语义轨迹数据分析:一种概念和计算方法

语义轨迹数据分析:一种概念和计算方法

Towards Semantic Trajectory Data Analysis:A Conceptual and Computational Approach

作者:Zhixian Yan——瑞士EPFL

来源:VLDB2009(大规模数据库系统年会)

译者注:该文章比较老,但是代表了一种趋势,将人类难于理解的空间点数据(GPS轨迹)转化为易于人类理解的语义数据(地标),供人类更好的使用。

摘要:

GPS轨迹收集极其普遍,如何收集、整理、检索、挖掘这些数据成为了研究的热点。但是,大多数工作都基于轨迹的时空特性展开,没有充分开发高层的轨迹语义特性。本文通过结合语义概念和统计学方法来进行轨迹数据分析:主要包含如下三个方面:轨迹模型、轨迹计算和轨迹数据挖掘。

主要内容:

1、 相关工作:语义轨迹处理是个新生概念,2008年文献三【3】首次提出了一个概念模型,将轨迹表示为一系列的“停点——移动”,文献【4】提出使用位置兴趣点来丰富停点的内容。

同时,轨迹挖掘领域挖掘出的具有语义特性的知识(大多数也是基于轨迹的时空属性展开的,数据处理量大,费时),也可以看作一种语义轨迹,但是这种知识距离使用也很远。

2、 本文工作:A、由上至下(Top-down)的轨迹模型(同时包含集合属性和语义属性);B、轨迹计算:由下至上(down-top)将原始GPS轨迹通过计算(设计轨迹预处理、分段、停点挖掘算法)转化为语义轨迹(移动,停止模型,并结合现实世界的语义知识);C、基于语义轨迹,设计轨迹模式挖掘算法(不同于基于原始数据的方法)。

3、 子包含的轨迹语义模型:包含三类知识,轨迹的几何属性(RMD - Raw Movement Data);周围的地理数据(GD - Geographic Data);与具体应用相关的领域知识(ADD - Application Domain Data)。

则:轨迹的语义表示方式如下:(注:为了支持自动推理,文中提出了本体库)

语义轨迹的表示方法:起点,移动,停点,终点。

4、 轨迹计算:包括轨迹分段、停点挖掘,以及使用外部地理数据和应用相关的数据丰富轨迹数据(将起点、停点、重点等表示为地标数据)

5、 语义轨迹挖掘:同传统挖掘算法的差别是,输入为语义轨迹(起始、终点,重要的停点等)大大降低了数据量。

你可能感兴趣的:(语义轨迹数据分析:一种概念和计算方法)