相似性方法调研

目录

  • 时空轨迹相似性度量方法综述
  • 基于轨迹点的相似性度量方法
  • 全局匹配度量法
  • 局部匹配度量法
  • 基于轨迹段的相似性度量方法
  • 几个要注意的指标

时空轨迹相似性度量方法:

  • 基于轨迹点的相似性度量方法;(一般也成为distance-based)

基于轨迹的相似性度量方法充分考虑了轨迹的局部信息,精确度比较高,但是时间复杂度达到了O(m×n),其中n和m为轨迹点个数。

  • 基于轨迹段的相似性度量方法。(ε-threshold-based)

基于轨迹段相似性度量通过对轨迹进行分段,然后分别比较每一段的相似性,大大降低了时间复杂度。但是没有充分考虑轨迹的局部信息,因此精确率比较低

以上方法都是把时间属性作为简单的时间序列来处理。时间属性属于重要的属性只一,把空间和时间属性结合将作为时空轨迹相似性度量的一个判断标准,使相似性度量方法更加完善。

基于轨迹点的相似性度量方法

基于轨迹点的相似性度量方法又分为全局匹配度量法局部匹配度量法

全局匹配度度量:要求两条轨迹整体相似。,即轨迹中的每个点都需要找到对应的匹配点,每个点对之间的距离都是相似性度量值的一部分。具体方法有:Euclid、DTW、ERP。

局部匹配度量法:只要求两条轨迹部分相似。无需轨迹中的每个点都找到对应的匹配点,而且只有部分匹配点之间的距离作为相似性结果的一部分。具体方法有:EDR、LCSS、k-BCT、LCS、CATS。

全局匹配度量法

1. Euclid:欧氏距离法则

主要过程是通过计算轨迹之间对应点之间的欧式距离,然后累加求和作为最后的度量值。计算方式最简单

2. ERP:编辑距离法 Edit Distance on Real Penalty

编辑距离原本是指通过对字符串进行增、删、改等操作,使其中一个字符串与另一个字符串完全相同所需要的最小操作次数.

3. DTW:动态时间扭曲法则 Dynamic Time Warping

对轨迹进行局部的拉伸或者缩放,从而可以对不同采样率和不同长度的轨迹进行比较,DWT距离就是所有最优匹配轨迹点间距离的累加和。DTW通过递归迭代的方式来计算轨迹之间的距离。时间复杂度O(m×n)


欧式距离是最简单的,只需要累加求和,时间复杂度O(n),满足三角不等式的检索方法(MVP树,M树,Sa树)。但是局限性也很大:①采样率、轨迹点必须一致;②你须满足单调连续原则且不支持局部时间扭曲;③对噪声敏感。

DTW和ERP可以对局部进行拉伸或者缩放,从而可以对不同采样率和不同长度的轨迹进行度量。他们之间的区别是:①DTW的轨迹点找到匹配的点之后,直接计算出两个轨迹点的距离作为相似性结果的一部分;②而ERP发现该轨迹点与匹配点的距离超过阈值的时候,并不计算该店与匹配点之间的距离,二十计算该点与一个特定点(如原点之间的距离)来替代该店与匹配点之间的距离,从而减少噪声的影响

只有两条轨迹整体相似是才能被全局匹配度量法判定为相似。

局部匹配度量法

1. EDR:编辑距离法 Edit Distance on Real sequence

需要计算两条轨迹中每个轨迹点与对应匹配点之间的距离,时间复杂度为O(m×n)。

EDR通过将元素之间的距离量化为0 1两个值来消除噪声影响。因为每个异常值只可能是EDR值上升1,因此比DTW和ERP更加鲁棒。由于EDR将距离量化,导致了EDR不满足三角不等式,从而不可以使用传统的基于距离的索引方法

2. LCSS:最长公共子序列 Longest Common Subsequence

主要考虑轨迹之间相似的部分作为轨迹相 似性的度量,因此对于一些因匹配距离超过阈值的轨迹点可以跳过,这样的特征使它对噪声具有鲁棒性。但是它不考虑相似子序列之间不相似部分,会导致判断不准确


EDR将距离量化成0 1,因此带来了一个优点和一个缺点:① 对噪声的鲁棒性相较于DTW和ERP更加鲁棒;②但是EDR不满足三角不等式,从而不可以使用传统的基于距离的索引方法。

LCSS具有以下优点:①对采样率没有要求;②不要求进轨迹的长度相等;③因为LCSS只关注时空上都比较接近的点对(否则会被跳过),所以不需要对每个轨迹点进行匹配,对噪声点更具有鲁棒性。但是也有一些缺点:①也是把距离量化成0 1,因此不满足三角不等式;②只关注相似的部分,会导致判断不准确。

3. Fréchet:弗雷歇距离度量法

弗雷歇距离度量法(Fréchet distance)由 Fréchet等人提出,通常以直观的方式描述:人遛狗时 的狗绳距离 。


image.png

4.CATS:Clue-Aware Trajectory Similarity

image.png

由于轨迹在采集的时候可能会存在大量采样点缺 失的轨迹段,而对象的同一种运动行为形成的轨迹在空 间上和时间上应该都比较接近,因此Hung等人通过识别 时空上相似的轨迹,而推断出轨迹中缺失采样点 [16] 。 如图10所示,前三条轨迹的采样点缺失十分严重,通过 CATS(CATS: Clue-Aware Trajectory Similarity)方 法,可以找出同一模式的轨迹,将他们的采样点相互补 充,得到一条采样完整的轨迹。CATS可以支持局部时间 扭曲,对轨迹的采样率和长度都没有要求,并且对噪声 具有鲁棒性。

基于轨迹段的相似性度量方法

1.豪斯多夫距离法 (Hausdorff)

Lee等人 [18] 提出了基于轨迹的豪斯多夫距离方法, 主要由三部分组成:①垂直距离,②平行距离,③角距 离。该方法分别从平行距离,垂直距离和角距离3个方 面对轨迹段之间的距离进行计算,比最小边界矩形法考 虑的更加全面,精度更高,时间复杂度为O (m ×n ),其 中m 、n 分别为两条轨迹的轨迹段个数。q

几个要注意的指标

形成最终方案时要一般考虑的问题:local time shifting、retrieval efficiency、metric distance、various gap、low bounds。

你可能感兴趣的:(相似性方法调研)