——>为了解决上述时空特性,大量的研究工作设计了数十种时空轨迹相似度测量方法。
轨迹 T 是一个由 GPS 采样点组成的有序序列
表示id为i的轨迹,
表示id为i的轨迹的第j个点
每个采样点pi是是二维或三维(即(纬度,经度)或(纬度,经度,时间戳))
G=
vi表示路网中的一个交叉点
是一条有向边
f(Ti,Tj),用于测量Ti和Tj的距离
给定相似性测量f和三条轨迹Ti,Tj和Ta
表1 中 metric 那一列就是表示这种测量方法是不是度量测量(✔是 × 否 / 表示基于learning的方法不需要考量这个)
和查询轨迹QT最相似的k条轨迹(不包括本身)
论文正文中说ED是parameter-free的,所以这边我觉得应该是图标错了
. Efficient retrieval of similar time sequences under time warping ICDE 1998
Head(T) 表示Tn不要了,之前的部分
Discovering similar multidimensional trajectories 2002
Robust and fast similarity search ¨ for moving object trajectories. SIGMOD 2005
前4个详细的可见:轨迹相似度整理_python 轨迹相似度_UQI-LIUWJ的博客-CSDN博客
On the marriage of lp-norms and edit distance VLDB 2004
Clustering of vehicle trajectories
从一个轨迹中的某一点到另一个轨迹中最近点的所有距离值中的最大距离
数学笔记/scipy 笔记:豪斯多夫距离(Hausdorff )_python 豪斯多夫距离_UQI-LIUWJ的博客-CSDN博客
Computing the fr´echet distance between two polygonal curves. Int. J. Comput. Geom. Appl. 1995
Frechet [2] 是通过走狗的例子来提出的。假设一个人用皮带遛狗。虽然这个人和他的狗可能有不同的轨迹,但他们移动的方向是相同的。两个轨迹(人和狗)之间的 Frechet 距离是所需皮带的最短长度
算法笔记:Frechet距离度量_UQI-LIUWJ的博客-CSDN博客
Indexing and matching trajectories under inconsistent sampling rates ICDE 2015
两个轨迹 T1 和 T2 之间的 EDwP 距离定义为:
Similarity search in trajectory databases TIME 2007
轨迹相似度整理_python 轨迹相似度_UQI-LIUWJ的博客-CSDN博客
LIP 进一步可以扩展到一个具有时空性(即,考虑时间因素)的距离,称为 STLIP
SPSTLIP :速度模式时空距离。
Index-based most similar trajectory search ICDE 2007
Distri VLDB 2017buted trajectory similarity search
Road network inference from GPS traces using DTW algorithm ITSC 2014
Spatio-temporal trajectory similarity learning in road networks KDD 2022
Fast subtrajectory similarity search in road networks under weighted edit distance constraints VLDB 2020
.Fast subtrajectory similarity search in road networks under weighted edit distance constraints VLDB 2020
Trajectory similarity join in spatial networks VLDB 2017
Torch: A search engine for trajectory data SIGIR 2018
计算重叠边(路段)的长度
路段版的LCSS
两条轨迹中的最长公共路段
Distributed in-memory trajectory similarity search and join on road network 2019 ICDE (yuan haitao)
Distributed in-memory trajectory similarity search and join on road network 2019 ICDE (yuan haitao)
Computing trajectory similarity in linear time ICDE 2019 (Cong Gao)
为了提高深度表示学习方法在长轨迹上的性能TrajGAT基于图注意力网络(GATs)、Transformer 和四叉树索引,以有效地嵌入轨迹
Trajectory similarity learning with auxiliary supervision and optimal matching IJCAI 2020
A graph-based approach for trajectory similarity computation in spatial networks. KDD 2021
Spatio-temporal trajectory similarity learning in road networks KDD 2022
ST2Vec 采用了具有 O(d) 时间复杂度的模型来捕获空间和时间特征。
它基于GNN和LSTM将这些特征融合,从而获得基于时空的嵌入向量。
从四个性能方面研究每种度量的能力
使用四个真实世界的轨迹数据集:
执行top50 查询的时间
分别统计了训练时间(Ttra)和查询时间Q
总体而言,在评估度量相似性度量的性能之前,有必要构建索引并探索基于三角不等式的剪枝,因为这些辅助技术可能会大大提高度量相似性度量的有效性。
大多数轨迹相似性度量的效果受到数据集分布和特性的极大影响。具体来说,Frechet、Hausdorff、LCRS 和 LORS 在不同的数据集中始终表现良好和稳定;而 ERP 表现最差。
大多数度量仅计算轨迹的空间距离来衡量相似性;然而,当直接扩展到时间距离时(即使时间成本很高),它们在时空场景中也表现得非常有效。
基于点的度量在自由空间中表现更好;而基于段的度量在道路网络中更有效。此外,一些度量(例如,DTW 和 LCSS)在自由空间中可以直接扩展到道路网络,并保持良好的性能;而其他一些(例如,EDR 和 ERP)不适合调整到道路网络,这会影响其鲁棒性。
对于度量相似性度量,构建索引和探索基于三角不等式的剪枝可能有助于显著提高其效率。
在大多数情况下,基于学习的度量在不同规模的数据集上具有更高的时间消耗鲁棒性。基于单机的度量具有明显较低的效率和可扩展性,但具有更高的有效性。总体而言,基于分布式的度量能够在确保基于单机度量的高有效性的同时,提高时间性能,这在轨迹相似性度量的研究中具有前景。
轨迹数据包括空间和时间信息。然而,现有的大多数轨迹相似性度量仅考虑空间信息,而只有TP 考虑了空间和时间信息。此外,TP的时间复杂度很高,因此无法有效地应用于需要捕捉时间依赖特性的下游任务(例如,交通流预测)。因此,设计考虑空间和时间信息的高效轨迹相似性度量是一个有趣的研究方向。
随着位置服务和定位技术的广泛应用,大量的GPS轨迹数据作为流数据持续地被收集,这使得轨迹相似性计算更具挑战性。然而,现有的度量非常耗时,无法满足下游任务(例如,拼车)的实时需求。因此,实时或在线轨迹相似性计算也是一个潜在的研究方向。
由于私人位置信息的敏感性,在处理轨迹时需要保护隐私。现有的轨迹相似性度量没有考虑数据隐私,而且直接应用现有的度量以实现高查询效率/质量同时实现隐私保护是低效的。因此,在保护隐私的同时实现有效和高效的相似性计算也是一个值得关注的方向。
轨迹相似性计算的目标是为了促进下游的轨迹分析。由于存在各种相似性度量,如何为不同的分析任务选择合适的度量是非常重要的。例如,大多数现有的相似性度量(如DTW,NetERP等)是为轨迹检索和聚类设计的,但对于异常检测等任务则效果不佳。因此,将相似性度量的选择与下游任务相结合以提高轨迹分析的效果是一个有前途的方向。