UQI-LIUWJ

论文笔记：Spatio-Temporal Trajectory Similarity Measures: AComprehensive Survey and Quantitative Study

1 intro

1.1 背景

轨迹相似度测量在很多应用中都起着基础性的作用
- 不同的测量选择可能导致完全不同的结果和质量
  - 以轨迹聚类为例，聚类旨在将相似的轨迹分组到集群中，其中相似度计算是聚类的基础任务
  - DTW和EDR聚类的效果千差万别

1.1.1 轨迹相似度需要考量的四个轨迹特性

与孤立的空间点或一维时间序列不同（这些距离定义是直接了当的）定义连续二维轨迹之间的距离并非易事。还需要考虑以下四个轨迹特性
- 不同的数据源（自由空间与道路网络空间）
  - 在后一种情况下，适当的轨迹测量应考虑道路拓扑结构，因为人和车辆不能像没有空间限制的船舶一样行驶
- 各种采样率和长度
  - 与通常具有恒定和高采样率的时间序列不同，时空轨迹数据通常是通过不同的采样生成的，导致长度可变
- 噪声的影响
  - 噪声点通常存在，尤其是由于城市中的强度衰减和干扰
- 复杂的形状
  - 与通常由于隐私原则而无法访问的私家车轨迹相比，出租车轨迹在社区中得到了广泛的研究
  - 然而，出租车轨迹展示了更多样化、复杂和灵活的几何形状，这是因为各种接送需求

——>为了解决上述时空特性，大量的研究工作设计了数十种时空轨迹相似度测量方法。

1.1.2 如何选择轨迹相似度测量方法？

面对大量的轨迹测量方法，研究人员往往感到太累而无法选择一个合适的。
- 一方面，有太多的轨迹测量方法，这些方法是在不同场景下提出的
  - 基于学习或非基于学习（non-learning）
  - 面向自由空间或面向道路网络
  - 独立处理或分布式处理
- 另一方面，对各种轨迹测量方法的评估仍然没有很好地组织
  - 有些测量方法只关注效率，而其他可能更注重有效性和鲁棒性
——>论文以分层的方式对1995年至2022年提出的现有代表性的时空轨迹测量方法进行分类，即非学习 vs 学习（第一层次），自由空间 vs 道路网络（第二层次），以及独立 vs 分布式（第三层次）

1.2 之前综述论文的不足 & 论文的研究架构

之前的综述主要关注非学习、自由空间或基于独立措施（不分布式）的轨迹相似性
- 大大缩小了研究的范围
论文以三维层次方式，对最常见和具有代表性的时空轨迹测量进行了回顾和评估
- learning VS non-learning
  - 近些年许多研究尝试用基于学习的模型替代传统的手工轨迹测量
- free space VS road network
  - 在早期阶段，大多数轨迹测量是为在欧几里得空间中自由移动的物体设计的，例如鸟或船的轨迹
  - 近年来，车辆导航系统和基于位置的服务（LBS）的普及使得在道路网络中大量收集车辆和人员轨迹成为可能。
    - 在这种情况下，面向自由空间的轨迹测量不能反映在受限制的道路网络中移动物体之间的真实距离
- 基于单机的 VS 分布式的
  - 由于单台机器的存储容量和处理能力已经无法支持大规模的轨迹数据，另一个流行的轨迹相似性研究方向是在分布式处理平台（例如，Spark）上设计高效和可扩展的框架，以进行大规模轨迹相似性分析

2 preliminary

2.1 轨迹

轨迹 T 是一个由 GPS 采样点组成的有序序列 $T=<p_1,p_2,\ddots,p_n>$

表示id为i的轨迹，表示id为i的轨迹的第j个点

每个采样点pi是是二维或三维（即（纬度，经度）或（纬度，经度，时间戳））

2.2 道路网络

vi表示路网中的一个交叉点

$e_{i,j}$ 是一条有向边

2.3 相似性测量

f(Ti,Tj)，用于测量Ti和Tj的距离

2.4 度量测量

给定相似性测量f和三条轨迹Ti，Tj和Ta

如果f满足以下条件，那么称f为一个度量测量
- 唯一性
  - $f(T_i,T_j) \leftrightarrow T_i=T_j$
- 非负性
  - $f(T_i,T_j) \ge 0$
- 三角不等式
  - $f(T_i,T_a) \le f(T_i,T_j) + f(T_j,T_a)$
- 对称性

表1 中 metric 那一列就是表示这种测量方法是不是度量测量（✔是 × 否 / 表示基于learning的方法不需要考量这个）

2.5 Top-K 相似性

和查询轨迹QT最相似的k条轨迹（不包括本身）

3 不基于learning的方法

3.1 自由空间的轨迹相似度

3.1.1 基于点的测量方法

3.1.1.1 欧几里得距离

论文正文中说ED是parameter-free的，所以这边我觉得应该是图标错了

3.1.1.2 DTW

. Efficient retrieval of similar time sequences under time warping ICDE 1998

Head(T) 表示Tn不要了，之前的部分

3.1.1.3 LCSS

Discovering similar multidimensional trajectories 2002

3.1.1.4 EDR （编辑距离）

Robust and fast similarity search ¨ for moving object trajectories. SIGMOD 2005

前4个详细的可见：轨迹相似度整理_python 轨迹相似度_UQI-LIUWJ的博客-CSDN博客

3.1.1.5 ERP（实数惩罚编辑距离）

On the marriage of lp-norms and edit distance VLDB 2004

（

上述基于编辑距离的测量方法基本上都不是度量的
ERP是一种可以用于索引和剪枝的度量测量方法
与 LCSS 和 EDR 等其他基于编辑距离的测量方法不同，ERP 不需要阈值参数，而是设置一个参考点r进行测量

3.1.1.6 豪斯多夫距离 TITS 2010

Clustering of vehicle trajectories

从一个轨迹中的某一点到另一个轨迹中最近点的所有距离值中的最大距离

数学笔记/scipy 笔记：豪斯多夫距离（Hausdorff ）_python 豪斯多夫距离_UQI-LIUWJ的博客-CSDN博客

3.1.1.7 Frechet 距离

Computing the fr´echet distance between two polygonal curves. Int. J. Comput. Geom. Appl. 1995

Frechet [2] 是通过走狗的例子来提出的。假设一个人用皮带遛狗。虽然这个人和他的狗可能有不同的轨迹，但他们移动的方向是相同的。两个轨迹（人和狗）之间的 Frechet 距离是所需皮带的最短长度

由于 Frechet 距离是非度量的，因此提出了许多变体来使其成为度量。
- 最常见的一个是离散 Frechet 距离 [70]，时间复杂度为 O(mn)
- 在本文的其余部分中使用“Frechet”距离来表示离散 Frechet 距离

3.1.1.8 分布式设定

3.1.1.8.1 DITA

DITA（Distributed In-memory Trajectory Analytics，分布式内存轨迹分析系统）使用了几种经典的基于点的测量方法，如DTW和Frechet。
DITA选择了STR分区算法来对轨迹点进行分区。
使用R树作为局部索引，并设计了一个类似字典树（Trie）的索引作为全局索引。
相应地，在局部索引中也使用了类似字典树的分区算法，并开发了几种剪枝优化方法来提高分布式环境中相似度搜索和连接的效率。

3.1.1.8.2 REPOSE

REPOSE是一个用于轨迹相似性搜索的分布式内存系统
- 支持多种距离测量方法，包括 Hausdorff、Frechet、DTW、LCSS、EDR 和 ERP。
将轨迹离散化为参考轨迹，并在参考轨迹的参考点上构建一个类似字典树（即 RP-Tree）的索引
REPOSE 倾向于尽可能将相似的轨迹划分到不同的分区中，以实现负载均衡。

算法笔记：Frechet距离度量_UQI-LIUWJ的博客-CSDN博客

3.1.2 基于线段的方法

3.1.2.1 Edit Distance with Projections (EDwP)

Indexing and matching trajectories under inconsistent sampling rates ICDE 2015

采用无参数方法，并通过动态插值和投影来适应非均匀采样率。
- 将轨迹点转换为线段，并使用插入和替换操作来计算编辑距离

两个轨迹 T1 和 T2 之间的 EDwP 距离定义为：

rep和ins分别表示替换和插入操作
这里和前面的EDR是有一点去别的（EDR替换之外的操作是删除，所以需要+1；这边替换之外的操作是插入，之后还要考虑的【只不过下一步考虑的时候，替换操作加的内容是0】，所以不用加什么数值）
- 替换的两截轨迹起始点之间的距离+终止点之间的距离
- 替换的成本：两截轨迹的长度之和

3.1.2.2 多线位置距离（Locality In-between Polylines，LIP）

Similarity search in trajectory databases TIME 2007

轨迹相似度整理_python 轨迹相似度_UQI-LIUWJ的博客-CSDN博客

LIP 进一步可以扩展到一个具有时空性（即，考虑时间因素）的距离，称为 STLIP

SPSTLIP ：速度模式时空距离。

3.1.2.3 One-way Distance (OWD) 单向距离

Index-based most similar trajectory search ICDE 2007

OWD 支持两种轨迹表示（即，线性表示和网格表示）
将基于点的轨迹数据转换为基于段的数据。
- 测量从一条轨迹中的每个点到另一条轨迹的平均最小距离

考虑到线性表示的高计算成本O(mn)，OWD 被扩展到称为的网格表示
- 轨迹点根据其空间信息映射到网格单元中
- 只计算网格单元（而不是样本点）和基于网格的轨迹之间的距离
- 时间复杂度降低到 O(m′n′)，其中 m′ 和 n′ 分别表示两条轨迹占用的网格单元数

3.1.2.4 Seg-Frechet and Seg-Hausdorff

受到 Fréchet 和 Hausdorff 距离的启发，Seg-Fréchet 和 Seg-Hausdorff 在计算 Fréchet 和 Hausdorff 距离时，将点改为线段进行计算
这种变化主要是为了更好地适应那些基于线段而非点的轨迹数据。
- 例如，在车辆或人员移动的场景中，通常更关心沿一定路径的移动，而这一路径可以用一系列线段来表示。
- 因此，通过将 Fréchet 和 Hausdorff 距离扩展到线段，可以更准确地描述这类轨迹之间的相似性或差异。

3.1.2.5 分布式框架

基于 Spark 开发了一个支持 Seg-Fréchet 和 Seg-Hausdorff 测量的分布式框架（即，DFT）
- DFT 使用 STR 分区算法来分区线段，同时构建一个双 R-树作为全局索引和一个通用 R-树作为局部索引。
- DFT 是第一个支持快速轨迹相似性计算的分布式方法。

Distri VLDB 2017buted trajectory similarity search

这种分布式框架主要是为了应对大规模轨迹数据的处理需求。
- 通过在 Spark 上实现这一框架，DFT 能够充分利用分布式计算资源，以实现更高的计算效率和可扩展性。
- STR 分区算法和 R-树索引进一步提高了查询效率，使得该框架能够快速地处理复杂的轨迹相似性查询。
- 这对于需要在大数据环境下进行轨迹分析的应用场景（如城市交通管理、社交网络分析等）来说，具有很高的实用价值。

3.2 路网的轨迹相似度

3.2.1 基于点的测量

3.2.1.1 NetERP、NetEDR、NetDTW 和 NetLCSS

从自由空间中的经典度量扩展而来的
- 首先将原始轨迹映射到由顶点或线段组成的路网路径上
- 然后基于经典的距离度量（如 ERP、EDR、DTW 和 LCSS）定义相似性度量
  - 值得注意的是，这些度量采用图中两个路口之间的最短路径距离（而不是欧几里得距离）
NetERP、NetEDR、NetDTW 和 NetLCSS 具有与相应的经典度量相同的特点

Road network inference from GPS traces using DTW algorithm ITSC 2014

Spatio-temporal trajectory similarity learning in road networks KDD 2022

Fast subtrajectory similarity search in road networks under weighted edit distance constraints VLDB 2020

.Fast subtrajectory similarity search in road networks under weighted edit distance constraints VLDB 2020

3.2.1.2 TP

Trajectory similarity join in spatial networks VLDB 2017

同时考虑时空相似度，记每个点为一个三维向量 v=(p,t)=((lat,lon),timestamp)
每个点到另一条轨迹的时空距离：
- 这里也是路径距离
两条轨迹的时 or 空相似度
- 每一条轨迹每一个点到另一条轨迹的平均时间/空间距离
两条轨迹的时空相似度
- $Sim_{ST}(T_1,T_2)=\lambda Sim_S(T_1,T_2)+(1-\lambda)Sim_T(T_1,T_2)$

3.2.2 基于路段的测量

3.2.2.1 Longest Overlapping Road Segments (LORS)

Torch: A search engine for trajectory data SIGIR 2018

计算重叠边（路段）的长度

3.2.2.2 Longest Common Road Segments (LCRS)

路段版的LCSS

两条轨迹中的最长公共路段

Distributed in-memory trajectory similarity search and join on road network 2019 ICDE (yuan haitao)

3.2.2.3 分布式版本

将独立的 LCRS 扩展到一个名为 DISON 的分布式框架，该框架支持基于路网约束的相似性搜索和连接。
DISON 首先使用 STR 分区算法对路段进行分区，然后构建一个两层索引，其中哈希映射用作全局索引，而倒排索引用作局部索引。
需要注意的是，DISON 是用于路网中相似性度量的唯一分布式框架。

Distributed in-memory trajectory similarity search and join on road network 2019 ICDE (yuan haitao)

4 基于learning的方法

非learning的方法一般复杂度都比较高
- learning的方法主要把高维输入数据重构为低维表征
t2vec设计了一个轨迹深度学习框架
- 将一个轨迹映射到一个 d-维嵌入向量中。
- 需要注意的是，t2vec 不是一种相似性度量，而是一种将轨迹转换成向量的表示方法。
受到 t2vec 的启发，许多研究在自由空间和路网中采用不同的深度学习框架，以学习非学习度量的近似距离函数。
- 通常，如图 9 所示，它们首先选择锚轨迹（原始轨迹）的相似和不相似轨迹（即正轨迹和负轨迹）
- 然后，提取特征（就空间、时间、结构等方面而言），同时使用深度表示学习生成轨迹嵌入向量。
- 最后，当在嵌入向量上评估的轨迹相似性和不相似性接近ground-truth时，学习（图 9 中的虚线矩形）可以停止。
需要注意的是，向量间相似性学习的时间复杂性是线性的

4.1 基于自由空间的

4.1.1 NEUTRAJ

Computing trajectory similarity in linear time ICDE 2019 (Cong Gao)

NEUTRAJ 首先将轨迹映射为网格轨迹（grid-trajectories）
- —》由 NEUTRAJ 生成的嵌入向量可以保留轨迹的空间信息
然后抽样轨迹作为种子，使用它们的成对相似性和不相似性作为指导。
最后，NEUTRAJ 使用LSTM来生成嵌入向量，以O(m+n) 的复杂性近似各种非学习相似性计算）。

4.1.1.1 TrajGAT

为了提高深度表示学习方法在长轨迹上的性能TrajGAT基于图注意力网络（GATs）、Transformer 和四叉树索引，以有效地嵌入轨迹

4.1.2 Traj2SimVec

Trajectory similarity learning with auxiliary supervision and optimal matching IJCAI 2020

与 NEUTRAJ 不同，Traj2SimVec 通过将训练轨迹简化为三元组训练样本（triplet training samples。
- 三元组通常包括一个"锚点"轨迹、一个与锚点相似的"正"轨迹，以及一个与锚点不相似的"负"轨迹。
- 通过这种方式，Traj2SimVec 能够将训练时间复杂度降低到 O(logn)，其中 n 是训练轨迹的平均长度。
类似于 Traj2SimVec，还有基于注意力网络的方法，如 T3S 和 TMN。
- T3S 考虑到了不相似的轨迹
- TMN 主要关注轨迹之间的相互信息。

4.2 基于路网

4.2.1 GTS

A graph-based approach for trajectory similarity computation in spatial networks. KDD 2021

GTS (Graph Trajectory Similarity) 是一个基于GNN的方法
- 与上述两种在自由空间中设计的方法不同，GTS 考虑到了道路网络的特殊性
- 为了反映道路网络上的信息，GTS 学习了空间网络中POI的表示以及轨迹之间、POI 之间，以及轨迹与 POI 之间的关系
  - ——>更准确地量化在具有路网约束的环境中轨迹的相似性

4.2.2 ST2Vec

Spatio-temporal trajectory similarity learning in road networks KDD 2022

ST2Vec 采用了具有 O(d) 时间复杂度的模型来捕获空间和时间特征。

它基于GNN和LSTM将这些特征融合，从而获得基于时空的嵌入向量。

5 评价标准

从四个性能方面研究每种度量的能力

5.1 有效性与长度和形状

由于两个轨迹的相似性没有一个基准真值，我们无法确定由轨迹度量计算出的值是否正确
- 不同度量返回的距离值进行交叉比较也是没有意义的
——>我们采用定性的方式，将不同轨迹度量返回的相同查询轨迹的 Top-k 相似性查询结果进行可视化
- 当查询轨迹的长度或形状不同时，提供一种直观的分析，以展示每种度量的有效性
  - 使用参数 L 来改变轨迹长度
    - L=20 意味着从原始轨迹中选择前 20% 的点作为一个变形轨迹
    - 这种以长度为导向的评估使我们能够看到每种距离度量在轨迹长度从短到长变化时的表现
    - 这在涉及轨迹演化的在线设置中是有用的
  - 在不同形状方面，我们选择了四种典型的几何形状
    - 直线
    - 无重叠的折线
    - 有重叠的折线
    - 圆形线

5.2 稳健性与采样和噪声

对于一个给定的查询轨迹，一个稳健的轨迹相似度度量应该能够为具有不同采样率和噪声比例的数据集检索相同的查询结果
- 使用参数 S 来表示每条轨迹中采样点的百分比
  - S=20 表示我们从轨迹中采样20%的点作为一个变形轨迹
  - 对于自由空间轨迹，采样转换是有意义和有用的，而对于经过地图匹配后的受路网约束的轨迹则是无意义和无用的
    - 在自由空间轨迹中，每个点都是独立的，并且它们之间没有任何预定义的关系（除了可能的时间先后关系）
      - 这样，采样转换（即从轨迹中随机或按照某种规则选择一定比例的点）通常不会改变轨迹的基本特性或形状
    - 然而，在受路网约束的轨迹中，情况就有所不同。
      - 这些轨迹通常是由一系列沿着特定路网图的顶点或边生成的。
      - 在这种情况下，简单地从轨迹中随机抽取点可能会导致信息丢失（如路由信息）或误导，因为这些点通常是沿着特定的路线或路径捕获的。
      - 采样可能会打破这些内在的路径依赖关系，从而导致不准确或无意义的相似度计算。
  使用参数 N 来表示整条轨迹中噪声的比例
  - N=10 表示从轨迹中抽样10%的点，然后为每个点添加一个异常值
  - 使用高斯噪声

5.3效率与 Top-k 查询

一个高效的轨迹相似度度量应该能够有效地计算任意一对轨迹之间的距离值，这对于在线轨迹应用尤为重要。
因此，直接使用 Top-k 相似性查询作为评估任务

5.4 可扩展性与长度和基数

无论轨迹数据集的平均轨迹长度或数据基数（即，移动对象的数量）如何变化，一个可扩展的度量应该显示稳定的轨迹间距离计算性能
- 使用 L(%) 来控制数据集中轨迹的平均长度
- 使用另一个参数 Or 来控制所有对象中移动对象的百分比，即要查询/处理的轨迹数量

6 实验

6.1 实验配置

6.1.1 数据集

使用四个真实世界的轨迹数据集：

AIS 记录了美国和国际水域内船只的位置。我们使用的数据范围是从2019年1月1日到12月1日。样本间隔在1到90秒之间不等。
Geolife 包含了约2500万个GPS点，这些点是从2007年4月到2012年8月在北京的182名行人中收集的。样本间隔是2秒。Geolife 记录了用户不同的出行方式，因此，轨迹的速度差异很大。
T-Drive 包括了由10357辆出租车在2008年2月2日至2月8日间在北京生成的150万个GPS点。样本间隔在1到177秒之间不等。
Porto 包含了由442辆出租车在2011年8月到2012年4月间在葡萄牙波尔图生成的170万个GPS点。样本间隔是15秒。

四个数据集的可视化展示在图10中。
- 与Geolife收集的GPS点相比，AIS收集的GPS点具有更广泛的空间覆盖范围，并且分布更不均匀。
- 由于船只和行人在自由空间中移动，而出租车沿着道路网络移动，我们使用AIS和Geolife来评估面向自由空间的轨迹度量，使用T-Drive和Porto来评估受道路网络约束的轨迹度量。
移除了包含少于5个GPS点的轨迹，并使用地图匹配将所有在T-Drive和Porto上的轨迹与从OpenStreetMap 中提取的相应道路网络进行匹配。
在分布式设置中，随机选择了50,000条轨迹进行评估。
AIS、Geolife、T-Drive和Porto的平均长度分别是512、343、150和58。
由于相似性计算的高复杂性和单一机器的局限性，从总共50,000条轨迹中随机选择了10,000条轨迹进行单机处理模式下的评估。

6.1.1 实验设计

非基于学习的度量
- 评估了17个独立的度量：DTW、LCSS、EDR、EDwP、ERP、Hausdorff、Frechet、LIP、OWD、Seg-Frechet、LORS、TP、NetERP、NetEDR、NetDTW、NetLCSS 和 LCRS，考虑其有效性、鲁棒性、效率和可扩展性
- 只在效率和可扩展性方面评估了四个分布式度量：DFT、DITA、REPOSE 和 DISON
  - 因为分布式实现仅通过如并行化和分区等技术来提高时间性能，而没有修改度量本身
基于学习的度量
- 所有基于学习的度量，即 NEUTRAJ 、Traj2SimVec 、GTS 和 ST2Vec 都是基于单机的
  - 在有效性、鲁棒性、效率和可扩展性方面对它们进行了评估
- 需要注意的是，基于学习的模型的目标是近似由非学习度量计算的轨迹间相似性，而所有现有的基于学习的度量只能支持基于点的相似性学习
  - 因此，对于每一种基于学习的度量，我证了其在自由空间中近似基于点的轨迹相似性度量（包括 DTW、LCSS、EDR、EDwP、ERP、Hausdorff 和 Frechet）以及在道路网络中（包括 NetDTW、NetLCSS、NetERP 和 TP）的能力

6.2 有效性

6.2.1 非基于学习的测量

6.2.1.1 长度的影响

给定查询轨迹 QT（用红线表示）的 Top-1 查询结果，其中 QT 的长度与其整体长度的比例从 20% 变化到 100%。
只评估 AIS 和 Geolife 上的自由空间导向度量。
通过可视化查询轨迹和相应的 Top-1 查询结果之间的相似性越高，效果越好。、

对于 AIS，当L=100% 时
- 由 LCSS 和 Hausdorff 计算的结果几乎相同
- 而对于 DTW、Frechet、OWD 和 Seg-Frechet，则几乎相同。
对于 Geolife
- DTW、EDwP、OWD、Hausdorff、Frechet 和 Seg-Frechet 与 QT 的相同交通模式共享相似的结果
- 而只有 Hausdorff 返回与之相反方向的结果。
  - 这是因为 Hausdorff 是一个对称度量，不考虑轨迹的方向。

当 QT 的长度变化时
- DTW、EDwP、Hausdorff 和 OWD 在两个数据集上始终返回相同的结果
- 这表明它们可以灵活地适应于识别与具有不同长度的查询轨迹 QT 相关的相似轨迹
当 QT 的长度较小时
- EDR 的性能比其他度量差，即 EDR 所识别的结果与 QT 非常不同
  - 原因是 EDR 计算中不同编辑操作的成本相同，使其对轨迹长度（即轨迹点的数量）敏感
  - 具体来说，EDR 总是找到与查询轨迹 QT 长度相似的查询结果，即使该结果与 QT 在空间上相距遥远
由 LIP 计算的结果随着 QT 的长度而显著变化
- 这是因为结果在很大程度上依赖于 QT 和待检查轨迹的交点形成的多边形的形状，而这些形状显然受到 QT 长度的影响
在 AIS 上由所有度量识别的结果通常比在 Geolife 上的要好（即，与 QT 更相似）
- 这是因为 Geolife 中的每一条轨迹通常包含多种交通模式，并倾向于展示各种各样的特征

6.2.1.2 形状的影响

图 12 展示了四种不同查询轨迹（用红线表示）的 Top-1 查询结果，每一种都具有典型的空间形状
- 直线（表示为 QTs）
- 无重叠的折线（表示为 QTo1）
- 有重叠的折线（表示为 QTo2）
- 圆形（表示为 QTr）
仅评估 T-drive 和 Porto 上的受路网约束的相似性度量，因为由于路网的约束，车辆轨迹通常比自由空间轨迹具有更复杂的几何形状

直线【12(a) 和 (e)】
- 给定一个 QTs，只有 NetEDR 和 NetLCSS 返回包含与 QT 匹配对数量较多的往返轨迹，而所有其他度量都返回直线轨迹
  - 原因是 NetEDR 和 NetLCSS 不考虑轨迹的方向，而是考虑匹配对的数量。具体而言，匹配对越多，相似性越高
折线【图 12(b)、(c)、(f) 和 (g)】
- 除 NetEDR 外，所有度量都返回与其相似的结果
  - NetEDR 不考虑两点之间的空间距离
  - 相反，它通过比较它们的长度来识别相似的轨迹，即相似的长度导致更高的相似性
圆形【图 12(d) 和 (h)】
- 只有 LORS、LCRS 和 TP 返回带有圆形子轨迹的结果，其中 LORS 表现最好
  - 因为 LORS 能够识别重叠的道路段，这使得它能够有效地匹配具有圆形形状的轨迹

6.2.2 非基于学习的度量

通过学习型度量近似非学习型度量的能力来评估其有效性，非学习型度量是它们的目标。
- 给定一个查询轨迹 QT 和一个非学习型度量，使用该非学习型度量计算出的 Top-50 查询结果作为ground truth
- 实现一个学习型度量的模型以近似该非学习型度量，并应用所学度量来计算与 QT 相关的 Top-50 查询结果
- 使用 HR@50 来衡量由学习型度量返回的 Top-50 相似性查询结果与ground truth之间的重叠程度
  - HR@50 越高，有效性越高
在自由空间设置中
- Traj2SimVec 的性能优于 NEUTRAJ
  - Traj2SimVec 将轨迹简化为三元组（锚点、相似、不相似），增强了轨迹之间的相似性学习
- Traj2SimVec 在不同的相似性度量和不同的数据集之间的性能不稳定
  - (i) LCSS、EDR 和 ERP 是基于字符串的，其信息无法在嵌入中保留
  - (ii) AIS 的数据分布不均匀，而由于各种交通方式，Geolife 上的时空特征很复杂
GTS 和 ST2Vec 在路网设置中的 HR@50 都很稳定，且 ST2Vec 的性能优于 GTS
- ST2Vec 利用的空间信息（即路网）比 GTS（即 POI）更全面，而且 ST2Vec 能够有效地提取这些信息
在路网设置中，基于学习的度量更有效

6.3 鲁棒性

首先，我们通过一个相似性度量计算 QT 的 Top-50 相似轨迹，并将结果设置为ground-truth
其次，根据S和N（采样率，噪声比例），我们对原始数据集执行下采样或加噪操作，从而得到一组转换后的轨迹数据集
第三，我们对每个转换后的数据集中相同的查询轨迹 QT 执行 Top-50 相似性查询
最后，我们使用 HR@50 来衡量转换后的数据集上的 Top-50 相似性查询结果与ground-truth之间的重叠程度
- HR@50 越高，鲁棒性越强

6.3.1 基于非学习的度量

6.3.1.1 采样率

6.3.1.2 噪声

6.3.2 基于learning的方法

6.4 efficiency

执行top50 查询的时间

6.4.1 非学习的方法

(a)(b)
- LIP 时间复杂度为O((m+n)log(m+n)) 所以所需时间最短
- 其余大部分是O(mn)
- EdwP 在计算相似性的时候需要维护四个动态规划，所以最慢
(c)(d)
- LCRS和LORS 及计算重叠的路段数量，不需要计算路段之间的距离，所以执行的最快
- TP 还需要计算时间维度的距离，所以会慢一些
所有分布式的会执行的快一些

6.4.2 学习的方法

分别统计了训练时间（Ttra）和查询时间Q

基于学习的方法的平均查询时间比基于非学习的度量低 1-2 个数量级
在路网中，ST2Vec 的训练时间比 GTS 长，而它们的查询时间相似。
- 这是因为 ST2Vec 考虑了时间信息，这需要在模型训练期间进行计算

6.5 scalability

不同长度和不同查询轨迹数量下
- 分布式方法建立index的时间Tidx
- 基于学习的方法的训练时间Ttra
- 所有方法的Top-50查询时间Q

6.5.1 非学习的方法

6.5.1.1 单机方法

大多数单机度量（除了 LIP、LCRS 和 LORS）的查询时间随着轨迹长度或数据基数的增长而显著增加，可扩展性差
LIP 的查询时间随着数据基数的增长而略有增加
LCRS 和 LORS 的查询时间在数据基数从 60% 增加到 100% 时保持稳定。
- 这是因为 LCRS 和 LORS 通过计算一对轨迹的重叠路段数量来计算相似性，而不是计算它们的点或路顶点之间的成对距离。
- 这使得 LCRS 和 LORS 能够处理大型数据集

6.5.1.2 分布式方法

与图 17 和图 18 相比，当在两个数据集上变化轨迹长度和数据基数时，分布式度量实现了比单机度量更高的查询效率
DITA、REPOSE 和 DISON 的查询时间和索引构建时间在两个数据集的轨迹长度和基数上都变化得很温和；而 DFT 的这些时间随着轨迹长度和基数的增长而迅速增加
当在 AIS 和 Geolife 上变化轨迹长度和数据基数时，REPOSE 和 DITA 的查询时间总是优于 DFT。
- 这意味着分布式技术能够提高路网中相似性计算的可扩展性。

6.5.2 学习的方法

仅在 AIS 和 T-Drive 上评估基于学习的方法的可扩展性
- 由于空间限制以及它们比 Geolife 和 Porto 的尺寸更大
所有度量的查询时间随着轨迹长度和数据基数的增长而略有增加
训练时间则显著增加。
- 这是因为当轨迹长度或数据基数增加时，基于学习的方法需要更多的时间来捕获用于模型训练的采样点的信息
- 然后它们只需应用训练好的模型，以恒定的时间获得 Top-50 结果
基于学习的度量的查询时间远低于非基于学习的度量。
- 这表明基于学习的度量能够加速相似性计算

6.6 三角不等式和索引的影响

三角不等式和索引可以分别用于过滤不合格的结果和加速度量相似性度量的相似性计算，因此可以显著影响它们的性能。
- 评估基于三角不等式剪枝和不同索引结构对三种度量度量（ERP、Frechet 和 Hausdorff）性能的影响（非metric的无法比较）
- 具体来说，给定一个查询轨迹 QT，我们应用这三种度量来执行 Top-50 查询，并研究它们在分别使用LEASA、MVP-Tree和PM-Tree这三种索引结构时的索引构建时间（Tidx）、查询时间（Q）和剪枝率（ Prune Rate）
  - - TrajNumpruned：是被过滤轨迹的数量
    - TrajNumall 是轨迹的总数量
    - PruneRate 越高，剪枝性能越好
- HF 方法用于选择支点轨迹，其中支点数设置为 5
索引有助于减少所有度量度量的查询时间
- 查询时间低
- PruneRate 高
应用索引结构时，三种度量之间的搜索时间排名发生变化
- 如图 16(a) 所示，在 Frechet、ERP 和 Hausdorff 之间，当没有应用索引结构时，Frechet 在 AIS 上达到最高效率
- 如图 21(b) 所示，当使用 LEASA 和 MVPT 时，Hausdorff 在 AIS 上比 ERP 更高效
如图 21(a) 和 21(c) 所示，具有相同索引结构的不同度量的索引构建时间和剪枝性能是不同的
- Frechet 在构建索引上花费的时间较少，并且比 ERP 和 Hausdorff 具有更稳定和更高的 PruneRate

总体而言，在评估度量相似性度量的性能之前，有必要构建索引并探索基于三角不等式的剪枝，因为这些辅助技术可能会大大提高度量相似性度量的有效性。

6.7 ★★★★实验总结★★★★

大多数轨迹相似性度量的效果受到数据集分布和特性的极大影响。具体来说，Frechet、Hausdorff、LCRS 和 LORS 在不同的数据集中始终表现良好和稳定；而 ERP 表现最差。
大多数度量仅计算轨迹的空间距离来衡量相似性；然而，当直接扩展到时间距离时（即使时间成本很高），它们在时空场景中也表现得非常有效。
基于点的度量在自由空间中表现更好；而基于段的度量在道路网络中更有效。此外，一些度量（例如，DTW 和 LCSS）在自由空间中可以直接扩展到道路网络，并保持良好的性能；而其他一些（例如，EDR 和 ERP）不适合调整到道路网络，这会影响其鲁棒性。
对于度量相似性度量，构建索引和探索基于三角不等式的剪枝可能有助于显著提高其效率。
在大多数情况下，基于学习的度量在不同规模的数据集上具有更高的时间消耗鲁棒性。基于单机的度量具有明显较低的效率和可扩展性，但具有更高的有效性。总体而言，基于分布式的度量能够在确保基于单机度量的高有效性的同时，提高时间性能，这在轨迹相似性度量的研究中具有前景。

7 未来研究方向

7.1 时效性（Temporality）

轨迹数据包括空间和时间信息。然而，现有的大多数轨迹相似性度量仅考虑空间信息，而只有TP 考虑了空间和时间信息。此外，TP的时间复杂度很高，因此无法有效地应用于需要捕捉时间依赖特性的下游任务（例如，交通流预测）。因此，设计考虑空间和时间信息的高效轨迹相似性度量是一个有趣的研究方向。

7.2 及时性（Timeliness）

随着位置服务和定位技术的广泛应用，大量的GPS轨迹数据作为流数据持续地被收集，这使得轨迹相似性计算更具挑战性。然而，现有的度量非常耗时，无法满足下游任务（例如，拼车）的实时需求。因此，实时或在线轨迹相似性计算也是一个潜在的研究方向。

7.3 隐私（Privacy）

由于私人位置信息的敏感性，在处理轨迹时需要保护隐私。现有的轨迹相似性度量没有考虑数据隐私，而且直接应用现有的度量以实现高查询效率/质量同时实现隐私保护是低效的。因此，在保护隐私的同时实现有效和高效的相似性计算也是一个值得关注的方向。

7.4 有效性（Effectiveness）

轨迹相似性计算的目标是为了促进下游的轨迹分析。由于存在各种相似性度量，如何为不同的分析任务选择合适的度量是非常重要的。例如，大多数现有的相似性度量（如DTW，NetERP等）是为轨迹检索和聚类设计的，但对于异常检测等任务则效果不佳。因此，将相似性度量的选择与下游任务相结合以提高轨迹分析的效果是一个有前途的方向。

你可能感兴趣的:(论文笔记,论文阅读,支持向量机,算法)

AI+Web3：从自动化工具到自主经济体的范式革命 Loving_enjoy 计算机学科论文创新点迁移学习人工智能机器学习
>想象你的AI助手不仅能回答问题，还能自主管理你的加密资产、参与DAO治理、在预测市场博弈，甚至为你创造持续收益——欢迎来到AI与Web3融合的新世界。传统互联网（Web2）的AI困在中心化的牢笼中：数据被垄断在科技巨头手中，算法决策如同黑箱，用户沦为被动的数据奶牛。**Web3与AI的碰撞正在打破这一枷锁**，催生出去中心化的自主智能体（AIAgent），它们拥有数字身份、加密钱包和经济决策权，
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
HarmonyOS多语言支持：如何实现语言资源智能分发操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
HarmonyOS多语言支持：如何实现语言资源智能分发关键词：HarmonyOS、多语言支持、资源分发、智能调度、动态加载、国际化、本地化摘要：本文深入解析HarmonyOS多语言资源管理体系，系统阐述从基础架构设计到智能分发算法的核心技术。通过剖析资源目录结构、配置文件语法、动态加载机制等底层原理，结合自适应优先级调度算法和数学匹配模型，展示如何实现基于用户习惯、设备环境、区域特征的智能资源分发
算法堆与堆排序
堆的定义与分类堆是一种特殊的完全二叉树，通常分为两种类型：大顶堆（大根堆）：每个节点的值都大于或等于其子节点的值。小顶堆（小根堆）：每个节点的值都小于或等于其子节点的值。堆的性质结构性：堆是一棵完全二叉树，即除了最后一层外，其他层的节点都是满的，且最后一层的节点从左到右填充。有序性：堆中每个节点的值都满足特定的顺序关系（大于或小于子节点）。堆的存储数组索引0通常作为堆的根节点。对于索引为i的节点，
python函数
四、函数定义P.1函数定义把一段实现某个功能的完整代码，用一个函数封装，后期可以通过调用函数名，实现依次编写，多次调用的目的函数，可以等价于我们初高中学过的f(x)，f是运算法则，也就是代码函数中对应的代码执行块，每有一个x对应经过f运算之后得到一个值，如f(x)对应的是让x乘3加2，每有一个x进入f中便会得到一个值。高中对应的函数三要素是，定义域、运算法则、值域，而编程中的函数也有三要素，分别为
【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
单片机：实现国密SM2算法（附完整源码）源代码大师单片机实战教程单片机算法嵌入式硬件
单片机：实现国密SM2算法主要功能模块1.定义椭圆曲线参数2.大数运算（示例：大数比较）3.椭圆曲线点定义4.密钥生成5.加密与解密注意事项实现国密SM2算法在单片机上的完整源码涉及多个模块，包括椭圆曲线运算、SM3哈希函数、密钥生成、加密解密以及签名验证等。以下是一个基于C语言的简化版SM2实现示例，适用于资源有限的单片机环境。请注意，实际应用中可能需要根据具体单片机的性能和资源进行优化。主要功
深度学习微调中的优化器全景解析：从理论到实践北辰alk AI 深度学习人工智能
文章目录一、基础优化器：深度学习微调的基石1.1随机梯度下降（SGD）1.2AdaGrad（自适应梯度算法）二、自适应优化器：现代深度学习的标配2.1RMSProp2.2Adam（自适应矩估计）三、大模型微调专用优化器3.1LAMB（Layer-wiseAdaptiveMoments）3.2Sophia（二阶优化启发）四、优化器性能对比研究4.1在GLUE基准上的表现（BERT-base微调）4.
你懂安全优化SSL嘛? 巴依老爷coder 安全安全 ssl 网络协议
一文带你了解SSL全部内容CIA?SSL概述加密算法对比数字签名与证书RSA加密算法代码实操1.更完善的错误处理2.证书验证3.资源管理改进常见的面试问题CIA?在信息安全领域，CIA（保密性、完整性、可用性）是核心原则，各有其实现方法与面临的威胁：保密性：实现方法：运用加密技术，对称加密（如AES）适合大量数据快速加密，非对称加密（如RSA）用于密钥交换与数字签名；借助访问控制手段，像基于角色的
【Python 算法零基础 4.排序 ⑦ 桶排序】 L_cl Python常见算法排序算法数据结构算法
草木不争高，争的是生生不息——25.5.26选择排序回顾①遍历数组：从索引0到n-1（n为数组长度）。②每轮确定最小值：假设当前索引i为最小值索引min_index。从i+1到n-1遍历，若找到更小元素，则更新min_index。③交换元素：若min_index≠i，则交换arr[i]与arr[min_index]。'''①遍历数组：从索引 0 到 n-1（n 为数组长度）。②每轮确定最小值：假设
【Python 算法零基础 4.排序 ⑥ 快速排序】 L_cl Python常见算法排序算法算法
既有锦绣前程可奔赴，亦有往日岁月可回首——25.5.25选择排序回顾①遍历数组：从索引0到n-1（n为数组长度）。②每轮确定最小值：假设当前索引i为最小值索引min_index。从i+1到n-1遍历，若找到更小元素，则更新min_index。③交换元素：若min_index≠i，则交换arr[i]与arr[min_index]。'''①遍历数组：从索引 0 到 n-1（n 为数组长度）。②每轮确定
Apple A 系列芯片 Camera 架构解析：ISP + NPU 图像管线协同机制全景实战观熵影像技术全景图谱：架构调优与实战架构接口隔离原则影像 Camera
AppleA系列芯片Camera架构解析：ISP+NPU图像管线协同机制全景实战关键词：AppleA系列、图像信号处理器（ISP）、神经网络引擎（NPU）、SmartHDR、DeepFusion、图像协同计算、图像路径优化、拍照性能、图像延迟控制、AppleSilicon摘要：苹果在A系列芯片中持续深化ISP与NPU的协同架构，实现图像质量、算法速度与功耗的高度平衡。从A11到A17Pro，App
操作系统——磁盘调度算法代码实现十指流玉笔记操作系统
磁盘调度算法先来先服务算法（FCFS）：先来先服务算法根据访问磁盘的先后顺序进行，由当前磁头位置移动到首先到达缓存区的磁盘。优点：公平/简单，该算法的平均寻道时间相对较长。voidFCFS(){intsum=0;intstart;intFind[11];cout>start;cout>Find[i];}cout";for(inti=1;i";}cout>start;cout>Find[i].loc
【一起来学AI大模型】支持向量机（SVM）：核心算法深度解析运器123 AI大模型支持向量机机器学习人工智能 ai 大数据 AI编程算法
一、算法核心思想支持向量机（SVM）是一种强大的监督学习算法，核心思想是通过寻找最优超平面实现分类或回归：分类目标：找到能最大化两类数据间隔的超平面回归目标：找到包含最多数据点的ε带关键概念图解超平面：w·x+b=0/\/\+1|支持向量|-1|●●||●●||●●||_________________|最大间隔(margin)二、数学原理与优化问题1.线性可分情况目标函数：\min_{w,b}\
JVM垃圾回收机制深度解析真实的菜 jvm jvm
️JVM垃圾回收机制深度解析文章目录️JVM垃圾回收机制深度解析垃圾判定算法引用计数法可达性分析算法垃圾回收算法️标记-清除算法复制算法标记-整理算法️分代收集算法️常见垃圾收集器Serial收集器⚡ParNew收集器Parallel收集器CMS收集器G1收集器⚡垃圾回收调优常用JVM调优参数️调优工具使用：JConsole、VisualVMJConsoleVisualVM实战案例分析案例一：内存
【一起来学AI大模型】算法核心：数组/哈希表/树/排序/动态规划（LeetCode精练）运器123 AI大模型 python 开发语言人工智能 AI AI编程算法散列表
以下是五大核心算法的重点解析和LeetCode经典题解，包含最优解法和模板代码：一、数组操作（双指针/滑动窗口）核心思想：通过索引指针高效遍历与操作数组1.移动零（No.283）defmoveZeroes(nums):slow=0forfastinrange(len(nums)):ifnums[fast]!=0:nums[slow],nums[fast]=nums[fast],nums[slow]
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
暑假算法日记第三天
目标：刷完灵神专题训练算法题单阶段目标：【算法题单】滑动窗口与双指针LeetCode题目:3439.重新安排会议得到最多空余时间I2134.最少交换次数来组合所有的1II1297.子串的最大出现次数2653.滑动子数组的美丽值1888.使二进制字符串字符交替的最少反转次数567.字符串的排列438.找到字符串中所有字母异位词30.串联所有单词的子串2156.查找给定哈希值的子串其他:今日总结往期打
华为OD机试 2025B卷 - 货币单位转换(C++&Python&JAVA&JS&C语言) YOLO大师华为od c++python 华为OD机试华为OD机试2025B卷华为OD2025B卷华为OD机考2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述记账本上记录了若干条多国货币金额，需要转换成人民币分（fen），汇总后输出。每行记录一条金额，金额带有货币单位，格式为数字+单位，可能是单独元，或者单独分，或者元与分的组合。要求将这些货币全部换算成人民币分（fen）后进行汇总，汇总结果仅保留整数，小数部分舍弃。元和分的换算关系都是
C++二分查找入门指南
一、二分法概述二分查找（BinarySearch）是一种在‌有序数组‌中查找特定元素的高效算法。它的基本思想是通过不断将搜索范围减半来快速定位目标元素，时间复杂度为O(logn)，远优于线性查找的O(n)。二分法不仅用于查找，还广泛应用于求解各种数学和计算问题，如求方程的近似解、寻找最优解等。在计算机科学中，二分查找是最基础且最重要的算法之一，几乎所有程序员都需要熟练掌握。二、二分查找的基本原理二
河南萌新联赛2024第（四）场的个人题解（适合小白）耳朵听不见deaf ACM 算法
河南萌新联赛2024第（四）场的题目链接文章目录ABCEGIJKLAA题目链接思路： sum=计算原来每个连通块的士兵数量总和的平方。枚举每个点，若破坏当前点，当前点所在的连通块的计算值，记录ma=没破坏前的计算值-破坏后的计算值，记录最大值涉及的知识：tarjan算法不明白的话，可以看我的第二篇博客LCA算法有用的知识：__int128 占用128字节的整数存储类型，范围为-2127~2
快速排序算法追烽少年x 数据结构数据结构
快速排序算法快速排序是一种高效的排序算法，其核心思想是通过分治法将数组分成两部分，一部分小于某个基准值，另一部分大于基准值，然后递归地对这两部分进行排序。以下是快速排序算法的C++实现：快速排序的C++实现代码：#include#includeusingnamespacestd;voidSwap(int&a,int&b){intnTemp=a;a=b;b=nTemp;}intPartition(v
区块链技术核心组件及应用架构的全面解析
区块链技术是一套融合密码学、分布式系统与经济激励的复合型技术体系，以下是其核心组件及应用架构的全面解析：一、区块链核心技术栈1.分布式账本技术（DLT）核心原理：多节点共同维护不可篡改的数据链数据结构：哈希指针哈希指针区块N区块N+1区块N+2关键创新：默克尔树（MerkleTree）实现高效数据验证2.密码学保障技术算法示例应用场景非对称加密ECC/secp256k1,RSA数字签名（设备身份认
03每日简报20250705 Alvin_YD 每日简报人工智能娱乐社交电子媒体传媒
每日简报新闻简报：AI行业信任危机浮现标题：知名科技作者AlbertoRomero发文《我对AI行业正在失去所有信任》来源：TheAlgorithmicBridge（算法之桥）核心内容：作者立场：长期支持AI技术的作者AlbertoRomero公开表达对行业信任的崩塌，称"作为一个支持者，我本不愿有这种感受"。行业痛点：未具体说明的行业乱象导致公众信任度下降暗示AI发展过程中存在伦理或透明度问题传
正则表达式咸鱼时日翻身正则表达式
是指定一组与之匹配的字符串，限定符号a*a出现0或者多次a+a出现1次或者多次a？a出现0次或者1次a{2,5}出现在2到5次之间或运算法（cat|dog）匹配cat或者dog字符类[abz]+表示匹配的字符只能是中括号中的字母如果使用了^则为取反符号元字符、/d代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符不包括换行符号^a匹配行
定位问题position
1.relative相对对位：占有原来的位置。以浏览器为准定位进行移动top/left/right/bottom2.absolute绝对定位：不占有原来的位置（脱标）如果没有祖先元素或者祖先元素没有定位，以浏览器为准定位；如果祖先元素有定位（相对、绝对、固定），则以最近一级的有定位祖先元素为参考点移动位置；加了绝对定位的盒子不能通过margin：0auto垂直水平居中，但可以通过算法居中left：
【算法刷题记录（简单题）002】字符串字符匹配（java代码实现）挺菜的 java 算法开发语言
一、题目描述对于给定的字符串s和t，检查s中的所有字符是否都在t中出现。（一）输入描述第一行输入一个长度为1≤len(s)≤200、仅由小写字母组成的字符串s。第二行输入一个长度为1≤len(t)≤200、仅由小写字母组成的字符串t。（二）输出描述如果s中的所有字符都在t中出现，则输出true，否则输出false。（三）示例输入：bcabc输出：true二、题目解答（一）解题思路1.使用HashM
C语言数据结构与算法专栏目录 CodeAllen嵌入式嵌入式 C语言数据结构算法
后序会开一个《嵌入式数据结构专栏》主要为了学习嵌入式的同学，软件能力提升和大厂面试能力，感谢大家关注！直达专栏：https://blog.csdn.net/super828/category_11083370.html《C语言数据结构与算法》专栏已经更新完毕，共计72篇分享，后期会逐渐修改错误并添加内容0数据之间的关系有哪些？1如何度量一个算法的好坏？2常见的时间复杂度实例
分布式系统核心基石：CAP定理、BASE理论与一致性算法深度解析 Eqwaak00 分布式系统设计实战算法 python java
一、CAP定理：分布式系统的设计边界1.1核心定义与经典三角CAP定理（Brewer'sTheorem）指出，在分布式系统中，一致性（Consistency）、可用性（Availability）、分区容错性（PartitionTolerance）三者不可兼得。（注：若需实际配图，可替换为Mermaid流程图或专业示意图）三大特性详解：一致性（C）：所有节点在同一时间看到的数据完全相同（强一致性）。
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo