ERP

要解决的问题

DTW、LCSS、EDR都是针对local time shifting问题提出的,但是他们都是non-metric。

提出ERP就是为了同时支持local time shifting以及metric。

(论文中还提及到了ERP的修剪策略)

类似的工作有:

相似度度量方法:

一、欧氏距离:DFT用来降维、R树用来检索。不能处理噪声和local time shifting。

二、DTW:使用重复使用的方法来实现拉伸序列并最终达到处理local time shifting的目的。

三、LCSS:用来实现Time series matching。

四、EDR:通过对轨迹符号化来实现对轨迹的检索和降维(三种修剪方法一起使用)(降维一般指的是修剪时候使用的方法)

DTW、LCSS、EDR都不是metric的方法。

索引方法

metric distance的方法

大多数都followGEMINI框架。例如MVP-Tree、M-tree、Sa-tree、OMNI-family。

ERP算法简介

设 S = [s1, s2, ... , sn]。长度为n。我们可以根据他的均值µ和方差σ进行标准化(归一化):

image.png

归一化有助于时间序列进行衰减和全局偏移的时候,两个时间序列的距离是不变的。?

image.png

最后一个min,其实就是在决定是不是一个gap:不是gap、s是gap、r是gap。

image.png

也可以不使用L1-norm

gap一般取值为0,那样的话岂不是越靠近原点的造成误差越小?

性质:

满足三角不等式

gap=0的原因:

(1)方便几何解释。

image.png

横轴是时间间隔(等间隔、均匀的),纵轴是数值。假如按照gap=0来看的话,有利于使用图形解释:所以R、S之间的差距,就对应于R、S之间距离的阴影。

(2)为了最好的匹配R,那么S就要通过添加元素,变成S~。g=0的时候,能够确保 ((求和)S) = ((求和)(S~))。确保S下的面积和S~下的面积是一样的。(so?)(g只要是一个定值,就会满足三角不等式)

总结

DTW其实是在重复使用某些点,而ERP其实是把缺少的点用0来把点补全。(
image.png

ERP对噪声有一定的抑制。

其实本来人的判断就不是唯一的:

image.png

对于Q和T2,Q和T4,到底哪一组最相似,每个人的判断都不一样。每个人对于离群点的介意程度也不一样。那么在这个系统中,就是要先确定好,系统对离群点是否能忍受,又能够忍受到什么程度。

image.png

你可能感兴趣的:(ERP)