离散Fréchet(弗雷歇) 距离评价曲线相似度

离散Fréchet(弗雷歇) 距离评价曲线相似度

1、引言

对于如何评价两条曲线的相似度现已经存在许多较为直接有效的方法,诸如基于各种距离测度的距离评判、利用相关系数进行相似度分析等等,其中对于距离测度运用较为广泛便是欧式距离、Hausdorff距离等等。而在1906年法国数学家Maurice René Fréchet提出了一种基于空间路径相似度描述方式[1],其着重将路径空间距离考虑进去,使得其对于有一定空间时序的曲线相似度评价效率相比之下更高,这便是Fréchet distance(弗雷歇距离)。


图1:两条曲线间的Hausdorff距离和Fréchet距离[2]
如果Hausdorff距离用 dH d H 表示,Fréchet距离使用 dF d F 表示,则图1中的两曲线可有 dHε d H ≤ ε sF2ε s F ≥ 2 ε 。因此在某些情景下Fréchet距离的处理要优于Hausdorff距离,但具体需要使用何种距离测度是需要视具体情况而定的。

2、定义

对于其定义其中最为简单直观的一个理解,主人和狗在两条不同的轨迹上运动,主人和狗之间是由狗绳相连接的,Fréchet距离即两者能各自走完整个轨迹的情况下满足条件的狗绳的最短长度。

图2:A为主人行走轨迹,B为狗的运动轨迹,在此情况下可知Fréchet距离为0.25时刻或者0.75时刻人和狗之间的距离

对于上述人和狗行走问题我们给出严格的数学定义,假设人行走的轨迹为P且长度为N,狗行走的轨迹为Q且长度为M。而两者运动位置的描述可以用一个t变量的连续递增函数来刻画,我们用 α(t) α ( t ) 来表示人运动位置描述函数,用 β(t) β ( t ) 表示狗运动位置描述函数。同时为了方便讨论,我们将变量t约束到区间[0,1]内,那么有 α(0)=0 α ( 0 ) = 0 α(1)=N α ( 1 ) = N β(0)=0 β ( 0 ) = 0 . β(0)=M β ( 0 ) = M 。我们用 P(α(t)) P ( α ( t ) ) Q(β(t)) Q ( β ( t ) ) 分别表示t时刻人和狗在各自轨迹上的空间位置,那么人和狗之间的距离会随着 α(t) α ( t ) β(t) β ( t ) 函数本身的不同和变量t的变化而不同,而Fréchet距离实际是寻找一对这样的函数最小化人和狗之间的最长狗绳。
更为严格的Fréchet距离数学表达式如下[3]
δF(P,Q)=minα[0,1][0,N]β[0,1][0,M]{maxt[0,1]d(P(α(t)),Q(β(t)))}(1) (1) δ F ( P , Q ) = min α [ 0 , 1 ] → [ 0 , N ] β [ 0 , 1 ] → [ 0 , M ] { max t ∈ [ 0 , 1 ] d ( P ( α ( t ) ) , Q ( β ( t ) ) ) }

对于上述数学表达式的理解为,对于每一对可能的描述函数 α(t) α ( t ) β(t) β ( t ) 我们总能找到整个运动过程中狗绳最长的距离,通过改变 α(t) α ( t ) β(t) β ( t ) 可使得这个最长的狗绳达到最小,这个最小的距离即为Fréchet距离。当然,这个距离也可以是其他形式的距离测度,在这里我们采用欧拉距离。
基于此定义,Eiter 和 Mannila 于1994年提出了离散Fréchet距离的定义[4]。首先我们将上述两轨迹进行离散化,设曲线P是由p个轨迹点所组成,曲线Q是由q个轨迹点所组成。使用 σ(P) σ ( P ) σ(Q) σ ( Q ) 分别表示两轨迹点的顺序集合,则有 σ(P)=(u1,...,up) σ ( P ) = ( u 1 , . . . , u p ) σ(Q)=(v1,...,vq) σ ( Q ) = ( v 1 , . . . , v q ) 。同时,我们可以得到如下序列点对L
(ua1,vb1),(ua2,vb2),...,(uam,vbm)(2) (2) ( u a 1 , v b 1 ) , ( u a 2 , v b 2 ) , . . . , ( u a m , v b m )

其中, a1=1,b1=1,am=p,bm=q a 1 = 1 , b 1 = 1 , a m = p , b m = q , 对于任意 i=1,...,q i = 1 , . . . , q ai+1=ai a i + 1 = a i ai+1=ai+1 a i + 1 = a i + 1 bi+1=bi b i + 1 = b i
P、Q轨迹点之间的序列对之间长度 ||L|| | | L | | 定义为各序列对中欧式距离最大的值,表达式如下
||L||=maxi=1,...,md(uai,vbi)(3) (3) | | L | | = max i = 1 , . . . , m d ( u a i , v b i )

那么其离散Fréchet距离定义如下
δdF(P,Q)=min||L||(4) (4) δ d F ( P , Q ) = min | | L | |

可以很容易看出, δdF(P,P)=0,δdF(P,Q)=δdF(Q,P); δ d F ( P , P ) = 0 , δ d F ( P , Q ) = δ d F ( Q , P ) ; 同时如果 δdF(P,Q)=0 δ d F ( P , Q ) = 0 ,则就有 P=Q; P = Q ; 和连续Fréchet距离一样其也满足三角不等式,即 δdF(P,Q)δdF(P,R)+δdF(R,Q). δ d F ( P , Q ) ≤ δ d F ( P , R ) + δ d F ( R , Q ) .

3、连续Fréchet距离和离散Fréchet距离的关系[5]

离散Fréchet距离是连续Fréchet距离的近似,当曲线所选取的离散点足够多时离散Fréchet距离近似等于连续Fréchet距离。


图3:连续Fréchet距离和离散Fréchet距离示意图
图3中(a)部分是在两条曲线离散轨迹点较少的情况,可知此时得到的离散Fréchet距离为 a2 a 2 b2 b 2 之间的欧拉距离。(b)部分则表示两条曲线的离散轨迹点较多的情况,而此时的离散Fréchet距离为 a2 a 2 b b 之间的欧拉距离。两种情况下的连续Fréchet距离都为 a2 a 2 o o 之间的欧式距离,故随着曲线的离散轨迹点的数量的增加而离散Fréchet距离将逐渐接近于连续Fréchet距离。

4、离散Fréchet距离计算算法[4]

Function dF(P,Q):real; F u n c t i o n   d F ( P , Q ) : r e a l ;
input: i n p u t : P=(u1,...,up),Q=(v1,...,vq) P = ( u 1 , . . . , u p ) , Q = ( v 1 , . . . , v q )
return:δdF(P,Q) r e t u r n : δ d F ( P , Q )
ca: array [1..p,1..q] of real; c a :   a r r a y   [ 1.. p , 1.. q ]   o f   r e a l ;
function c(i,j):real; f u n c t i o n   c ( i , j ) : r e a l ;
begin b e g i n
if ca(i,j)>1 then return ca(i,j) i f   c a ( i , j ) > − 1   t h e n   r e t u r n   c a ( i , j )
elseif i=1 and j=1 then ca(i,j):=d(u1,v1) e l s e i f   i = 1   a n d   j = 1   t h e n   c a ( i , j ) := d ( u 1 , v 1 )
elseif i>1 and j=1 then ca(i,j):=max{c(i1,1),d(ui,v1)} e l s e i f   i > 1   a n d   j = 1   t h e n   c a ( i , j ) := max { c ( i − 1 , 1 ) , d ( u i , v 1 ) }
elseif i=1 and j>1 then ca(i,j):=max{c(1,j1),d(u1,vi)} e l s e i f   i = 1   a n d   j > 1   t h e n   c a ( i , j ) := max { c ( 1 , j − 1 ) , d ( u 1 , v i ) }
elseif i>1 and j>1 then ca(i,j):= e l s e i f   i > 1   a n d   j > 1   t h e n   c a ( i , j ) :=
max{min(c(i1,j),c(i1,j1),c(i,j1)),d(ui,vi)} max { min ( c ( i − 1 , j ) , c ( i − 1 , j − 1 ) , c ( i , j − 1 ) ) , d ( u i , v i ) }
else ca(i,j)= e l s e   c a ( i , j ) = ∞
return ca(i,j); r e t u r n   c a ( i , j ) ;
end; / function c / e n d ;   / ∗   f u n c t i o n   c   ∗ /
begin b e g i n
for i=1 to p do for j=1 to q do ca(i,j):=1.0; f o r   i = 1   t o   p   d o   f o r   j = 1   t o   q   d o   c a ( i , j ) := − 1.0 ;
return c(p,q); r e t u r n   c ( p , q ) ;
end. e n d .

5、代码示例

function dF = DiscreteFrechetDistance(P,Q)

%%
%initialize
Size_P = size(P);
Size_Q = size(Q);
ca = ones(Size_P(1),Size_Q(1)) .* -1;
if Size_P(2) ~= Size_Q(2)
    error('The input P and Q must be of the same dimension');
elseif Size_P(1) == 0 && Size_Q(1) == 0
    dF = 0;
    return;
end
dF = c(Size_P(1),Size_Q(1));

%%
%function c
function c_ij = c(i,j)
    d = @(u,v) sqrt(sum((u - v).^2));
    if ca(i,j) > -1
        c_ij = ca(i,j);
    elseif i==1 && j==1
        ca(i,j) = d(P(1,:),Q(1,:));
        c_ij = ca(i,j);
    elseif i > 1 && j == 1
        ca(i,j) = max(c(i - 1,1),d(P(i,:),Q(1,:)));
        c_ij = ca(i,j);
    elseif i == 1 && j > 1
        ca(i,j) = max(c(1,j - 1),d(P(1,:),Q(j,:)));
        c_ij = ca(i,j);
    elseif i > 1 && j > 1
        ca(i,j) = max(min([c(i - 1,j),c(i - 1,j - 1),c(i,j - 1)]),d(P(i,:),Q(j,:)));
        c_ij = ca(i,j);
    else
        ca(i,j) = inf;
    end
end
end

6、参考文献

[1] Fréchet M M. Sur quelques points du calcul fonctionnel[J]. Rendiconti Del Circolo Matematico Di Palermo, 1906, 22(1):1-72.
[2] Wylie T, Zhu B. Intermittent Map Matching with the Discrete Fr\’echet Distance[J]. Eprint Arxiv, 2014.
[3] Alt H, Godau M. Computing the Fréchet Distance between Two Polygonal Curves[J]. International Journal of Computational Geometry & Applications, 1995, 5(01n02):75-91.
[4] Eiter T, Mannila H. Computing discrete Fréchet distance[R]. Tech. Report CD-TR 94/64, Information Systems Department, Technical University of Vienna, 1994.
[5] Timothy, Randall, Wylie. THE DISCRETE FRECHET DISTANCE AND APPLICATIONS[D]. Montana State University Bozeman, 2013,7-8.

你可能感兴趣的:(杂类)