扩展卡尔曼滤波详解

Extened Kalman Filter

简单介绍

卡尔曼滤波详解讲解的基本的卡尔曼滤波算法是通过一个线性随机差分方程来估计当前状态,但是如果状态估计关系以及测量关系使非线性的怎么办,而且在实际使用中大部分的问题都是非线性的,所以提出了扩展卡尔曼滤波算法来解决非线性问题。

基本模型

扩展卡尔曼滤波算法和基本的线性卡尔曼滤波算法的基本模型在形式上很相近,也是包含状态方程和测量方程两个,只不过变量间的计算关系不是线性的。

扩展卡尔曼滤波的状态方程,利用非线性随机差分方程(non-Linear Stochastic Difference equation)利用上一个系统状态估计当前系统状态:
x k = f ( x k − 1 , u k − 1 , w k − 1 ) x_k = f(x_{k-1}, u_{k-1}, w_{k-1}) xk=f(xk1,uk1,wk1)
如果像卡尔曼一样忽略 u u u 控制输入(在下面都是忽略该项,不重复了),得到:
x k = f ( x k − 1 , 0 , w k − 1 ) ( 1.1 ) x_k = f(x_{k-1}, 0, w_{k-1}) \qquad {(1.1)} xk=f(xk1,0,wk1)(1.1)
加上对于当前状态的测量方程:
z k = h ( x k , v k ) ( 1.2 ) z_k = h(x_k, v_k) \qquad {(1.2)} zk=h(xk,vk)(1.2)
这里的参数含义就不解释了,和上面的相同,主要是:

k − 1 k-1 k1 k k k 分别表示上一状态和当前状态;

x ∈ R n x \in R^n xRn 表示要估计的状态;

u ∈ R l u \in R^l uRl 表示可选的控制输入,一般在实际使用中忽略;

z ∈ R m z \in R^m zRm 表示测量值;

w ∈ R n w \in R^n wRn 表示过程噪声,主要是从上一状态进入到当前状态时,会有许多外界因素的干扰;

v ∈ R m v \in R^m vRm 表示测量噪声,主要是任何测量仪器都会有一定的误差;

f f f 表示从上一状态到当前状态的非线性映射方程;

h h h 表示状态和测量之间的非线性映射方程;

在上面转换矩阵 A A A B B B H H H 是随着状态变化的,在这里没有添加下标,假设是不变的。

上面提到的过程噪声 w w w 和测量噪声 v v v 假设是相互独立的(之间没有关系,无相互影响),且是高斯白噪声,意思是这些噪声在离散的状态上是没有关系的(互相独立的, 每个时刻的噪声都是独立的)且 服从高斯分布:
p ( w ) ∼ N ( 0 , Q ) ( 1.3 ) p ( v ) ∼ N ( 0 , R ) ( 1.4 ) p(w) \sim N(0, Q) \qquad {(1.3)} \\ p(v) \sim N(0, R) \qquad {(1.4)} p(w)N(0,Q)(1.3)p(v)N(0,R)(1.4)

Q ∈ R n × n Q \in R^{n \times n} QRn×n 表示过程噪声 w w w 的协方差矩阵,表示 w w w 向量元素之间的相关关系;

R ∈ R m × m R \in R^{m \times m} RRm×m 表示测量噪声 v v v 的协方差矩阵,表示 v v v 向量元素之间的相关关系;

在上面协方差矩阵 Q Q Q R R R 是随着状态变化的,在这里假设是不变的。

基本公式

上面是给出了扩展卡尔曼滤波的整体思路和基本模型,在这里一步步分解来看扩展卡尔曼滤波的推导过程。首先确定了扩展卡尔曼滤波的基本模型,那么下一步是怎样根据这个模型来不断求取后面的状态。

首先定义几个变量:

x ^ k ˉ \bar{\hat{x}_k} x^kˉ 表示仅仅利用过程先验知识求出的当前状态的先验状态估计(a priori state estimate),不考虑过程噪声的情况下;

x ^ k \hat{x}_k x^k 表示利用测量值 z k z_k zk 求出的当前状态的后验状态估计(a posteriori state estimate),也是最终求得的状态;

需要注意的是,卡尔曼滤波的最终目标是求 x ^ k \hat{x}_k x^k ,这是对当前状态的最优估计。

根据上面的定义忽略过程噪声可以得到:
x ^ k ˉ = f ( x ^ k − 1 , u k − 1 , 0 ) \bar{\hat{x}_k} = f(\hat{x}_{k-1}, u_{k-1}, 0) x^kˉ=f(x^k1,uk1,0)
通常都是忽略 u u u 这个可选的控制输入(以后加入该变量的话也是非常方便的):
x ^ k ˉ = f ( x ^ k − 1 , 0 , 0 ) ( 2.1 ) \bar{\hat{x}_k} = f(\hat{x}_{k-1}, 0, 0) \qquad {(2.1)} x^kˉ=f(x^k1,0,0)(2.1)
然后同理忽略测量噪声可以得到:
z k ˉ = h ( x ^ k ˉ , 0 ) \bar{z_k} = h(\bar{\hat{x}_k}, 0) zkˉ=h(x^kˉ,0)

z k ˉ \bar{z_k} zkˉ 表示忽略测量噪声根据当前先验状态得到的无噪声测量值。

然后可以重写上面的模型(很好理解,就是把缺失的那部分在累加上,这样变成一个线性模型更好处理):
x k ≈ x ^ k ˉ + A ( x k − 1 − x ^ k − 1 ) + W w k − 1 z k ≈ z k ˉ + H ( x k − x ^ k ˉ ) + V v k x_k \approx \bar{\hat{x}_k} + A(x_{k-1} - \hat{x}_{k-1}) + Ww_{k-1} \\ z_k \approx \bar{z_k} + H(x_k - \bar{\hat{x}_k}) + Vv_k xkx^kˉ+A(xk1x^k1)+Wwk1zkzkˉ+H(xkx^kˉ)+Vvk

x k x_k xk z k z_k zk 表示真实状态和测量向量;

x ^ k ˉ \bar{\hat{x}_k} x^kˉ z k ˉ \bar{z_k} zkˉ 表示利用上面两个公式计算的无噪声情况下的状态和测量向量;

w k w_k wk v k v_k vk 表示过程和测量噪声;

A A A 表示函数 f f f 相对于 x x x 的偏导数的雅克比矩阵:
A [ i , j ] = ∂ f [ i ] ∂ x [ j ] ( x ^ k − 1 , 0 , 0 ) A_{[i, j]} = \frac{\partial{f_{[i]}}}{\partial{x_{[j]}}}(\hat{x}_{k-1}, 0, 0) A[i,j]=x[j]f[i](x^k1,0,0)
W W W 表示函数 f f f 相对于 w w w 的偏导数的雅克比矩阵:
W [ i , j ] = ∂ f [ i ] ∂ w [ j ] ( x ^ k − 1 , 0 , 0 ) W_{[i, j]} = \frac{\partial{f_{[i]}}}{\partial{w_{[j]}}}(\hat{x}_{k-1}, 0, 0) W[i,j]=w[j]f[i](x^k1,0,0)
H H H 表示函数 h h h 相对于 x x x 的偏导数的雅克比矩阵:
H [ i , j ] = ∂ h [ i ] ∂ x [ j ] ( x ^ k ˉ , 0 , 0 ) H_{[i, j]} = \frac{\partial{h_{[i]}}}{\partial{x_{[j]}}}( \bar{\hat{x}_k}, 0, 0) H[i,j]=x[j]h[i](x^kˉ,0,0)
V V V 表示函数 h h h 相对于 v v v 的偏导数的雅克比矩阵:
V [ i , j ] = ∂ h [ i ] ∂ v [ j ] ( x ^ k ˉ , 0 , 0 ) V_{[i, j]} = \frac{\partial{h_{[i]}}}{\partial{v_{[j]}}}( \bar{\hat{x}_k}, 0, 0) V[i,j]=v[j]h[i](x^kˉ,0,0)
注意因为 x x x 是随着 k k k 变化的,所以上面的雅克比矩阵 A , W , H , V A, W, H, V A,W,H,V 也都是随着 k k k 变化的(应该是有下标的,在这里忽略了,下面的公式也都忽略了),和线性卡尔曼滤波算法是不同的。

然后可以定义先验估计误差:
e x k ˉ ≡ x k − x ^ k ˉ \bar{e_{x_k}} \equiv x_k - \bar{\hat{x}_k} exkˉxkx^kˉ
同时定义测量残差:
e z k ˉ ≡ z k − z ˉ k \bar{e_{z_k}} \equiv z_k - \bar{z}_k ezkˉzkzˉk
把上面的新模型带入得到:
e x k ˉ ≈ A ( x k − 1 − x ^ k − 1 ) + ε k e z k ˉ ≈ H ( x k − x ^ k ˉ ) + η k ≈ H e x k ˉ + η k \bar{e_{x_k}} \approx A(x_{k-1} - \hat{x}_{k-1}) + \varepsilon_k \\ \begin{aligned} \bar{e_{z_k}} & \approx H(x_k - \bar{\hat{x}_k}) + \eta_k \\ & \approx H\bar{e_{x_k}} + \eta_k \end{aligned} exkˉA(xk1x^k1)+εkezkˉH(xkx^kˉ)+ηkHexkˉ+ηk
上面提到的 ε \varepsilon ε η \eta η 表示新的随机变量,分别服从:
p ( ε k ) ∼ N ( 0 , W Q W T ) p ( η k ) ∼ N ( 0 , V R V T ) p(\varepsilon_k) \sim N(0, WQW^T) \\ p(\eta_k) \sim N(0, VRV^T) p(εk)N(0,WQWT)p(ηk)N(0,VRVT)
现在是不是感觉上面的公式特别想线性卡尔曼滤波里面的基本模型,只不过在这里是估计误差 e x k ˉ \bar{e_{x_k}} exkˉ 而不是状态 x k x_k xk 。假设估计的结果是 e ^ k \hat{e}_k e^k ,那么可以获得后验状态估计:
x ^ k = x ^ k ˉ + e ^ k \hat{x}_k =\bar{\hat{x}_k} + \hat{e}_k x^k=x^kˉ+e^k
然后又有:
p ( e x k ˉ ) ∼ N ( 0 , E [ e x k ˉ e ˉ x k T ] ) p(\bar{e_{x_k}}) \sim N(0, E[\bar{e_{x_k}}\bar{e}_{x_k}^T]) p(exkˉ)N(0,E[exkˉeˉxkT])
可以设置初始的 e x k ˉ = 0 \bar{e_{x_k}} = 0 exkˉ=0 ,利用基本的卡尔曼滤波方法去推导,得到:
e ^ k = K k e z k ˉ \hat{e}_k = K_k\bar{e_{z_k}} e^k=Kkezkˉ
这个求解过程就转换为了线性卡尔曼滤波算法了,那么最后的状态的估计(带入上面的公式):
x ^ k = x ^ k ˉ + e ^ k = x ^ k ˉ + K k e z k ˉ = x ^ k ˉ + K k ( z k − z ˉ k ) = x ^ k ˉ + K k ( z k − h ( x ^ k ˉ , 0 ) ) \begin{aligned} \hat{x}_k & = \bar{\hat{x}_k} + \hat{e}_k \\ & = \bar{\hat{x}_k} + K_k\bar{e_{z_k}} \\ & = \bar{\hat{x}_k} + K_k(z_k - \bar{z}_k) \\ & = \bar{\hat{x}_k} + K_k(z_k - h(\bar{\hat{x}_k}, 0)) \end{aligned} x^k=x^kˉ+e^k=x^kˉ+Kkezkˉ=x^kˉ+Kk(zkzˉk)=x^kˉ+Kk(zkh(x^kˉ,0))
其他三个公式很自然的就是上面利用基本卡尔曼滤波算法求解 e x k ˉ \bar{e_{x_k}} exkˉ 的基本公式。

最后得到了上面五个方程式,是经典的扩展卡尔曼滤波的五个基本公式,利用这五个公式就可以完成卡尔曼滤波的求解过程。根据迭代过程分成两个方程集合,一个是time update方程,一个是measurement update方程,如下:

Time Update Measurement Update
x ^ k ˉ = f ( x ^ k − 1 , 0 , 0 ) \bar{\hat{x}_k} = f(\hat{x}_{k-1}, 0, 0) x^kˉ=f(x^k1,0,0) K k = P k ˉ H k T ( H k P k ˉ H k T + V k R V k T ) − 1 K_k = \bar{P_k}H_k^T(H_k\bar{P_k}H_k^T + V_kRV_k^T)^{-1} Kk=PkˉHkT(HkPkˉHkT+VkRVkT)1
P k ˉ = A k P k − 1 A k T + W k Q W k T \bar{P_k} = A_kP_{k-1}A_k^T + W_kQW_k^T Pkˉ=AkPk1AkT+WkQWkT x ^ k = x ^ k ˉ + K k ( z k − h ( x ^ k ˉ , 0 ) ) \hat{x}_k = \bar{\hat{x}_k} + K_k(z_k - h(\bar{\hat{x}_k}, 0)) x^k=x^kˉ+Kk(zkh(x^kˉ,0))
P k = ( I − K k H k ) P k ˉ P_k = (I - K_kH_k)\bar{P_k} Pk=(IKkHk)Pkˉ

迭代过程

得到上面的基本公式以后,就可以计算计算后面的状态,但是公式中有一些参数是未知的,需要定义,如下:

u u u 变量一般来说是被忽略的;

f f f h h h 函数是根据实际提供的;

R R R 一般来说是相对简单可以求到的,就是仪器的噪声协方差;

Q Q Q 就很难直接的获得,也没有特定的方法,一般是系统过程比较稳定,也就是没有过程噪声;

A , W , H , V A, W, H, V A,W,H,V 等雅克比矩阵是根据函数求得的,是随时变化的;

z z z 所有状态的的测量值都是由仪器测量得到的是已知的;

对于 R R R Q Q Q 的取值来说不是特别重要,虽然可能这两个参数估计的不是很准确(不可能符合纯粹的高斯或者正太分布),但是实际情况中卡尔曼滤波算法也可以得到整的比较准确态估计,但是需要记住的是:

The better you estimate the noise parameters, the better estimates you get.

那么这样只需要传入基本的 x ^ 0 \hat{x}_0 x^0 P 0 P_0 P0 就可以了,一般来说需要进行指定。对于 x ^ 0 \hat{x}_0 x^0 来说不需要什么技巧,因为随着卡尔曼滤波算法的运行, x x x 会逐渐的收敛。但是对于 P 0 P_0 P0 ,一般不要取0,因为这样可能会令卡尔曼完全相信你给定的 x ^ 0 \hat{x}_0 x^0 是系统最优的,从而使算法不能收敛。

算法迭代过程和基本卡尔曼滤波类似。

你可能感兴趣的:(计算机视觉,扩展卡尔曼滤波,扩展卡尔曼滤波公式推导,EKF)