基于贝叶斯准则的状态概率更新

\quad 基于贝叶斯准则表达获取测量值后的状态概率更新
\qquad 首先关于 Z = z Z=z Z=z的贝叶斯准则,只要 p ( y ∣ z ) > 0 p(y|z)>0 p(yz)>0
p ( x ∣ y , z ) = p ( y ∣ x , z ) p ( x ∣ z ) p ( y ∣ z ) p(x|y,z)=\frac{p(y|x,z)p(x|z)}{p(y|z)} p(xy,z)=p(yz)p(yx,z)p(xz)
基于贝叶斯准则的状态概率更新_第1张图片
\qquad 由概率生成法则可得在获取测量值后状态概率的更新(目标后验)表达式
p ( x t ∣ z 1 : t , u 1 : t ) = p ( x t ∣ z t , z 1 : t − 1 , u 1 : t ) = p ( z t ∣ x t , z 1 : t − 1 , u 1 : t ) p ( x t ∣ z 1 : t − 1 , u 1 : t ) p ( z t ∣ z 1 : t − 1 , u 1 : t ) p(x_{t}|z_{1:t},u_{1:t})=p(x_{t}|z_{t},z_{1:t-1},u_{1:t})=\frac{p(z_{t}|x_{t},z_{1:t-1},u_{1:t})p(x_{t}|z_{1:t-1},u_{1:t})}{p(z_{t}|z_{1:t-1},u_{1:t})} p(xtz1:t,u1:t)=p(xtzt,z1:t1,u1:t)=p(ztz1:t1,u1:t)p(ztxt,z1:t1,u1:t)p(xtz1:t1,u1:t)此时 z 1 : t − 1 , u 1 : t z_{1:t-1},u_{1:t} z1:t1,u1:t看作上式的条件 Z Z Z
\qquad 依据伯努利分布(Bernoulli distribution)建模, θ g = 1 \theta_{g}=1 θg=1表示检测到目标,其概率使用 P i , k ( θ g = 1 ) P_{i,k}(\theta_{g}=1) Pi,k(θg=1)表示。 θ g = 0 \theta_{g}=0 θg=0表示未检测到目标,其概率使用 1 − P i , k ( θ g = 1 ) 1-P_{i,k}(\theta_{g}=1) 1Pi,k(θg=1)表示。
\qquad 其中, i i i表示第 i i i个机器人, g g g表示概率密度栅格图中第 g g g个栅格, k k k表示第 k k k个时间点。使用符号 P i , g , k \mathcal{P}_{i,g,k} Pi,g,k定义概率 P i , k ( θ g = 1 ) P_{i,k}(\theta_{g}=1) Pi,k(θg=1)。则测量更新表达式为:
P i , g , k = P ( Z i , g , k ∣ θ g = 1 ) P i , g , k − 1 P ( Z i , g , k ∣ θ g = 1 ) P i , g , k − 1 + P ( Z i , g , k ∣ θ g = 0 ) ( 1 − P i , g , k − 1 ) \mathcal{P}_{i,g,k}=\frac{P(Z_{i,g,k}|\theta_{g}=1)\mathcal{P}_{i,g,k-1}}{P(Z_{i,g,k}|\theta_{g}=1)\mathcal{P}_{i,g,k-1}+P(Z_{i,g,k}|\theta_{g}=0)(1-\mathcal{P}_{i,g,k-1})} Pi,g,k=P(Zi,g,kθg=1)Pi,g,k1+P(Zi,g,kθg=0)(1Pi,g,k1)P(Zi,g,kθg=1)Pi,g,k1 \qquad 使用伯努利分布建模后的测量更新与一般式的不同表现在 归 一 化 常 数 η 使 用 测 量 概 率 的 全 概 率 公 式 表 示 \color{#F00}{归一化常数\eta使用测量概率的全概率公式表示} η使
\qquad P ( Z i , g , k = 1 ∣ θ g = 1 ) = p , P ( Z i , g , k = 1 ∣ θ g = 0 ) = q P(Z_{i,g,k}=1|\theta_{g}=1)=p,P(Z_{i,g,k}=1|\theta_{g}=0)=q P(Zi,g,k=1θg=1)=p,P(Zi,g,k=1θg=0)=q,则
P i , g , k = { p P i , g , k − 1 p P i , g , k − 1 + q ( 1 − P i , g , k − 1 ) i f   Z i , g , k = 1 , ( 1 − p ) P i , g , k − 1 ( 1 − p ) P i , g , k − 1 + ( 1 − q ) ( 1 − P i , g , k − 1 ) i f   Z i , g , k = 0 , P i , g , k − 1 o t h e r w i s e . \mathcal{P}_{i,g,k}=\begin{cases} \frac{p\mathcal{P}_{i,g,k-1}}{p\mathcal{P}_{i,g,k-1}+q(1-\mathcal{P}_{i,g,k-1})}\quad if\ Z_{i,g,k}=1,\\ \frac{(1-p)\mathcal{P}_{i,g,k-1}}{(1-p)\mathcal{P}_{i,g,k-1}+(1-q)(1-\mathcal{P}_{i,g,k-1})}\quad if\ Z_{i,g,k}=0,\\ \mathcal{P}_{i,g,k-1}\quad otherwise. \end{cases} Pi,g,k=pPi,g,k1+q(1Pi,g,k1)pPi,g,k1if Zi,g,k=1,(1p)Pi,g,k1+(1q)(1Pi,g,k1)(1p)Pi,g,k1if Zi,g,k=0,Pi,g,k1otherwise.化简得:
1 P i , g , k − 1 = { q p ( 1 P i , g , k − 1 − 1 ) , i f   Z i , g , k = 1 1 − q 1 − p ( 1 P i , g , k − 1 − 1 ) , i f   Z i , g , k = 0 1 P i , g , k − 1 − 1 , o t h e r w i s e . \frac{1}{\mathcal{P}_{i,g,k}}-1=\begin{cases} \frac{q}{p}(\frac{1}{\mathcal{P}_{i,g,k}-1}-1),\quad if\ Z_{i,g,k}=1\\ \frac{1-q}{1-p}(\frac{1}{\mathcal{P}_{i,g,k}-1}-1),\quad if\ Z_{i,g,k}=0\\ \frac{1}{\mathcal{P}_{i,g,k-1}}-1,\quad otherwise. \end{cases} Pi,g,k11=pq(Pi,g,k111),if Zi,g,k=11p1q(Pi,g,k111),if Zi,g,k=0Pi,g,k111,otherwise.对其取 l n ln ln运算,则
Q i , g , k = Δ l n ( 1 P i , g , k − 1 − 1 ) Q_{i,g,k}\overset{\Delta}{=}ln(\frac{1}{{P}_{i,g,k-1}}-1) Qi,g,k=Δln(Pi,g,k111)
Q i , g , k = Q i , g , k − 1 + v i , g , k Q_{i,g,k}=Q_{i,g,k-1}+v_{i,g,k} Qi,g,k=Qi,g,k1+vi,g,k其中:
v i , g , k = Δ { l n q p , i f   Z i , g , k = 1 l n 1 − q 1 − p , i f   Z i , g , k = 0 0 , o t h e r w i s e . v_{i,g,k}\overset{\Delta}{=}\begin{cases} ln\frac{q}{p},\quad if\ Z_{i,g,k}=1\\ ln\frac{1-q}{1-p},\quad if\ Z_{i,g,k}=0\\ 0,\quad otherwise. \end{cases} vi,g,k=Δlnpq,if Zi,g,k=1ln1p1q,if Zi,g,k=00,otherwise. \qquad 由此,当目标存在时, Q i , g , k Q_{i,g,k} Qi,g,k趋向于 − ∞ -\infty ,即 P i , g , k \mathcal{P}_{i,g,k} Pi,g,k趋向于1。当目标不存在时, Q i , g , k Q_{i,g,k} Qi,g,k趋向于 + ∞ +\infty +,即 P i , g , k \mathcal{P}_{i,g,k} Pi,g,k趋向于0。
\qquad 其中潜在的问题是存储 Q i , g , k Q_{i,g,k} Qi,g,k过程中会出现数值过大,存储溢出的情况。给定边界 Q > 0 \boldsymbol{Q}>0 Q>0,使得
Q i , g , k = m a x { m i n ( Q i , g , k , Q ) , − Q } Q_{i,g,k}=max\{min(Q_{i,g,k},\boldsymbol{Q}),-\boldsymbol{Q}\} Qi,g,k=max{min(Qi,g,k,Q),Q} \qquad P i , g , k ∈ [ ( 1 / ( 1 + e Q ) ) , ( 1 / ( 1 + e − Q ) ] \mathcal{P}_{i,g,k}\in[(1/(1+e^{\boldsymbol{Q}})),(1/(1+e^{\boldsymbol{-Q}})] Pi,g,k[(1/(1+eQ)),(1/(1+eQ)] Q \boldsymbol{Q} Q需要足够大使得 P i , g , k P_{i,g,k} Pi,g,k接近(0,1)。

你可能感兴趣的:(Robotic,Estimation,Learning)