概率机器人状态估计的基础知识

概率机器人状态估计的基础知识

       在机器人定位及状态估计的问题中,有着各种滤波器,如大名鼎鼎的卡尔曼滤波器,以及信息滤波、直方图滤波、粒子滤波等,但这些滤波的本质仍然是贝叶斯滤波,贝叶斯滤波是对该问题的一般性解决方法的描述性算法,我们将在这篇文章详细地说明贝叶斯滤波之前的基础知识,为接下来的内容提供理论工具。
       看了《概率机器人》有关于此的介绍,结合这本书和自己的理解写了以下的内容。

几个重要的基础概念

       对于贝叶斯滤波来说,我们需要知道一些有关概率、统计与估计等方面的知识,主要涉及矩阵分析、概率与数理统计、随机过程等课程的内容,下面截取几个重要的基础知识作为预备知识。

1、贝叶斯准则

       贝叶斯准则在机器人相关滤波中起到很大的作用,其主导地位的确定是因为其可以通过“逆”条件概率先验概率去计算出后验概率

       在这里可能不会就很快地理解上面这句话,下面我们就用一个简单的例子来说明贝叶斯准则解决的问题是什么。

       我们假设机器人所处的环境及其自身的位置可用状态X来表示,机器人自身带有传感器,能够使用传感器来探测周围环境和自身姿态,传感器测量为Y。我们现在需要用传感器的测量值Y来估计机器人实际的状态X,这个问题相当于是求概率p(X|Y),即在测量值为条件下的状态的概率分布情况。贝叶斯准则如下:
p ( X ∣ Y ) = p ( Y ∣ X ) p ( X ) / p ( Y ) p(X|Y)=p(Y|X)p(X)/p(Y) p(XY)=p(YX)p(X)/p(Y)
       对于概率p(X),我们将其成为先验概率分布,即在传感器测量之前,我们就综合之前的有关x的信息。p(X|Y)就是我们需要求的后验概率,即在传感器测量下的对x的状态进行估计。求解后验概率的方法如贝叶斯准则,可以将其转换为后验概率的“逆”条件概率p(Y|X)和p(x)先验概率来求得。

       对于后验概率的逆概率p(Y|X),我们称其为生成模型,对于这个概率,我们理解为在状态X的条件下,传感器测量值Y的概率分布,即在X条件下的导致Y的分布情况,由X到Y的顺序,这个也是我们因果的正常关系,先有的因,再去产生结果。而我们需要求解的后验概率为:知道了传感器的测量值Y作为条件,来推测当前状态X,也就是知道了结果来推测其产生的原因。所以贝叶斯准则是将由结果推测原因的问题转化成由原因推测结果的转换过程。

2、状态的完整性

       机器人的状态包括了周围环境的状态和其自身的状态,我们假设一个状态Xt能够最好地去预测未来,则称该状态是完整的。

       这里的完整性指的是包括过去测量及控制的信息,当不包括其他可以更加精确地预测未来的附加信息。另外完备性并不是对未来有一个确定的预测函数。未来是随机的,但是没有先于Xt状态的状态变量可以影响未来的随机变化,除非这种依赖通过状态Xt起作用。满足这些条件的暂态过程叫做马尔科夫链。有关于马尔科夫链相关的内容更多地在随机过程中有解释。

3、概率生成法则

       在机器人状态估计中有两个十分重要的概率,几乎所有的滤波算法都是对这两个概率的具体化后的处理。这两个概率就是:状态转移概率、测量概率

​        由状态的完整性可知,未来的状态可以通过现在的状态来预测,且其具有马尔科夫性,可以不依赖所有之前的历史状态,所以我们可以得到以下的状态转移概率:
p ( x t ∣ u t , x t − 1 ) p(x_t|u_t,x_{t-1}) p(xtut,xt1)
       该条件概率的条件分别为前一状态和当前控制量,在该条件下得到目前状态Xt的概率分布情况。

       测量概率很容易理解,即在当前状态下,传感器测量到的值的概率分布情况:
p ( z t ∣ x t ) p(z_t|x_t) p(ztxt)
       以上两个概率将一起描述机器人及其环境组成的动态随机系统。下图显示了这些概率定义的状态和测量的演变过程,这样的时间生成模型被称为隐马尔科夫模型动态贝叶斯网络

概率机器人状态估计的基础知识_第1张图片
截图来自《概率机器人》。

4、置信分布

       在机器人中另外一个重要的概念是置信度。由于机器人的状态通过测量得到的并不是状态的准确值,状态不能直接测量,所以概率机器人通过条件概率分布来表示置信度。对于真实状态,置信度对每一种可能的假设分配一个概率。置信度分布是以可获得数据为条件关于状态变量的后验概率。

       用bel(Xt)表示状态变量Xt的置信度,可以写成如下的后验概率:
b e l ( x t ) = p ( x t ∣ z 1 : t , u 1 : t ) bel(x_t)=p(x_t|z_{1:t},u_{1:t}) bel(xt)=p(xtz1:t,u1:t)
       从该条件概率可以知道该概率分布是以历史上所有的测量与控制为条件的条件概率。

       除此之外,以上的置信度是综合了所有时刻的测量与控制,我们还可以综合最后一次测量以前的,这样得到的后验概率可以表示为如下形式:
b e l ‾ ( x t ) = p ( x t ∣ z 1 : t − 1 , u t ) \overline{bel}(x_t)=p(x_t|z_{1:t-1},u_t) bel(xt)=p(xtz1:t1,ut)
       在概率滤波的框架下,这个概率常被称为预测。在综合了t时刻测量之前,根据以前的状态,预测了t时刻的状态。由其去预测置信度称为修正或者测量更新。例如在卡尔曼滤波的过程中,就是由预测和测量更新两步组成的。所以这两个概率分布也十分重要。

你可能感兴趣的:(概率机器人)