贝叶斯滤波(一)二维连续型随机变量的条件分布函数与贝叶斯公式

 

一. 二维离散型随机变量的条件分布

 

已知(X, Y)是二维离散型随机变量,其联合概率函数为

        p_{ij} = P(X = x_{i},Y = y_{j}),i,j = 1,2,3,...,

对于给定的Y = y,则有在Y = y的条件下随机变量X的条件概率函数:

        p_{X|Y}(x_{i}|y) = P(X = x_{i}|Y = y) = \frac {P(Y = y,X = x_{i})}{P(Y = y)} = \frac{P(Y=y|X=x_{i})P(X=x_{i})}{P(Y = y)},i=1,2,3,...

通过全概率公式对分母进行展开,可得离散型随机变量的贝叶斯公式:

        p_{X|Y}(x_{i}|y) = \frac{P(Y=y_{j}|X=x_{i})P(X=x_{i})}{\sum_{j=1}^{n}P(Y=y_{j}|X=x_{j})P(X=x_{j})},i=1,2,3,...

 

看到这里,有许多人就会说由于X, Y的分布是离散的,所以在分母处用的是求和符号\sum,而如果X, Y的分布是连续的,就可以

把分母处换成积分符号,然后就能得到连续型随机变量的贝叶斯公式:

        p_{X|Y}(x|y) = \frac{p(y|x)p_{X}(x)}{p_{Y}(y)} = \frac{p(y|x)p_{X}(x)}{\int_{-\infty }^{+\infty }p(y|x)p(x)dx}

是这样的吗?请往下看,虽然结论是对的,但是需要经过一定量的推导才能得出,直接类比过去是没有根据的。

 

二. 二维连续型随机变量的条件分布

在给定Y = y的情况下,随机变量X的条件分布函数记为:

       F_{X|Y}(x|y) = P(X \leqslant = x|Y =y)

在这里我们跟二维离散型进行一个类比,如果把连续型随机变量X的条件分布也写成离散型的格式:

       F_{X|Y}(x|y) = P(X \leqslant = x|Y =y) = \frac{P(X\leqslant x,Y =y)}{P(Y = y)} = \frac{P(Y =y|X\leqslant x)P(X\leqslant x)}{P(Y = y)}

由于Y是一个连续型随机变量,在Y = y时,P(Y = y)发生的概率为0,所以通过条件概率的定义进行

求解连续型随机变量的条件分布是走不通的,是无法进行条件概率计算的。

 

但是我们可以通过极限的做法做一点变形来进行求解,假设y<Y<y+\Delta y,这样就把问题从连续型随机变量在一点Y = y的概率转化为连续型随机变量在y<Y<y+\Delta y这个区域内的概率分布函数:

       F_{X|Y}(x|y)= \lim_{\Delta y \rightarrow 0}P(X \leqslant = x|y<Y<y+\Delta y)

                       = \lim_{\Delta y \rightarrow 0} \frac{P(X \leqslant = x,y<Y<y+\Delta y) }{P(y<Y<y+\Delta y)}

根据联合分布函数与联合概率密度函数关系可知,对联合概率密度函数进行二重积分可得联合分布函数,此处设联合概率密度函数为p(x,y)

根据边缘分布函数与边缘概率密度函数关系可知,对边缘概率密度函数进行一重积分可得边缘分布函数,此处设边缘概率密度函数为p_{Y}(y).

                        = \lim_{\Delta y \rightarrow 0} \frac{\int_{-\infty }^{x}\int_{y}^{y+\Delta y}p(x,y)dydx}{\int_{y}^{y+\Delta y}p_{Y}(y)dy}

(根据积分中值定理可知,存在一个点,可以将\int_{y}^{y+\Delta y}f(y)dy含有\Delta y形式的积分等效为乘积的方式,即等效为f(y+\varepsilon \Delta y)\cdot \Delta y, \ (0<\varepsilon<1)这种形式)

                        = \lim_{\Delta y \rightarrow 0} \frac{\int_{-\infty }^{x}p(x,y+\varepsilon_{0}\Delta y)\Delta ydx}{p_{Y}(y+\varepsilon_{1}\Delta y)\Delta y} \ (0<\varepsilon_{0}<1,0<\varepsilon_{1}<1)

分子分母同时约掉一个\Delta y

                        = \lim_{\Delta y \rightarrow 0} \frac{\int_{-\infty }^{x}p(x,y+\varepsilon_{0}\Delta y)dx}{p_{Y}(y+\varepsilon_{1}\Delta y)} \ (0<\varepsilon_{0}<1,0<\varepsilon_{1}<1)

因为\lim_{\Delta y \rightarrow 0},且Y是连续随机变量,所以把\varepsilon_{0}\Delta y = 0, \varepsilon_{1}\Delta y = 0,代入式子

                        = \frac{\int_{-\infty }^{x}p(x,y)dx}{p_{Y}(y)}

推导到此处,可以看到积分处仅剩分子对从-\inftyxx进行积分,分母里面不含有x的变量,因此对x积分分母可以看做一个常数,所以可以把积分提取出来,最终得到F_{X|Y}(x|y)的概率分布函数为

                        F_{X|Y}(x|y) = \int_{-\infty }^{x}\frac{p(x,y)}{p_{Y}(y)}dx

仔细观察等式左右边,都是关于x的函数,而左边是一个分布函数,右边又是对一个关于x的函数从-\inftyx进行积分,对\frac{p(x,y)}{p_{Y}(y)}

进行积分得到分布函数,因此我们可以得出\frac{p(x,y)}{p_{Y}(y)}就为Y=y条件下X的条件概率密度函数

 

对 F_{X|Y}(x|y) = \int_{-\infty }^{x}\frac{p(x,y)}{p_{Y}(y)}dx等式两边同时求导,可得Y=y条件下X的条件概率密度函数为

                        \dpi{100} p_{X|Y}(x|y) = \frac{p(x,y)}{p_{Y}(y)} = \frac{p(y|x)p_{X}(x)}{p_{Y}(y)}

对上式分母的p_{Y}(y),可以通过全概率公式展开

                        p_{X|Y}(x|y) = \frac{p(y|x)p_{X}(x)}{p_{Y}(y)} = \frac{p(y|x)p_{X}(x)}{\int_{-\infty }^{+\infty }p(y|x)p(x)dx}

可以看到该式与离散型随机变量的概率分布是非常相似的,但是相似并不代表可以直接类比,可以看到,我们是经过了相对复杂的推导才得出的结论。

 

 

 

你可能感兴趣的:(贝叶斯滤波)