【贝叶斯滤波与卡尔曼滤波】 第四讲 连续随机变量的贝叶斯公式

声明:【贝叶斯滤波与卡尔曼滤波】系列是博主对B站up主:忠厚老实的老王所分享教学内容的学习笔记,并且该系列每篇博客都会将博主听课后总结的纸质版笔记附于文末,供大家参考。

B站up主:忠厚老实的老王是一位研究汽车领域,无人驾驶方向及其相关方向的大佬,也算是博主在无人驾驶方向的启蒙老师。所以研究相关领域的朋友推荐去听一听他的视频讲解。

文章目录

  • 1. 为何将传感器的准确度命名为“似然”?
  • 2. 后验概率与似然概率的关系
  • 3. 独立与存在函数关系
  • 4. 连续随机变量的贝叶斯公式
  • 注:博主笔记


1. 为何将传感器的准确度命名为“似然”?

似然:英文为Likelihood,意为可能性;相似,像;源自于最大似然估计
表示这个原因最有可能(最像)是导致了哪个可能的结果。

举例如:A班:99男,1女。B班:1男,99女。
先随机抽一个班,在从此班抽一个人进行观测,结果是女。
则认为此女最有可能(最像)是从B班抽出来的。

2. 后验概率与似然概率的关系

P ( 状态 ∣ 观测 ) = η ∗ P ( 观测 ∣ 状态 ) ∗ P ( 状态 ) P(状态|观测)=\eta *P(观测|状态)*P(状态) P(状态观测)=ηP(观测状态)P(状态)

将状态视为原因,观测视为结果

后验概率即为由果推因 P ( 状 态 1 ∣ 观测 ) , P ( 状 态 2 ∣ 观测 ) , P ( 状 态 3 ∣ 观测 ) ⋯ P(状态_{1} |观测),P(状态_{2} |观测),P(状态_{3} |观测)\cdots P(1观测),P(2观测),P(3观测)

似然概率即为由因推果 P ( 观测 ∣ 状 态 1 ) , P ( 观测 ∣ 状 态 2 ) , P ( 观测 ∣ 状 态 3 ) ⋯ P(观测|状态_{1}),P(观测|状态_{2}),P(观测|状态_{3})\cdots P(观测1),P(观测2),P(观测3)

两者是相对的。

3. 独立与存在函数关系

提问:如果两个随机变量存在一定的函数关系,两者是否一定不独立?
回答:不一定。
等价命题:如果两个随机变量相互独立,两者是否一定没有函数关系?
回答:不一定。


举例如: Y Y Y X X X都是随机变量,满足一定的关系: Y = f ( X ) Y=f(X) Y=f(X)

Y Y Y X X X可能独立,也可能不独立。

(1)、 Y Y Y X X X满足一定关系,则两者不独立这种情况显然成立。

(2)、 Y Y Y X X X满足一定关系,则两者独立:

解释:(举例必然事件与随机事件)

必然事件: Y = X + 1 Y=X+1 Y=X+1
P ( X = 1 ) = 1 , P ( Y = 2 ) = 1 , P ( X = 1 , Y = 2 ) = 1 P(X=1)=1,P(Y=2)=1,P(X=1,Y=2)=1 P(X=1)=1P(Y=2)=1P(X=1,Y=2)=1
X = 1 X=1 X=1 Y = 2 Y=2 Y=2之间相互独立。

随机事件:设有一个正态概率分布 N ( μ , σ 2 ) N(\mu ,\sigma ^{2} ) N(μ,σ2) ( μ , σ ) (\mu ,\sigma ) (μ,σ)未知,从此分布中,抽取n个独立的样本 X 1 , X 2 , ⋯ X n X_{1} ,X_{2} ,\cdots X_{n} X1,X2,Xn,则 X 1 , X 2 , ⋯ X n X_{1} ,X_{2} ,\cdots X_{n} X1,X2,Xn独立同分布。
则随机变量 X ‾ = X 1 + X 2 + ⋯ + X n n \overline{X} =\frac{X_{1}+X_{2}+\cdots +X_{n} }{n} X=nX1+X2++Xn S 2 = 1 n − 1 ∗ ∑ i = 1 n ( X i − X ‾ ) 2 S^{2} =\frac{1}{n-1} *\sum_{i=1}^{n} (X_{i} -\overline{X} )^{2} S2=n11i=1n(XiX)2
样本均值 X ‾ \overline{X} X与样本方差 S 2 S^{2} S2相互独立。

4. 连续随机变量的贝叶斯公式

贝叶斯公式:
P ( X = x ∣ Y = y ) = P ( Y = y ∣ X = x ) ∗ P ( X = x ) P ( Y = y ) P(X=x|Y=y)=\frac{P(Y=y|X=x)*P(X=x)}{P(Y=y)} P(X=xY=y)=P(Y=y)P(Y=yX=x)P(X=x)

贝叶斯公式无法直接运用于连续随机变量。

如:使用贝叶斯公式求解连续随机变量
P ( X < x , Y = y ) = P ( Y = y ∣ X < x ) ∗ P ( X < x ) P ( Y = y ) P(XP(X<x,Y=y)=P(Y=y)P(Y=yX<x)P(X<x)该式中:

P ( Y = y ) = 0 P(Y=y)=0 P(Y=y)=0 P ( Y = y ∣ X < x ) P(Y=y|XP(Y=yX<x)无实际意义。


对于连续随机变量的贝叶斯公式的推导中存在一个小技巧:

即为化积分为求和

X < x ⟹ ∑ u = − ∞ x X = u XX<xu=xX=u
【贝叶斯滤波与卡尔曼滤波】 第四讲 连续随机变量的贝叶斯公式_第1张图片
针对概率分布:
P ( X < x ∣ Y = y ) = ∑ u = − ∞ x P ( X = u ∣ Y = y ) P(XP(X<xY=y)=u=xP(X=uY=y) = ∑ u = − ∞ x P ( Y = y ∣ X = u ) ∗ P ( X = u ) P ( Y = y ) =\sum_{u=-\infty }^{x}\frac{P(Y=y|X=u)*P(X=u)}{P(Y=y)} =u=xP(Y=y)P(Y=yX=u)P(X=u) = lim ⁡ ε → 0 ∑ u = − ∞ x P ( y < Y < y + ε ∣ X = u ) ∗ P ( u < X < u + ε ) P ( y < X < y + ε ) =\lim_{\varepsilon \to 0} \sum_{u=-\infty }^{x}\frac{P(y=ε0limu=xP(y<X<y+ε)P(y<Y<y+εX=u)P(u<X<u+ε) = lim ⁡ ε → 0 ∑ u = − ∞ x ( f Y ∣ X ( ξ 1 ∣ u ) ∗ ε ) ∗ ( f X ( ξ 2 ) ∗ ε ) f Y ( ξ 3 ) ∗ ε =\lim_{\varepsilon \to 0} \sum_{u=-\infty }^{x}\frac{(f_{Y|X}(\xi _{1} |u) *\varepsilon )*(f_{X}(\xi _{2} ) *\varepsilon )}{f_{Y}(\xi _{3} ) *\varepsilon } =ε0limu=xfY(ξ3)ε(fYX(ξ1u)ε)(fX(ξ2)ε) = lim ⁡ ε → 0 ∑ u = − ∞ x f Y ∣ X ( y ∣ u ) ∗ f X ( u ) f Y ( y ) ∗ ε =\lim_{\varepsilon \to 0} \sum_{u=-\infty }^{x}\frac{f_{Y|X}(y|u) *f_{X}(u)}{f_{Y}(y)} *\varepsilon =ε0limu=xfY(y)fYX(yu)fX(u)ε = ∫ − ∞ x f Y ∣ X ( y ∣ u ) ∗ f X ( u ) f Y ( y ) d u =\int_{-\infty }^{x} \frac{f_{Y|X}(y|u) *f_{X}(u)}{f_{Y}(y)} du =xfY(y)fYX(yu)fX(u)du ⟹ ∫ − ∞ x f Y ∣ X ( y ∣ x ) ∗ f X ( x ) f Y ( y ) d x \Longrightarrow \int_{-\infty }^{x} \frac{f_{Y|X}(y|x) *f_{X}(x)}{f_{Y}(y)} dx xfY(y)fYX(yx)fX(x)dx

该式即为连续随机变量的贝叶斯公式。


针对概率密度:
P ( X < x ∣ Y = y ) = ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x P(XP(X<xY=y)=xfXY(xy)dx

已知:
P ( X < x ∣ Y = y ) = ∫ − ∞ x f Y ∣ X ( y ∣ x ) ∗ f X ( x ) f Y ( y ) d x P(XP(X<xY=y)=xfY(y)fYX(yx)fX(x)dx

可得:
f X ∣ Y ( x ∣ y ) = f Y ∣ X ( y ∣ x ) ∗ f X ( x ) f Y ( y ) {f_{X|Y}(x|y)}=\frac{f_{Y|X}(y|x) *f_{X}(x)}{f_{Y}(y)} fXY(xy)=fY(y)fYX(yx)fX(x) = η ∗ f Y ∣ X ( y ∣ x ) ∗ f X ( x ) =\eta *{f_{Y|X}(y|x) *f_{X}(x)} =ηfYX(yx)fX(x)

该式即为连续随机变量的贝叶斯公式。


f Y ( y ) = ∫ − ∞ + ∞ f ( y , x ) d x f_{Y}(y)=\int_{-\infty }^{+\infty }f(y,x)dx fY(y)=+f(y,x)dx

上式为联合概率密度与边缘概率密度的关系。

= ∫ − ∞ + ∞ f Y ∣ X ( y ∣ x ) ∗ f x ( x ) d x = C (常数) =\int_{-\infty }^{+\infty }f_{Y|X} (y|x)*f_{x}(x) dx=C(常数) =+fYX(yx)fx(x)dx=C(常数)
η \eta η为:

η = 1 ∫ − ∞ + ∞ f Y ∣ X ( y ∣ x ) ∗ f x ( x ) d x \eta =\frac{1}{\int_{-\infty }^{+\infty }f_{Y|X} (y|x)*f_{x}(x) dx} η=+fYX(yx)fx(x)dx1

注:博主笔记

【贝叶斯滤波与卡尔曼滤波】 第四讲 连续随机变量的贝叶斯公式_第2张图片
【贝叶斯滤波与卡尔曼滤波】 第四讲 连续随机变量的贝叶斯公式_第3张图片
【贝叶斯滤波与卡尔曼滤波】 第四讲 连续随机变量的贝叶斯公式_第4张图片

你可能感兴趣的:(贝叶斯滤波与卡尔曼滤波,人工智能,自动驾驶,计算机视觉,目标跟踪,概率论)