声明:【贝叶斯滤波与卡尔曼滤波】系列是博主对B站up主:忠厚老实的老王所分享教学内容的学习笔记,并且该系列每篇博客都会将博主听课后总结的纸质版笔记附于文末,供大家参考。
B站up主:忠厚老实的老王是一位研究汽车领域,无人驾驶方向及其相关方向的大佬,也算是博主在无人驾驶方向的启蒙老师。所以研究相关领域的朋友推荐去听一听他的视频讲解。
从第三讲开始,对以下内容进行符号的统一规定:
随机变量: X , Y , ⋯ X,Y,\cdots X,Y,⋯
随机变量的取值(代表随机试验的一个可能结果): x , y , ⋯ x,y,\cdots x,y,⋯
举例如:抛硬币。
1( x x x):正面朝上
2( y y y):反面朝上
则 X = 1 ( x ) X=1(x) X=1(x):做一次随机试验,结果为正面朝上。
随机变量有连续随机变量和离散随机变量两种。
离散随机变量: P ( X = x ) = P x P(X=x)=P_{x} P(X=x)=Px例如: P ( X = k ) = e − λ ∗ λ k k ! P(X=k)=e^{-\lambda } *\frac{\lambda ^{k} }{k!} P(X=k)=e−λ∗k!λk
连续随机变量: P ( X < x ) = ∫ − ∞ x 1 2 π ∗ e − t 2 2 d t P(X
条件概率的计算:
离散条件概率: P ( X = x ∣ Y = y ) = P ( X = x , Y = y ) P ( Y = y ) P(X=x|Y=y)=\frac{P(X=x,Y=y)}{P(Y=y)} P(X=x∣Y=y)=P(Y=y)P(X=x,Y=y)
连续条件概率: P ( X < x ∣ Y = y ) = ∫ − ∞ x f ( x , y ) f ( y ) d x P(X
注:下文举例为离散随机变量的贝叶斯公式的例子。
贝叶斯滤波的三大概率:先验概率、后验概率、似然概率。
似然概率:代表观测值或传感器等的准确度。
举例如:测量今天的室外温度。
首先:
给出先验概率分布(即上文所讲的主观概率,以后不再说主观概率一词,由先验概率替代) P ( T = 10 ) = 0.8 P(T=10)=0.8 P(T=10)=0.8 P ( T = 11 ) = 0.2 P(T=11)=0.2 P(T=11)=0.2
其次:
使用传感器(温度计)测量
测量值为 T m T_{m} Tm
T m = 10.3 ℃ T_{m}=10.3℃ Tm=10.3℃
最后:
后验概率分布
使用贝叶斯公式计算:
P ( T = 10 ∣ T m = 10.3 ) = P ( T m = 10.3 ∣ T = 10 ) ∗ P ( T = 10 ) P ( T m = 10.3 ) P(T=10|T_{m}=10.3)=\frac{P(T_{m}=10.3|T=10)*P(T=10)}{P(T_{m}=10.3)} P(T=10∣Tm=10.3)=P(Tm=10.3)P(Tm=10.3∣T=10)∗P(T=10)
P ( T = 11 ∣ T m = 10.3 ) = P ( T m = 10.3 ∣ T = 11 ) ∗ P ( T = 11 ) P ( T m = 10.3 ) P(T=11|T_{m}=10.3)=\frac{P(T_{m}=10.3|T=11)*P(T=11)}{P(T_{m}=10.3)} P(T=11∣Tm=10.3)=P(Tm=10.3)P(Tm=10.3∣T=11)∗P(T=11)
先验概率—— P ( T = 10 ) P(T=10) P(T=10), P ( T = 11 ) P(T=11) P(T=11)
后验概率—— P ( T = 10 ∣ T m = 10.3 ) P(T=10|T_{m}=10.3) P(T=10∣Tm=10.3), P ( T = 11 ∣ T m = 10.3 ) P(T=11|T_{m}=10.3) P(T=11∣Tm=10.3)
似然概率—— P ( T m = 10.3 ∣ T = 10 ) P(T_{m}=10.3|T=10) P(Tm=10.3∣T=10), P ( T m = 10.3 ∣ T = 11 ) P(T_{m}=10.3|T=11) P(Tm=10.3∣T=11)
似然概率含义为:当真实温度 T = 10 、 11 T=10、11 T=10、11时,温度计测得温度 T m = 10.3 T_{m}=10.3 Tm=10.3的概率
P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)参数:温度计测量值为10.3的概率。
其它讲解贝叶斯滤波与卡尔曼滤波的教程或资料认为:
P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)与真实温度 T T T 无关,因此将 P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)视为常数 η \eta η。
P ( T = 10 ∣ T m = 10.3 ) = η ∗ P ( T m = 10.3 ∣ T = 10 ) ∗ P ( T = 10 ) P(T=10|T_{m}=10.3)=\eta*P(T_{m}=10.3|T=10)*P(T=10) P(T=10∣Tm=10.3)=η∗P(Tm=10.3∣T=10)∗P(T=10)
P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)参数:温度计测量值为10.3的概率。
提问:认为 P ( T m = 10.3 ) = 1 P(T_{m}=10.3)=1 P(Tm=10.3)=1
假设测量一次温度, T m = 10.3 T_{m}=10.3 Tm=10.3。那么 T m = 10.3 T_{m}=10.3 Tm=10.3是已经发生的事情,所以 P ( T m = 10.3 ) = 1 P(T_{m}=10.3)=1 P(Tm=10.3)=1。
回答:搞混了随机变量的可能取值和随机变量的概率分布。
随机变量可能的取值:代表一次随机试验可能的结果。
随机变量的概率分布:代表随机变量不确定程度的刻画。
两者没有关系。
举例如:抛一枚硬币,正面朝上。
可以说 P ( 正) = 1 P(正)=1 P(正)=1么?显然不可以。
P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)是随机试验的其中一个结果。
所以也可以理解将 P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)视为常数。
(1)、 如何计算 P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)?
全概率公式:
P ( T m = 10.3 ) = P ( T m = 10.3 ∣ T = 10 ) ∗ P ( T = 10 ) + P ( T m = 10.3 ∣ T = 11 ) ∗ P ( T = 11 ) P(T_{m}=10.3)=P(T_{m}=10.3|T=10)*P(T=10)+P(T_{m}=10.3|T=11)*P(T=11) P(Tm=10.3)=P(Tm=10.3∣T=10)∗P(T=10)+P(Tm=10.3∣T=11)∗P(T=11)
先验概率—— P ( T = 10 ) P(T=10) P(T=10), P ( T = 11 ) P(T=11) P(T=11)
似然概率—— P ( T m = 10.3 ∣ T = 10 ) P(T_{m}=10.3|T=10) P(Tm=10.3∣T=10), P ( T m = 10.3 ∣ T = 11 ) P(T_{m}=10.3|T=11) P(Tm=10.3∣T=11)
可见, P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)与真实温度 T T T在同一式中,一定存在关系。
(2)、 为什么其它教程或资料认为 P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)与真实温度 T T T无关,且将 P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)视为常数?
因为 P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)与真实温度 T T T的取值无关,与真实温度 T T T的概率分布有关。
解释: T T T的取值( T = 10 , 11 T=10,11 T=10,11)代表随机试验的一个结果,结果不会影响到 T T T的概率分布。
举例如:抛硬币,正面、反面朝上的概率都是0.5,所以概率分布 P ( 正) = 0.5 P(正)=0.5 P(正)=0.5不会被随机试验的可能结果(即正面朝上,反面朝上)所影响。
从全概率公式: P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)与真实温度 T T T的概率分布有关。
T T T的概率分布即先验概率,是已知条件。
似然概率代表传感器,观测的准确度。使用温度计前便会给出其传感器的精度,所以似然概率也是给定好的已知条件。
所以 P ( T m = 10.3 ) P(T_{m}=10.3) P(Tm=10.3)就可以视为一个常数。
(3)、 离散随机变量的贝叶斯公式
将上文的贝叶斯公式进行改写:
P ( T = 10 ∣ T m = 10.3 ) = P ( T m = 10.3 ∣ T = 10 ) ∗ P ( T = 10 ) P ( T m = 10.3 ) = η ∗ P ( T m = 10.3 ∣ T = 10 ) ∗ P ( T = 10 ) P(T=10|T_{m}=10.3)=\frac{P(T_{m}=10.3|T=10)*P(T=10)}{P(T_{m}=10.3)} =\eta*P(T_{m}=10.3|T=10)*P(T=10) P(T=10∣Tm=10.3)=P(Tm=10.3)P(Tm=10.3∣T=10)∗P(T=10)=η∗P(Tm=10.3∣T=10)∗P(T=10)
P ( T = 11 ∣ T m = 10.3 ) = P ( T m = 10.3 ∣ T = 11 ) ∗ P ( T = 11 ) P ( T m = 10.3 ) = η ∗ P ( T m = 10.3 ∣ T = 11 ) ∗ P ( T = 11 ) P(T=11|T_{m}=10.3)=\frac{P(T_{m}=10.3|T=11)*P(T=11)}{P(T_{m}=10.3)} =\eta*P(T_{m}=10.3|T=11)*P(T=11) P(T=11∣Tm=10.3)=P(Tm=10.3)P(Tm=10.3∣T=11)∗P(T=11)=η∗P(Tm=10.3∣T=11)∗P(T=11)
即为:
后验概率 = η ∗ 似然概率 ∗ 先验概率 后验概率=\eta*似然概率*先验概率 后验概率=η∗似然概率∗先验概率
求解 η \eta η:
∑ 后验概率 = η ∗ ∑ ( 似然概率 ∗ 先验概率 ) \sum 后验概率=\eta*\sum (似然概率*先验概率) ∑后验概率=η∗∑(似然概率∗先验概率)
∑ 后验概率 = 1 \sum 后验概率=1 ∑后验概率=1
可得 η \eta η
η = 1 ∑ ( 似然概率 ∗ 先验概率 ) \eta =\frac{1}{\sum (似然概率*先验概率)} η=∑(似然概率∗先验概率)1