声明:【贝叶斯滤波与卡尔曼滤波】系列是博主对B站up主:忠厚老实的老王所分享教学内容的学习笔记,并且该系列每篇博客都会将博主听课后总结的纸质版笔记附于文末,供大家参考。
B站up主:忠厚老实的老王是一位研究汽车领域,无人驾驶方向及其相关方向的大佬,也算是博主在无人驾驶方向的启蒙老师。所以研究相关领域的朋友推荐去听一听他的视频讲解。
似然:英文为Likelihood,意为可能性;相似,像;源自于最大似然估计。
表示这个原因最有可能(最像)是导致了哪个可能的结果。
举例如:A班:99男,1女。B班:1男,99女。
先随机抽一个班,在从此班抽一个人进行观测,结果是女。
则认为此女最有可能(最像)是从B班抽出来的。
P ( 状态 ∣ 观测 ) = η ∗ P ( 观测 ∣ 状态 ) ∗ P ( 状态 ) P(状态|观测)=\eta *P(观测|状态)*P(状态) P(状态∣观测)=η∗P(观测∣状态)∗P(状态)
将状态视为原因,观测视为结果。
后验概率即为由果推因。 P ( 状 态 1 ∣ 观测 ) , P ( 状 态 2 ∣ 观测 ) , P ( 状 态 3 ∣ 观测 ) ⋯ P(状态_{1} |观测),P(状态_{2} |观测),P(状态_{3} |观测)\cdots P(状态1∣观测),P(状态2∣观测),P(状态3∣观测)⋯
似然概率即为由因推果。 P ( 观测 ∣ 状 态 1 ) , P ( 观测 ∣ 状 态 2 ) , P ( 观测 ∣ 状 态 3 ) ⋯ P(观测|状态_{1}),P(观测|状态_{2}),P(观测|状态_{3})\cdots P(观测∣状态1),P(观测∣状态2),P(观测∣状态3)⋯
两者是相对的。
提问:如果两个随机变量存在一定的函数关系,两者是否一定不独立?
回答:不一定。
等价命题:如果两个随机变量相互独立,两者是否一定没有函数关系?
回答:不一定。
举例如: Y Y Y和 X X X都是随机变量,满足一定的关系: Y = f ( X ) Y=f(X) Y=f(X)
Y Y Y与 X X X可能独立,也可能不独立。
(1)、 Y Y Y与 X X X满足一定关系,则两者不独立这种情况显然成立。
(2)、 Y Y Y与 X X X满足一定关系,则两者独立:
解释:(举例必然事件与随机事件)
必然事件: Y = X + 1 Y=X+1 Y=X+1
P ( X = 1 ) = 1 , P ( Y = 2 ) = 1 , P ( X = 1 , Y = 2 ) = 1 P(X=1)=1,P(Y=2)=1,P(X=1,Y=2)=1 P(X=1)=1,P(Y=2)=1,P(X=1,Y=2)=1
X = 1 X=1 X=1和 Y = 2 Y=2 Y=2之间相互独立。
随机事件:设有一个正态概率分布 N ( μ , σ 2 ) N(\mu ,\sigma ^{2} ) N(μ,σ2), ( μ , σ ) (\mu ,\sigma ) (μ,σ)未知,从此分布中,抽取n个独立的样本 X 1 , X 2 , ⋯ X n X_{1} ,X_{2} ,\cdots X_{n} X1,X2,⋯Xn,则 X 1 , X 2 , ⋯ X n X_{1} ,X_{2} ,\cdots X_{n} X1,X2,⋯Xn独立同分布。
则随机变量 X ‾ = X 1 + X 2 + ⋯ + X n n \overline{X} =\frac{X_{1}+X_{2}+\cdots +X_{n} }{n} X=nX1+X2+⋯+Xn S 2 = 1 n − 1 ∗ ∑ i = 1 n ( X i − X ‾ ) 2 S^{2} =\frac{1}{n-1} *\sum_{i=1}^{n} (X_{i} -\overline{X} )^{2} S2=n−11∗i=1∑n(Xi−X)2
样本均值 X ‾ \overline{X} X与样本方差 S 2 S^{2} S2相互独立。
贝叶斯公式:
P ( X = x ∣ Y = y ) = P ( Y = y ∣ X = x ) ∗ P ( X = x ) P ( Y = y ) P(X=x|Y=y)=\frac{P(Y=y|X=x)*P(X=x)}{P(Y=y)} P(X=x∣Y=y)=P(Y=y)P(Y=y∣X=x)∗P(X=x)
贝叶斯公式无法直接运用于连续随机变量。
如:使用贝叶斯公式求解连续随机变量
P ( X < x , Y = y ) = P ( Y = y ∣ X < x ) ∗ P ( X < x ) P ( Y = y ) P(X
P ( Y = y ) = 0 P(Y=y)=0 P(Y=y)=0且 P ( Y = y ∣ X < x ) P(Y=y|X
对于连续随机变量的贝叶斯公式的推导中存在一个小技巧:
即为化积分为求和。
X < x ⟹ ∑ u = − ∞ x X = u X
针对概率分布:
P ( X < x ∣ Y = y ) = ∑ u = − ∞ x P ( X = u ∣ Y = y ) P(X
该式即为连续随机变量的贝叶斯公式。
针对概率密度:
P ( X < x ∣ Y = y ) = ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x P(X
已知:
P ( X < x ∣ Y = y ) = ∫ − ∞ x f Y ∣ X ( y ∣ x ) ∗ f X ( x ) f Y ( y ) d x P(X
可得:
f X ∣ Y ( x ∣ y ) = f Y ∣ X ( y ∣ x ) ∗ f X ( x ) f Y ( y ) {f_{X|Y}(x|y)}=\frac{f_{Y|X}(y|x) *f_{X}(x)}{f_{Y}(y)} fX∣Y(x∣y)=fY(y)fY∣X(y∣x)∗fX(x) = η ∗ f Y ∣ X ( y ∣ x ) ∗ f X ( x ) =\eta *{f_{Y|X}(y|x) *f_{X}(x)} =η∗fY∣X(y∣x)∗fX(x)
该式即为连续随机变量的贝叶斯公式。
f Y ( y ) = ∫ − ∞ + ∞ f ( y , x ) d x f_{Y}(y)=\int_{-\infty }^{+\infty }f(y,x)dx fY(y)=∫−∞+∞f(y,x)dx
上式为联合概率密度与边缘概率密度的关系。
= ∫ − ∞ + ∞ f Y ∣ X ( y ∣ x ) ∗ f x ( x ) d x = C (常数) =\int_{-\infty }^{+\infty }f_{Y|X} (y|x)*f_{x}(x) dx=C(常数) =∫−∞+∞fY∣X(y∣x)∗fx(x)dx=C(常数)
即 η \eta η为:
η = 1 ∫ − ∞ + ∞ f Y ∣ X ( y ∣ x ) ∗ f x ( x ) d x \eta =\frac{1}{\int_{-\infty }^{+\infty }f_{Y|X} (y|x)*f_{x}(x) dx} η=∫−∞+∞fY∣X(y∣x)∗fx(x)dx1