贝叶斯公式学习笔记

贝叶斯公式有着广泛的应用。最近重新拿起上学时的教科书——浙大《概率论与数理统计(第三版)》,复习了一遍全概率公式与贝叶斯公式,算是捡起了一些记忆。
本文从条件概率出发,推导出全概率公式以及贝叶斯公式,并以例子说明贝叶斯公式的应用。

条件概率

条件概率研究如何计算事件 A A A 已发生的条件下事件 B B B 发生的概率。
例如,将一枚硬币抛掷两次,观察其出现正反面的情况,设事件 A A A 为“至少一次为正面”,事件 B B B 为“两次掷出同一面”。求已知事件 A A A 已经发生的条件下事件 B B B 发生的概率。
我们以 H H H 表示硬币掷出正面, T T T 表示硬币掷出反面,则上述随机试验的样本空间为 S = { H H , H T , T H , T T } S=\{HH, HT, TH, TT\} S={HH,HT,TH,TT} A = { H H , H T , T H } A=\{HH,HT, TH\} A={HH,HT,TH} B = { H H , T T } B=\{HH,TT\} B={HH,TT}。由于已知事件 A A A 已经发生,即已知试验所有可能结果所组成的集合就是 A A A A A A 中共有 3 个元素,其中只有 H H ∈ B HH \in B HHB。因此,在 A A A 发生的条件下 B B B 发生的概率(记为 P ( B ∣ A ) P(B|A) P(BA))为

P ( B ∣ A ) = 1 3 P(B|A) = \frac{1}{3} P(BA)=31

另外,我们易知

P ( A ) = 3 4 , P ( A B ) = 1 4 , P ( B ∣ A ) = 1 3 = 1 / 4 3 / 4 P(A)=\frac{3}{4}, P(AB)=\frac{1}{4}, P(B|A)=\frac{1}{3}=\frac{1/4}{3/4} P(A)=43,P(AB)=41,P(BA)=31=3/41/4

其中, P ( A B ) P(AB) P(AB) 为事件 A A A 与事件 B B B 同时发生的概率。

一般地,

P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A) = \frac{P(AB)}{P(A)} P(BA)=P(A)P(AB)

乘法定理

由条件概率的计算公式,可以得到

P ( A B ) = P ( A ) P ( B ∣ A ) P(AB) = P(A)P(B|A) P(AB)=P(A)P(BA)

上式可以推广到多个事件的积事件,即

P ( A B C ) = P ( A B ) P ( C ∣ A B ) = P ( A ) P ( B ∣ A ) P ( C ∣ A B ) P(ABC) = P(AB)P(C|AB)=P(A)P(B|A)P(C|AB) P(ABC)=P(AB)P(CAB)=P(A)P(BA)P(CAB)

例如,设某光学仪器厂制造的透镜,第一次落下时打破的概率为 1/2,若第一次落下未打破,第二次落下打破的概率为 7/10,若前两次落下未打破,第三次落下打破的概率为 9/10,试求透镜落下三次而未打破的概率。
A i ( i = 1 , 2 , 3 ) A_i(i=1,2,3) Ai(i=1,2,3) 表示事件“透镜第 i i i 次落下打破”,以 B B B 表示事件“透镜落下三次而未打破”。因为 B = A 1 ‾   A 2 ‾   A 3 ‾ B=\overline{A_1} \ \overline{A_2} \ \overline{A_3} B=A1 A2 A3,故有

P ( B ) = P ( A 1 ‾   A 2 ‾   A 3 ‾ ) = P ( A 1 ‾ ) P ( A 2 ‾ ∣ A 1 ‾ ) P ( A 3 ‾ ∣ A 1 ‾   A 2 ‾ ) = ( 1 − 1 2 ) ( 1 − 7 10 ) ( 1 − 9 10 ) = 3 200 P(B)=P(\overline{A_1} \ \overline{A_2} \ \overline{A_3})=P(\overline{A_1})P(\overline{A_2}|\overline{A_1})P(\overline{A_3}|\overline{A_1} \ \overline{A_2})\\ = (1- \frac{1}{2})(1- \frac{7}{10})(1- \frac{9}{10}) = \frac{3}{200} P(B)=P(A1 A2 A3)=P(A1)P(A2A1)P(A3A1 A2)=(121)(1107)(1109)=2003

全概率公式

定义 S S S 为试验 E E E 的样本空间, B 1 , B 2 , . . . , B n B_1, B_2, ..., B_n B1,B2,...,Bn E E E 的一组事件,若
(i) B i B j = ∅ , i ≠ j , i , j = 1 , 2 , . . . , n ; B_iB_j=\varnothing,i \neq j,i,j=1,2,...,n; BiBj=,i̸=j,i,j=1,2,...,n;
(ii) B 1 ∪ B 2 ∪ . . . ∪ B n = S B_1 \cup B_2 \cup ... \cup B_n=S B1B2...Bn=S
则称 B 1 , B 2 , . . . , B n B_1, B_2, ..., B_n B1,B2,...,Bn 为样本空间 S S S 的一个划分

即如果 B 1 , B 2 , . . . , B n B_1,B_2,...,B_n B1,B2,...,Bn 是样本空间的一个划分,那么,对每次试验,事件 B 1 , B 2 , . . . , B n B_1,B_2,...,B_n B1,B2,...,Bn 中必有一个且仅有一个发生。
例如,设试验 E E E 为“掷一颗骰子观察其点数”。它的样本空间为 S = { 1 , 2 , 3 , 4 , 5 , 6 } S=\{1,2,3,4,5,6\} S={1,2,3,4,5,6} E E E 的一组事件 B 1 = { 1 , 2 , 3 } , B 2 = { 4 , 5 } , B 3 = { 6 } B_1 = \{1,2,3 \},B_2=\{4,5\},B_3=\{6\} B1={1,2,3},B2={4,5},B3={6} S S S 的一个划分,而事件组 C 1 = { 1 , 2 , 3 } , C 2 = { 3 , 4 } , C 3 = { 5 , 6 } C_1=\{1,2,3\},C_2=\{3,4\}, C_3=\{5,6\} C1={1,2,3},C2={3,4},C3={5,6} 不是 S S S 的划分。

定理 设试验 E E E 的样本空间为 S S S A A A E E E 的事件, B 1 , B 2 , . . . , B n B_1, B_2,...,B_n B1,B2,...,Bn S S S 的一个划分,且 P ( B i ) > 0 ( i = 1 , 2 , . . . , n ) P(B_i) > 0(i=1,2,...,n) P(Bi)>0(i=1,2,...,n),则

P ( A ) = P ( A ∣ B 1 ) P ( B 1 ) + P ( A ∣ B 2 ) P ( B 2 ) + . . . + P ( A ∣ B n ) P ( B n ) P(A)=P(A|B_1)P(B_1) + P(A|B_2)P(B_2) + ... + P(A|B_n)P(B_n) P(A)=P(AB1)P(B1)+P(AB2)P(B2)+...+P(ABn)P(Bn)

该式子称为 全概率公式

证明 因为

A = A S = A ( B 1 ∪ B 2 ∪ . . . ∪ B n ) = A B 1 ∪ A B 2 ∪ . . . ∪ A B n A=AS=A(B_1 \cup B_2 \cup ... \cup B_n) = AB_1 \cup AB_2 \cup ... \cup AB_n A=AS=A(B1B2...Bn)=AB1AB2...ABn,由假设 P ( B i ) > 0 P(B_i)>0 P(Bi)>0,且 ( A B i ) ( A B j ) = ∅ (AB_i)(AB_j)=\varnothing (ABi)(ABj)=,得到

P ( A ) = P ( A B 1 ) + P ( A B 2 ) + . . . + P ( A B n ) = P ( A ∣ B 1 ) P ( B 1 ) + P ( A ∣ B 2 ) P ( B 2 ) + . . . + P ( A ∣ B n ) P ( B n ) P(A)=P(AB_1) + P(AB_2) + ... + P(AB_n)\\ =P(A|B_1)P(B_1) + P(A|B_2)P(B_2)+...+P(A|B_n)P(B_n) P(A)=P(AB1)+P(AB2)+...+P(ABn)=P(AB1)P(B1)+P(AB2)P(B2)+...+P(ABn)P(Bn)

贝叶斯公式

设试验 E E E 的样本空间为 S S S A A A E E E 的事件, B 1 , B 2 , . . . , B n B_1,B_2,...,B_n B1,B2,...,Bn S S S 的一个划分,且 P ( A ) > 0 , P ( B i ) > 0 ( i = 1 , 2 , . . . , n ) P(A) > 0,P(B_i)>0 (i=1,2,...,n) P(A)>0,P(Bi)>0(i=1,2,...,n),则

P ( B i ∣ A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 n P ( A ∣ B j ) P ( B j ) , i = 1 , 2 , . . . , n P(B_i|A)= \frac{P(A|B_i)P(B_i)}{\sum\limits_{j=1}^{n}{P(A|B_j)P(B_j)}},i=1,2,...,n P(BiA)=j=1nP(ABj)P(Bj)P(ABi)P(Bi),i=1,2,...,n

该式称为 贝叶斯公式

证明 由条件概率的定义和全概率公式,有
P ( B i ∣ A ) = P ( B i A ) P ( A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 n P ( A ∣ B j ) P ( B j ) , i = 1 , 2 , . . . , n P(B_i|A)=\frac{P(B_iA)}{P(A)} = \frac{P(A|B_i)P(B_i)}{\sum\limits_{j=1}^{n}{P(A|B_j)P(B_j)}},i=1,2,...,n P(BiA)=P(A)P(BiA)=j=1nP(ABj)P(Bj)P(ABi)P(Bi),i=1,2,...,n

特别地,当 n = 2 n=2 n=2 时,将 B 1 B_1 B1 记为 B B B,则 B 2 B_2 B2 就是 B ‾ \overline B B,全概率公式为

P ( A ) = P ( A ∣ B ) P ( B ) + P ( A ∣ B ‾ ) P ( B ‾ ) P(A) = P(A|B)P(B) + P(A|\overline B)P(\overline B) P(A)=P(AB)P(B)+P(AB)P(B)

贝叶斯公式为
P ( B ∣ A ) = P ( A B ) P ( A ) = P ( A ∣ B ) P ( B ) P ( A ∣ B ) P ( B ) + P ( A ∣ B ‾ ) P ( B ‾ ) P(B|A)=\frac{P(AB)}{P(A)}=\frac{P(A|B)P(B)}{P(A|B)P(B) + P(A|\overline B)P(\overline B)} P(BA)=P(A)P(AB)=P(AB)P(B)+P(AB)P(B)P(AB)P(B)

例子

例1 某电子设备厂所用的元件由三家元件制造厂提供,根据以往的记录有以下数据:

元件制造厂 次品率 提供元件的份额
1 0.02 0.15
2 0.01 0.80
3 0.03 0.05

设这三家工厂的产品在仓库中是均匀混合的,且无区别的标志。
(1)在仓库中随机取一只元件,求它是次品的概率;
(2)在仓库中随机地取一只元件,若已知取到的是次品,为分析次品出自何厂,需求出此次品由三家工厂生产的概率分别是多少。

A A A 表示“取到的是一只次品”, B i ( i = 1 , 2 , 3 ) B_i(i=1,2,3) Bi(i=1,2,3) 表示“所取到的产品是由第 i i i 家工厂提供的”。 B 1 , B 2 , B 3 B_1,B_2,B_3 B1,B2,B3 是样本空间 S S S 的一个划分,且有 P ( B 1 ) = 0.15 , P ( B 2 ) = 0.80 , P ( B 3 ) = 0.05 , P ( A ∣ B 1 ) = 0.02 , P ( A ∣ B 2 ) = 0.01 , P ( A ∣ B 3 ) = 0.03 P(B_1)=0.15,P(B_2)=0.80,P(B_3)=0.05,P(A|B_1)=0.02,P(A|B_2)=0.01,P(A|B_3)=0.03 P(B1)=0.15,P(B2)=0.80,P(B3)=0.05,P(AB1)=0.02,P(AB2)=0.01,P(AB3)=0.03

(1)由全概率公式
P ( A ) = P ( A ∣ B 1 ) P ( B 1 ) + P ( A ∣ B 2 ) P ( B 2 ) + P ( A ∣ B 3 ) P ( B 3 ) = 0.0125 P(A)=P(A|B_1)P(B_1)+P(A|B_2)P(B_2)+P(A|B_3)P(B_3) = 0.0125 P(A)=P(AB1)P(B1)+P(AB2)P(B2)+P(AB3)P(B3)=0.0125

(2)由贝叶斯公式

P ( B 1 ∣ A ) = P ( A ∣ B 1 ) P ( B 1 ) P ( A ) = 0.02 × 0.15 0.125 = 0.24 P(B_1|A)= \frac{P(A|B_1)P(B_1)}{P(A)}=\frac{0.02 \times 0.15}{0.125}=0.24 P(B1A)=P(A)P(AB1)P(B1)=0.1250.02×0.15=0.24

P ( B 2 ∣ A ) = 0.64 , P ( B 3 ∣ A ) = 0.12 P(B_2|A)=0.64, \quad P(B_3|A)=0.12 P(B2A)=0.64,P(B3A)=0.12

即这只次品来自第 2 家工厂可能性最大。

例2 对以往数据分析结果表明,当机器调整得良好时,产品的合格率为 98%,而当机器发生某种故障时,其合格率为 55%。每天早上机器开动时,机器调整良好的概率为 95%。试求已知某日早上第一件产品是合格品时,机器调整良好的概率是多少?

A A A 为事件 “产品合格”, B B B 为事件 “机器调整良好”,已知 P ( A ∣ B ) = 0.98 , P ( A ∣ B ‾ ) = 0.55 , P ( B ) = 0.95 , P ( B ‾ ) = 0.05 P(A|B)=0.98,P(A|\overline B)=0.55,P(B)=0.95,P(\overline B)=0.05 P(AB)=0.98,P(AB)=0.55,P(B)=0.95,P(B)=0.05,所求概率为 P ( B ∣ A ) P(B|A) P(BA),由贝叶斯公式

P ( B ∣ A ) = P ( A ∣ B ) P ( B ) P ( A ∣ B ) P ( B ) + P ( A ∣ B ‾ ) P ( B ‾ ) = 0.98 × 0.95 0.98 × 0.95 + 0.55 × 0.05 = 0.97 P(B|A)=\frac{P(A|B)P(B)}{P(A|B)P(B)+P(A|\overline B)P(\overline B)} =\frac{0.98 \times 0.95}{0.98 \times 0.95 + 0.55 \times 0.05} = 0.97 P(BA)=P(AB)P(B)+P(AB)P(B)P(AB)P(B)=0.98×0.95+0.55×0.050.98×0.95=0.97

这就是说,当第一件产品是合格品时,机器调整良好的概率为 0.97。这里, P ( B ) = 0.95 P(B)=0.95 P(B)=0.95 是由以往的数据分析得到的,叫做 先验概率,而得到信息之后再重新加以修正的概率(0.97)叫做 后验概率。有了后验概率,我们对机器情况有了进一步了解。

参考资料

  • 概率论与数理统计,第三版,浙江大学,盛骤,谢式千,潘承毅

你可能感兴趣的:(数学)