概率论中的基本公式

1.条件概率

事件A已经发生的条件下,事件B发生

P(B|A)=P(AB)P(A) P ( B | A ) = P ( A B ) P ( A )

2.乘法定理

P(AB)=P(B|A)P(A) P ( A B ) = P ( B | A ) P ( A )

推广多个事件的积事件
P(ABC)=P(C|AB)P(B|A)P(A) P ( A B C ) = P ( C | A B ) P ( B | A ) P ( A )

更一般地有
P(A1A2...An)=P(An|A1A2...An1)P(An1|A1A2...An2)P(A2|A1)P(A1) P ( A 1 A 2 . . . A n ) = P ( A n | A 1 A 2 . . . A n − 1 ) P ( A n − 1 | A 1 A 2 . . . A n − 2 ) … P ( A 2 | A 1 ) P ( A 1 )

3.全概率公式

概念:
试验E的样本空间S,事件 Bi B i i=1,2...,n i = 1 , 2... , n 是样本空间的一个划分,每次试验有且仅有一个发生。

  • BiBj=,ij B i B j = ∅ , i ≠ j
  • B1B2...Bn=S B 1 ∪ B 2 ∪ . . . ∪ B n = S

如果A是E的事件,事件A发生,

P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...+P(A|Bn)P(Bn) P ( A ) = P ( A | B 1 ) P ( B 1 ) + P ( A | B 2 ) P ( B 2 ) + . . . + P ( A | B n ) P ( B n )

全概率公式的理解
例子:
人患肺癌的概率为0.1%,人群中有20%吸烟者,他们患肺癌的概率为0.4%, 那个不吸烟的人患肺癌的概率是多少?
换个人能看懂的说法, P()=0.001 P ( 患 肺 癌 ) = 0.001 , P()=0.2 P ( 吸 烟 ) = 0.2 , P(|)=0.004 P ( 患 肺 癌 | 吸 烟 ) = 0.004 , 求 P(|)=? P ( 患 肺 癌 | 不 吸 烟 ) = ?
P()=0.001 P ( 患 肺 癌 ) = 0.001 既包括了吸烟患肺癌的概率又包括不吸烟患肺癌的概率。

P()=P()+P() P ( 患 肺 癌 ) = P ( 吸 烟 患 肺 癌 ) + P ( 不 吸 烟 患 肺 癌 )
=P(|)P()+P(|)P() = P ( 患 肺 癌 | 吸 烟 ) P ( 吸 烟 ) + P ( 患 肺 癌 | 不 吸 烟 ) P ( 不 吸 烟 )
=0.004×0.2+P(|)×(10.2)=0.001 = 0.004 × 0.2 + P ( 患 肺 癌 | 不 吸 烟 ) × ( 1 − 0.2 ) = 0.001

所以不吸烟的人患肺癌的概率为0.00025.

4.贝叶斯公式

P(Bi|A)=P(A|Bi)P(Bi)nj=1P(A|Bj)P(Bj) P ( B i | A ) = P ( A | B i ) P ( B i ) ∑ j = 1 n P ( A | B j ) P ( B j )

n=2时,
P(B|A)=P(A|B)P(B)P(A|B)P(B)+P(A|B¯¯¯¯)P(B¯¯¯¯) P ( B | A ) = P ( A | B ) P ( B ) P ( A | B ) P ( B ) + P ( A | B ¯ ) P ( B ¯ )

用条件概率、全概率公式理解贝叶斯公式:

P(A|B)=P(AB)P(A) P ( A | B ) = P ( A ∩ B ) P ( A )
或者
P(B|A)=P(BA)P(A) P ( B | A ) = P ( B ∩ A ) P ( A )
因为
P(AB)=P(BA) P ( A ∩ B ) = P ( B ∩ A )
所以
P(B|A)=P(A|B)P(B)P(A) P ( B | A ) = P ( A | B ) P ( B ) P ( A )

P(A)发生的概率就用到了全概率公式,包括B在各种情况下A发生的概率:
j=1nP(A|Bj)P(Bj) ∑ j = 1 n P ( A | B j ) P ( B j )

实际应用中的定义


概率论中的基本公式_第1张图片

经典例子:
癌症诊断事件,人患癌症的统计概率为0.005,一个不患癌症的受诊者试验呈阳性的概率为0.05,一个患癌症的病人做诊断时呈阳性的概率为0.95,那么受诊者试验呈阳性,他患癌症的概率?
分析:
P()=0.005 P ( 患 癌 症 ) = 0.005
P(|)=0.05 P ( 呈 阳 性 | 不 患 癌 症 ) = 0.05
P(|)=0.95 P ( 呈 阳 性 | 患 癌 症 ) = 0.95
P(|)=? P ( 患 癌 症 | 呈 阳 性 ) = ?

使用条件概率计算:

P(|)=P(|)P()P() P ( 患 癌 症 | 呈 阳 性 ) = P ( 呈 阳 性 | 患 癌 症 ) P ( 患 癌 症 ) P ( 呈 阳 性 )
P(|)P()=0.005×0.95=0.00475 P ( 呈 阳 性 | 患 癌 症 ) P ( 患 癌 症 ) = 0.005 × 0.95 = 0.00475
P()=P(|)P()+P(|)P() P ( 呈 阳 性 ) = P ( 呈 阳 性 | 不 患 癌 症 ) P ( 不 患 癌 症 ) + P ( 呈 阳 性 | 患 癌 症 ) P ( 患 癌 症 )
=0.05×(10.005)+0.95×0.005=0.0545 = 0.05 × ( 1 − 0.005 ) + 0.95 × 0.005 = 0.0545
P(|)=0.004750.0545=0.08715 P ( 患 癌 症 | 呈 阳 性 ) = 0.00475 0.0545 = 0.08715

你可能感兴趣的:(机器学习中的数学,条件概率,乘法定理,全概率公式,贝叶斯公式)