贝叶斯定理之过程推导

介绍贝叶斯定理之前,需要先介绍一下条件概率:假设有随机事件A和B,P(A|B)表示事件B发生的条件下事件A发生的概率,下面是简单的理解和推导过程:


贝叶斯定理之过程推导_第1张图片

如上图,蓝色区域表示事件A,橙色区域表示事件B,两个圆的交集表示事件A和事件B同时发生。我们再来看看P(A|B),其对应的样本空间为事件B发生的概率P(B),即图中的橙色部分;对应的事件为P(A∩B),即图中两圆相交的区域,因此,有 P(A|B)=P(AB)P(B) P ( A | B ) = P ( A ⋂ B ) P ( B ) ,即为条件概率的公式。

接下来就是贝叶斯定理
还是一样,有这样一个例子:
有甲、乙两条生产线,甲生产线的产品合格率为90%,乙生产线的产品合格率为95%,两条生产线的生产量占比分别为30%和70%,现在发现了一件不合格品,判断这个不合格品是甲生产线生产出来的概率?
假设现在生产出来的产品总量为1000个,如图中所示,甲乙生产线的产量分别是300和700个,则不合格品分别为30和35个


贝叶斯定理之过程推导_第2张图片

不合格品总数 =甲不合格数量 +乙不合格数量 =总产量 甲产量占比 甲不合格率 +总产量 乙产量占比 乙不合格率 =总产量 *P(甲) *P(不合格|甲) +总产量 *P(乙) *P(不合格|乙);
P(甲|不合格) =甲不合格数量/不合格品总数 =总产量 *P(甲) *P(不合格|甲)/(总产量 *P(甲) *P(不合格|甲) +总产量 *P(乙) *P(不合格|乙)) =P(甲) *P(不合格|甲)/(P(甲) *P(不合格|甲) +P(乙) *P(不合格|乙));
现在用A表示不合格品,B1,B2分别表示甲乙两条生产线,上市可表示为:

P(B1|A)=P(B1)P(A|B1)P(B1)P(A|B1)+P(B2)P(A|B2) P ( B 1 | A ) = P ( B 1 ) P ( A | B 1 ) P ( B 1 ) P ( A | B 1 ) + P ( B 2 ) P ( A | B 2 )

更一般的,假设有n条生产线,分别用 Bi B i 表示,i = 1,2,3…n,公式可写成:

P(Bi|A)=P(Bi)P(A|Bi)nj=1P(Bj)P(A|Bj) P ( B i | A ) = P ( B i ) P ( A | B i ) ∑ j = 1 n P ( B j ) P ( A | B j )

这就是贝叶斯定理的一般形式。

你可能感兴趣的:(机器学习)