数据分析-后验概率

一个小问题:已知有两个盒子,一号盒里有18枚黑棋和2枚白棋,2号盒里有4枚黑棋盒16枚白棋,现将两盒置于箱中,随机从其中一个盒子抽出一枚棋子,为白棋,你认为这枚白棋从几号盒里抽出的概率更大?从2号盒抽出的概率为多少?

如果我们不知道抽出的结果,那么两个盒子概率各50%;当我们知道抽出为白棋的时候,我们就知道更大的可能是从2号盒抽出的,不用理论分析,直觉告诉我们就是如此。

但是数据分析不是一个仅仅依靠直觉的学科,依靠直觉说服不了别人,我们需要更专业的解读,那就是后验概率。

我们先用我们自己的方法试着做这道题:

            1号盒抽出白棋的概率 P(w1)=1/10;

            2号盒抽出白棋的概率 P(w2)=8/10;

            抽中1号盒并抽出白棋的概率P(w,1)=1/2*1/10=1/20;

            抽中2号盒并抽出白棋的概率P(w,2)=1/2*8/10=8/20;

那么白棋是从2号盒抽出的概率P(2|w)===8/9;

可以理解吗?看起来很简单吧。

我们回过头看一下贝叶斯公式——后验概率的公式,我把详细的过程写出来。

贝叶斯公式:

            P(A|B)===

            (由于输入问题,这里用!A表示非A)

emmm。。。这个公式,简直就是鬼画符!

我们这里不解释每个表达式的含义,我们用另一种方式来解释这个公式。看下一个抽象一点的例子:

假设某个事件的结果为R的概率为P(R),造成B的原因有事件1、2、3,事件1、2、3发生的概率分别为P(1)、P(2)、P(3),事件1、2、3导致结果R发生的概率为P(R|1)、P(R|2)、P(R|3),现在事件结果R发生了,问事件1发生的概率是多少?

直观的理解:R发生的原因是事件1的发生概率为:事件1发生并导致R发生/事件R发生的概率

事件R发生的概率是什么呢?因为原因事件只有123,所以P(R)=事件1发生并导致R+事件2发生并导致R+事件3发生并导致R,即:

        P(R)=P(1,R)+P(2,R)+P(3,R)

很好理解吧?我们再分解一下,事件1发生并导致R发生:

        P(1,R)=P(1)*P(R|1);

就是事件1发生的概率*事件1导致R发生的概率,同理可得:

        P(2,R)=P(2)*P(R|2);

        P(3,R)=P(3)*P(R|3);

所以:

        P(1|R)==


我们带入看一下:

        P(1|R)=

有没有感觉很眼熟?没错,就是贝叶斯公式的123版本!

所以贝叶斯公式是什么?不记得了。

后验概率明白了吗?明白了!很简单!

你可能感兴趣的:(数据分析-后验概率)