贝叶斯定理、例子

Bayes’ Theorem

  • 事件的发生都是有因果的(这里的因果不是必然关系,他们之间的联系是用概率刻画的),原因(或者因素)是 x x , 结果(或者影响)是 y y ,贝叶斯定理告诉一个事实,如果知道因素 x x 已经触发的条件下,产生影响 y y 的概率是 Pr(y|x) P r ( y | x ) ,那我们可以得到产生影响 y y 的条件下,因素 x x 被触发的概率 Pr(x|y) P r ( x | y ) 为:

    Pr(x|y)=Pr(y|x)Pr(x)Pr(y)(1) (1) P r ( x | y ) = P r ( y | x ) P r ( x ) P r ( y )

  • 这里 Pr(x) P r ( x ) 是知道产生影响 y y 前,因素 x x 发生的概率,称为因素 x x 先验概率(prior probability of x) Pr(x|y) P r ( x | y ) 则是知道影响 y y 已经产生,因素 x x 被触发的概率,称为x的 后验概率(posterior probability of x)

例子

令随机变量 x x 表示一个人说的话是真话(true)或者谎话(false),随机变量 y y 表示一个很牛逼的测谎仪的输出(true or false),已知:

Pr(y=false|x=false)=0.99(2) (2) P r ( y = f a l s e | x = f a l s e ) = 0.99

Pr(y=true|x=true)=0.95(3) (3) P r ( y = t r u e | x = t r u e ) = 0.95

可以看出来测谎仪确实高大上,钱没白花。现在我们假设 x x 的先验概率是:
Pr(x=false)=0.001(4) (4) P r ( x = f a l s e ) = 0.001

也就是说这个人基本不会说谎话,但是对这个人用测谎仪的时候,测谎仪说这个人说了谎话(难道说我不帅了?没毛病老铁)。那怎么办,我们怎么判断?对于测谎仪的可靠性可以比较 Pr(x=false|y=false) P r ( x = f a l s e | y = f a l s e ) Pr(x=true|y=false) P r ( x = t r u e | y = f a l s e ) 的大小来判断。
1. 计算先验 Pr(y=false) P r ( y = f a l s e )
Pr(y=false)=Pr(y=false|x=false)Pr(x=false)+Pr(y=false|x=true)Pr(x=true)0.051(5) (5) P r ( y = f a l s e ) = P r ( y = f a l s e | x = f a l s e ) P r ( x = f a l s e ) + P r ( y = f a l s e | x = t r u e ) P r ( x = t r u e ) ≈ 0.051

  1. 用贝叶斯定理:
    Pr(x=false|y=false)=Pr(y=false|x=false)Pr(x=false)Pr(y=false)0.019(6) (6) P r ( x = f a l s e | y = f a l s e ) = P r ( y = f a l s e | x = f a l s e ) P r ( x = f a l s e ) P r ( y = f a l s e ) ≈ 0.019

    因此,
    Pr(x=true|y=false)=1Pr(x=false|y=false)0.981(7) (7) P r ( x = t r u e | y = f a l s e ) = 1 − P r ( x = f a l s e | y = f a l s e ) ≈ 0.981

所以,(6)小于(7),结论是测谎仪的输出并不可靠啊,不过我依旧无条件的帅好吧。
注意当先验 Pr(x=false)>0.048 P r ( x = f a l s e ) > 0.048 时,(6)大于(7),这时候测谎仪的结果变得越来越可信哦。

你可能感兴趣的:(概率论)