在我们的生活中有很多事情可以追溯其因果关系。而在一定的条件下,我们可以根据贝叶斯公式由果去追溯它的因。贝叶斯公式在生活中的应用主要有疾病诊断,企业的资质评判,诉讼,市场预测,邮件过滤等方面。贝叶斯公式的推断是一种统计学的方法,可以用来估计统计量的发生概率的作用。本文举了两个例子,探讨了我们在生活对事件的判断的可靠性,从而使我们更加的知道我们平时一些概率问题要怎样去理性的判断与推测。
那么什么是贝叶斯公式呢?
贝叶斯公式可以这样描述:
若事件 , ,…… 是一个样本空间的划分,P( ) > 0 (i= 1,2,……n),A是任一事件且P(A) => 0,则有
P( | A) = (j = 1,2,……,n)
其中,P(A) 可由全概率公式得到,即
P(A)= ( ) P(A | )
贝叶斯公式可以写为:P(B|A)=P(AB) /P(A) P(A|B) = (AB) / P(B)
贝叶斯公式应用之一——重症肌无力 概率分析
重症肌无力(myasthenia gravis,MG)是一种主要累及神经肌肉接头突触后膜上乙酰胆碱受体 (acetylcholine receptor,AchR)的自身免疫性疾病。临床主要表现为部分或全身骨骼肌无力和易疲劳,活动后症状加重,经休息和胆碱酯酶抑制剂(cholinesterase inhibitors,ChEI)治疗后症状减轻。
当前医学对于重症肌无力的诊断方法主要有肌电图检查,血液检查,免疫病理学检查,胸腺影像学检查、药物检查、重复神经刺激(RNS)、疲劳试验等。
现在我们讨论其中的一种检查方法的可靠性——疲劳试验。
我们得知,在这项疲劳试验检测中,患有重症肌无力中人中检测呈阳性的准确率是93.79%,而对于没有患重症肌无力的人检测呈阴性的准确率是99%,根据市场调查,重症肌无力的患病率是50/10万,也就是说,重症肌无力的患病率是0.05%,
接下来用贝叶斯公式分析这种诊断方法的可靠性。
设A = {检测结果为阳性(前提是不知道这个检测的人是否患有重症肌无力)}; B = {一个患有重症肌无力的人};
根据搜到的资料可知:P(B) = 0.0005,P(A|B) = 0.9379,P( ) =1-0.0005 = 0.9995,
P(A| ) = 1-0.99= 0.01
由:P(AB) = P(B|A) P(A) = P(A|B) P(B),P(A ) = P(A| ) P( ),
得:P(A) = P(AB) + P(A ) = P(A|B) P(B) + P(A| ) P( ) = 0.9379X0.0005+ 0.01X0.9995 = 0.01046
P(B |A) = = ≈ 0.04483 = 4.483%
由结果我们可以看到,被检测出患有重症肌无力的人确实是确诊的概率只占4.483%,与上面的93.79%偏差很大,为什么会出现这种结果呢?原因是此病的患病率很低。
一般人认为这项疲劳试验检测的确诊率会有90%左右,然而我们通过贝叶斯公式显示出来的结果是4.483%,结果让人一惊。
如果单独用这项检测给一般人检测,那结果可想而知,会给很多检测者带来不必要的恐慌。
我们可以分析一下,按照我们上面查到的资料,人群中患有重症肌无力每50万人中才有10个,也就是没5万人才有1个,而按照这种疲劳试验法检测出来的人中检测结果是阳性的人数是50000*0.01046 = 523(人),这种结果也让人难以相信,但是事实检测出来是这样。
不过现代医学对于重症肌无力的检测方法不只是这样,他们会根据各个检测试验检测出来的结果去综合判断,就是说他们会用几种不同的检测方法去综合判定结果。
由上面算出的各个结果可知:
P( ) = 1 -P(A) ≈ 1 - 0.01046 = 0.98954
接下来再算一下检测出来的结果是阴性的而被检测的人是没有患病的概率:
P( ) = = = 0.9995 = 99.95%
由此可见,检测出阴性出来的结果是没有患病的几率是很大的,这样检测出来结果的可信度很高。贝叶斯公式应用之二——盗窃案
比如说现在发生了一起盗窃案,根据调查显示:甲可能在那段发生盗窃的时间段出现的概率是10%,而乙出现的概率是90%。现在找到了一个目击者,他说甲是到贼,而甲的可信度是80%。
这个事件中包含两个信息,但人们往往只根据当事人说的去判断事物的真假。
下面我们来分析一下目击者所说的话的可信度:
设A = {甲是盗贼};B = {乙是盗贼};C = {目击者所说的甲是盗贼};
得:P(A) = 0.1,P(B) = 0.9;P(C|A) = 0.8;P(C|B) = 0.2
目击者所说的话正确的概率:
P(A|C) = = = = ≈ 0.308
由此可见,盗贼更有可能是乙,它的概率是69.2%
对于贝叶斯公式的应用,它也有它的限制性,人们在事物的本身上有时会更多的根据自己的主观去看待,从而使得事物的准确性失真。
因此,我们可以得出一点结论:在我们评判一个事件的概率时,要综合考虑事件的基础概率,也就是事件的提前概率,不能片面和主观的去评判事件。一个事件的条件概率的高低并不直接决定某一事件会出现概率的高低。