统计学中贝叶斯公式的理解

知识点学习:
(1)先验概率
(2)后验概率
(3)贝叶斯公式
(4)频率学派
(5)贝叶斯学派

1. 贝叶斯公式的起源:
统计学中,一直有两大门派,一派称为频率学派;另外一派称之为贝叶斯学派。
频率学派,其特征是把需要推断的参数θ视作固定且未知的常数,而样本X是随机的,其着眼点在样本空间,有关的概率计算都是针对X的分布。
频率学派从「自然」角度出发,试图直接为「事件」本身建模,即事件A在独立重复试验中发生的频率趋于极限p,那么这个极限就是该事件的概率。
只是从数据本身获得结论,并不考虑逻辑推理和先验知识。
举例:**
想要计算抛掷一枚硬币时正面朝上的概率,我们需要不断地抛掷硬币,当抛掷次数趋向无穷时正面朝上的频率即为正面朝上的概率。
贝叶斯学派他们把参数θ视作随机变量**,而样本X是固定的,其着眼点在参数空间,重视参数θ的分布,固定的操作模式是通过参数的先验分布结合样本信息得到参数的后验分布。**
通过引入先验知识和逻辑推理处理不确定问题。
举例:
比如往台球桌上扔一个球,这个球落会落在何处呢?如果是不偏不倚的把球抛出去,那么此球落在台球桌上的任一位置都有着相同的机会,即球落在台球桌上某一位置的概率服从均匀分布。这种在实验之前定下的属于基本前提性质的分布称为先验分布,或的无条件分布。

贝叶斯提出一种思考方式:
先验概率 + 样本信息 = 后验概率
即人在开始试验之前,有一个对某个事件的预先判断概率,称之为先验概率,然后通过试验样本,通过实验结果,得到新的信息,然后重新修正先验概率,得到后验概率。可以理解为通过对样本信息的不断学习,迭代更新先验概率,得到后验概率。贝叶斯公式描述了这一动态更新的过程。
2.贝叶斯公式的目标
利用先验概率,和样本信息,得到后验概率分布。
举例:
已知某种疾病的发病率是0.001,即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。现有一个病人的检验结果为阳性,请问他确实得病的可能性有多大?假定A事件表示得病,那么P(A)为0.001。这就是"先验概率",即没有做试验之前,我们预计的发病率。再假定B事件表示阳性,那么要计算的就是P(A|B)。这就是"后验概率",即做了试验以后,对发病率的估计。

统计学中贝叶斯公式的理解_第1张图片
解释:
P(A): 先验概率
P(B|A): 根据样本信息得到的概率
P(B|~A) : 根据样本信息得到的概率
P(A|B): 最终得到的后验分布

我们得到了一个惊人的结果,P(A|B)约等于0.019。也就是说,即使检验呈现阳性,病人得病的概率,也只是从0.1%增加到了2%左右。这就是所谓的"假阳性",即阳性结果完全不足以说明病人得病。
3. 贝叶斯公式的本质
本质是一个条件概率,也是一个后验概率。
P(A|B): 事件A在事件B发生情况下之后的概率,也称之为后验概率。
4. 贝叶斯公式应用的条件
(1)事件A的先验概率P(A)
(2)根据样本B信息得到的条件概率信息P(B|A)P(B|~A)
5. 最终求得的目标概率
P(A|B): 最终得到的后验分布, 事件A在事件B发生情况下的概率。

你可能感兴趣的:(统计学习)