<深入浅出数据分析>之⑥贝叶斯统计

问题:判断患病的概率

主要内容:条件概率、基础概率、贝叶斯规则


背景:医生说你已染上蜥蜴流感,需被隔离一段时间,你想看看诊断试验结果的准确性

诊断试验正确性分析报告:

若某人已患蜥蜴流感:试验结果为阳性的概率为90%

若某人未患蜥蜴流感:试验结果为阳性的概率为9%

<深入浅出数据分析>之⑥贝叶斯统计_第1张图片
第一次试验报告

以上概率称为条件概率,即以一件事的发生为前提的另一件事的发生概率。

<深入浅出数据分析>之⑥贝叶斯统计_第2张图片
概率术语

疾病追踪中心:研究表明总人口中有1%的人患有蜥蜴流感

该数据称为基础概率,又叫事前概率。在根据试验结果分析之前,已经知道的概率。如果有基础概率,一定要考虑。

假设以1000人为基础计算你患蜥蜴流感的概率:

<深入浅出数据分析>之⑥贝叶斯统计_第3张图片
第一次计算概率

将概率转变为整数,然后进行思考,是避免犯错误的一个有效办法。

<深入浅出数据分析>之⑥贝叶斯统计_第4张图片
计算公式

第一次计算结果得出9%的概率,比一般人高9倍!

你决定让医生给你做个更高级的诊断试验,正确性分析报告如下:

若某人已患蜥蜴流感:试验结果为阳性的概率为99%

若某人未患蜥蜴流感:试验结果为阳性的概率为1%

贝叶斯规则可以反复使用,注意每次使用时,要根据上一次的结果调整新的基础概率。此时你的新基础概率则为第一次计算的9%,同样按照第一次计算的方法计算,最终得出“在结果为阴性条件下患病的概率为0.1%”。

注意:避免基础概率谬误的唯一方法就是对基础概率提高警惕,而且务必要将它整合到分析中去。

                                                                                                                    截图来自原书

你可能感兴趣的:(<深入浅出数据分析>之⑥贝叶斯统计)