有一种药物,对男人有害,对女人也有害,但是,对人类有益

辛普森悖论。

它说的是,假设有一种药物,对男人有害,对女人也有害,但是,对人类有益。是的,你没听错,就是一种药,对男人有害,对女人有害,但是对人类有益。你可能觉得,这不是自相矛盾吗?太匪夷所思了。别急,听完下面的推论,你会觉得更匪夷所思。

首先,这个结论是有扎实的数据支撑的。假设,这个实验把患者分成了两个组,一个是吃药的处理组,一个是没吃药的对照组。处理组包括40名女性和20名男性。而对照组反过来,包括40名男性和20名女性。但是,两个组的总人数是相同的,都是60人。

然后,在没吃药的对照组,40名男性中,有12人患上了心脏病,患病率是30%。20名女性中,有1人患上了心脏病,患病率是5%。而在吃过药的处理组,20名男性,有8人患病男性不吃药,患病率是30%,吃了药,患病率是40%。显然,药物对男性有害。而女性,不吃药,患病率是5%,吃了药,患病率是7.5%。一目了然,它对女性也有害。

但是,接下来,反常的数据出现了。假如把男性和女性的人数加在一起,重新计算这个比例。它就变成了在没吃药的60个人里,得病的总数是13人,%。而吃过药的60个人,得病的人数是11人,患病率是18%。再重复一遍,从总人数上看,不吃药,患病率是22%,吃药,患病率是18%。这就得出了一个结论,这个药对人有效。

前前后后把这些结论连在一起,就构成了辛普森悖论。一个药对男人有害,对女人也有害,但是对人类有益。假如你还是不信的话,我在音频稿里,放了一张辛普森悖论的图表,你可以看看,一目了然。

辛普森悖论本身并不是一个新发现,它已经让学术界争论了几十年。这回,珀尔从因果关系的角度,提出了一个新解法。这就是,你要找到造成辛普森悖论的混杂因子。所谓混杂因子,就是同时会影响原因和结果的那个因素。在这个实验里,吃不吃药是原因,有没有得病是结果。那么,是什么因素,同时在干扰这两点呢?仔细想想,你就会发现,是性别。

你看,男性和女性服药前后的发病率不一样,说明性别对服药结果有影响。同时,在对照组里,男性比女性多,而在处理组里,男性比女性少。这说明,男女的服药比例,也跟性别有关。好,到这一步,我们可以确定,性别是这个实验里的混杂因子。这个混杂因子,也叫后门路径。它就像在这个因果链条里,开启了一个后门,然后从后门进入,干扰因果关系。

意识到性别这个混杂因子之后,你要做的,就是阻断这个混杂因子。所谓阻断,其实就是要坚守一个原则,那就是,绝不能把跟混杂因子相关的因素,直接加在一起,一定要分开计算。体现在这个实验里,性别是混杂因子,你就不能把男女的人数直接加在一起,而是要分别计算男女各自的得病概率。分开计算之后,这个混杂因子的干扰,就被排除了。被排除之后,你才能做接下来的统计。

按照这个方法,男性服药前的得病概率是30%,女性服药前的得病概率是5%。那么就可以算出,对男女总体而言,服药前的得病概率是二者的平均值,17.5%。而服药后,男性的得病概率40%,女性是7.5%,平均值是23.75%。你看,算完之后,对男女总体来说,服药前得病的概率是17.5%,服药后是23.75%。这么一来,你就获得了一个正确的结论。这个药对男性有害,对女性有害,对人类也有害。辛普森悖论。

它说的是,假设有一种药物,对男人有害,对女人也有害,但是,对人类有益。是的,你没听错,就是一种药,对男人有害,对女人有害,但是对人类有益。你可能觉得,这不是自相矛盾吗?太匪夷所思了。别急,听完下面的推论,你会觉得更匪夷所思。

首先,这个结论是有扎实的数据支撑的。假设,这个实验把患者分成了两个组,一个是吃药的处理组,一个是没吃药的对照组。处理组包括40名女性和20名男性。而对照组反过来,包括40名男性和20名女性。但是,两个组的总人数是相同的,都是60人。

然后,在没吃药的对照组,40名男性中,有12人患上了心脏病,患病率是30%。20名女性中,有1人患上了心脏病,患病率是5%。而在吃过药的处理组,20名男性,有8人患病,患病概率是40%。40名女性,有3人患病,患病率是7.5%。

男性不吃药,患病率是30%,吃了药,患病率是40%。显然,药物对男性有害。而女性,不吃药,患病率是5%,吃了药,患病率是7.5%。一目了然,它对女性也有害。

但是,接下来,反常的数据出现了。假如把男性和女性的人数加在一起,重新计算这个比例。它就变成了在没吃药的60个人里,得病的总数是13人,患病率是22%。而吃过药的60个人,得病的人数是11人,患病率是18%。再重复一遍,从总人数上看,不吃药,患病率是22%,吃药,患病率是18%。这就得出了一个结论,这个药对人有效。

前前后后把这些结论连在一起,就构成了辛普森悖论。一个药对男人有害,对女人也有害,但是对人类有益。

辛普森悖论本身并不是一个新发现,它已经让学术界争论了几十年。这回,珀尔从因果关系的角度,提出了一个新解法。这就是,你要找到造成辛普森悖论的混杂因子。所谓混杂因子,就是同时会影响原因和结果的那个因素。在这个实验里,吃不吃药是原因,有没有得病是结果。那么,是什么因素,同时在干扰这两点呢?仔细想想,你就会发现,是性别。

你看,男性和女性服药前后的发病率不一样,说明性别对服药结果有影响。同时,在对照组里,男性比女性多,而在处理组里,男性比女性少。这说明,男女的服药比例,也跟性别有关。好,到这一步,我们可以确定,性别是这个实验里的混杂因子。这个混杂因子,也叫后门路径。它就像在这个因果链条里,开启了一个后门,然后从后门进入,干扰因果关系。

意识到性别这个混杂因子之后,你要做的,就是阻断这个混杂因子。所谓阻断,其实就是要坚守一个原则,那就是,绝不能把跟混杂因子相关的因素,直接加在一起,一定要分开计算。体现在这个实验里,性别是混杂因子,你就不能把男女的人数直接加在一起,而是要分别计算男女各自的得病概率。分开计算之后,这个混杂因子的干扰,就被排除了。被排除之后,你才能做接下来的统计。

按照这个方法,男性服药前的得病概率是30%,女性服药前的得病概率是5%。那么就可以算出,对男女总体而言,服药前的得病概率是二者的平均值,17.5%。而服药后,男性的得病概率40%,女性是7.5%,平均值是23.75%。你看,算完之后,对男女总体来说,服药前得病的概率是17.5%,服药后是23.75%。这么一来,你就获得了一个正确的结论。这个药对男性有害,对女性有害,对人类也有害。

你可能感兴趣的:(有一种药物,对男人有害,对女人也有害,但是,对人类有益)