一天一个统计小知识——辛普森悖论

本文介绍一下统计中一个常见的概念:“辛普森悖论”

辛普森悖论是在说:在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

怎么理解这句话呢?下面使用一个小例子来进行具体声明。
例子:鹅厂为了比较英雄联盟和王者荣耀这两款游戏哪个更受欢迎,分别抽取了1000个男生和1000个女生进行问卷调查,调查结果(假设英雄联盟和王者荣耀只能玩一个)如下表所示:

在这里插入图片描述

发现了什么?单单从女生或者男生的角度来看,英雄联盟的好评率都是比王者荣耀高的但是如果从整体来看,反而是王者荣耀的好评率更高,这就是很典型的“辛普森悖论”。

为什么会出现在分组比较中都占优势的一方,在总评中有时反而是失势的一方?
这主要是由于各组权重不一样所导致的

所以我们在进行数据分析的时候,想简单的通过将分组结论进行相加得到整体结论的时候,就要警惕“辛普森悖论”,因为它很有可能会出现与真实的整体结论恰好相反的情况哦。

你可能感兴趣的:(一天一个统计小知识)