知识笔记| 辛普森悖论

辛普森悖论也叫辛普森佯谬。先解释下佯谬,大概意思就是看起来是错误的,实际却是正确的。

这是个统计学里面的概念,是E.H.Simpson在1951年提出来的。该悖论大致就是说某种条件下的两组数据,单独讨论这两组都会满足某种性质,但是一旦将这两组一同考虑,却会出现不同的性质。我们举一个简单的例子来说明一下:

假设中国光电科学技术大学只有 光学工程学院 与 仪器科学学院 各个学院物理考试及格率情况如下:

知识笔记| 辛普森悖论_第1张图片
Fig.1 考试情况统计

通过上表我们可以看出 中国光电科学技术大学中 光学工程学院 与 仪器科学学院 的物理考试中 每个学院的女生合格率都比男生合格率高,而且学校只有两个学院,你一定会认为对于整个学校女生的合格率也会更高,其实结果不然。这就是著名的辛普森佯谬。

至于它在统计学中的作用,以及在我们工作中如何避免,就不多说了;因为我也说不明白,不是这个专业的。但是如果你感兴趣可以自己多去了解,这里只希望激发你的兴趣。

你可能感兴趣的:(知识笔记| 辛普森悖论)