数据统计不能做因果判断,只能提供相关性证明

【反思】
达尔文在其《人类的由来及性选择》一书当中倒是提出了一项有助于理解各种有关月亮的生理性作用的科学概念:海生理论。该理论的大致意思是因为所有地球生物皆源自海洋,所以地球上各种生物体的生理循环都以潮汐为固定周期,即以七天为半个循环,14天为完整的周期。海洋潮汐之所以具备如此独特的变化规律,完全是源自月球引力。
我们在这里应该指出一点:达尔文总结的海洋潮汐和生理循环的周期性都是正确的;但是非常不幸,这位博物学家犯下了统计学家的职业病:即找到了具有共同规律的事件就敢于十分莽撞地断定这些事件必然存在着某种因果联系。他们从来不愿意考察这些具有相同统计规律的事件是否可能是同原因引发的两种结果,抑或事件的因果顺序正好和他们所总结的理论相倒置。在医学和生物学领域,最为搞笑的科学统计便是日均食盐摄入量与高血压发病率的关系。"科学"的"统计数据"除了能揭示这两者间存在相关性,再不能说明任何实质问题。
借助于统计学,我们确实可以将食盐摄入过多解释为高血压的致病原因。但是同样根据统计学,中医们亦可以说因为某些西医们不懂的原因,比如"肾虚",人们会出于生理本能而在不知不觉当中加大了食盐的日常摄入,并且最终会因为"肾虚"而非盐分过多才导致血压增高。这种中西医基础观念的有趣博弈教育了我们:千万别迷信统计学的种种因果判断,统计学仅提供相关性的证明!
达尔文曾经讲述的案例恰恰是典型。海洋潮汐并不是制造了生理周期性的原因,而和生理周期性一样,都是月亮变化所导致的显著结果。

你可能感兴趣的:(数据统计不能做因果判断,只能提供相关性证明)