相关性与因果性

相关性与因果性

相关性和因果性,我想大家一定都是了解一些的。但可能模模糊糊,有一些说不清楚的地方。所以,这次的分享,我就选择了这个话题,给大家讲讲相关性与因果性,最容易被错误使用两种的情况!

先讲个笑话:

我:“心理医生好牛X啊,什么都知道,你们怎么做到的?”心理医生:“就是做逻辑推理分析因果关系,这么说你也不懂,给你示范一下吧,你养狗吗?”A:“养啊。”心理医生:“那么说你很喜欢动物了,推理下吧,你也应该很喜欢你的孩子吧。”A:“那当然”心理医生:“你有孩子,那你肯定有老婆吧。”A:“卧槽,说的太准了。”心理医生:“你有老婆,这么说,你不是同性恋喽!”A:“服了你了,我明白了,现在也找个人测试测试去。” 。。。。。。。。。。。。 我:“你养狗吗?”照坤:“不养。”A:“你是Gay?!!!”

一 相关性 ≠ 因果性

专家说,一天一个苹果,癌症的发病率会降低90%!

你深信以上这种说法吗?是不是为了不得癌症我们就要天天吃苹果?

相信死理性派的读者,不会轻易就得出结论。但轻易下结论是很多人经常犯的毛病,为了分析类似这种结论的可信程度,我们先来看看这种结论都是如何得出的。

为了研究吃苹果和癌症之间的关系,研究人员通常是这样做的:

首先在一定的人群中统计一下他们是否平时常吃苹果,挑选出常吃苹果的一组和不常吃苹果的一组。然后进行癌症率测试,对总体结果进行统计,看看哪一组癌症发病率平均值更高,或者直接统计吃苹果频率和癌症之间的相关系数。如果常吃苹果的一组平均患癌率更低,那么研究人员就会得出结论:常吃苹果和癌症高之间是呈负相关的关系的。

这里的一个致命的逻辑缺陷:相关性并不代表因果性!这是一个经常被人混淆,也经常被一些团体故意混淆已达到他们自己的目的。两个变量A和B具有相关性,其原因是有很多种的,并非只有A→B或者B→A这样的因果关系。一个很常见的导致相关性的可能性是A和B都是同样的原因造成的:C→A并且C→B,那么A和B也会表现出明显的相关性,但并不能说A→B或者B→A。

甚至相关性是百分百,也得不出因果性。

想要得出因果性,必须从理论上证明两个变量之间确实有因果性,并且要排除掉第三个隐含变量同时导致这两个变量的可能性。这个可就太难了,毕竟未知是无穷的!我们找不到隐含的变量,不代表它一定不存在!这就导出第二个观点。

二 因果性 ≠ 永恒,相关性 ≠ 没有依据

因果性,自带归纳法的“阿克琉斯之踵”,即“黑天鹅”的存在,使得未知无法消解,那么因果性,就只能是暂时的,等待新的证据出现,建立新的因果性。

在人类的知识领域内,可能只有数学能逃过此劫(然而哥德尔打破了这一幻想,详见哥德尔不完备定理)作为科学界的第一把交椅当之无愧。故而知识的强度:数学>物理>化学>生物>经济学>社会科学>等等。

也就是说因果性其实是有时效的,数学的时限最长,一个完美的证明,可能到宇宙覆灭,它都是正确的。但证据翔实,论证验证的社会学报告,可能发布的下一秒就会啪啪啪打脸。

但是相关性在实用角度讲,确是非常重要的。可以说,人类认识世界,发现/产生新知识只能从相关性开始。再者,最近异常火爆的人工智能和大数据,便是将相关性发挥到了极致,用概率替代因果,一样带来生产力质的飞跃。

我们不会因为因果性的暂时性和相关性的实用性,就放弃追求因果性,毕竟因果性是相关性的天花板。我们也不会因为相关性的随意,因果性的必然,就放弃寻找相关性,毕竟相关性的实用价值巨大。只要我们能分清两者的关系,知道彼此的局限和效用就好。

你可能感兴趣的:(相关性与因果性)