原因与结果经济学|大数据时代,如何做一个不被蒙蔽的思考者?

我们的生活,是由零零碎碎的决策影响的

从买房生子,到锅碗瓢盆

在这个大数据满天飞的年代,各种数据影响了我们的决策

如何能摒弃无稽之谈的蒙蔽呢?给自己一双慧眼呢?

《原因与结果经济学》这本书,以生活中发生的案例,教我们掌握因果推理的基本思维方法。减少我们浪费的时间和金钱。

先来简单了解下本书的作者:中室牧子,哥伦比亚大学经济学博士,曾任职于日本银行和世界银行,其代表作有《原因与结果经济学》《学力的经济学》。另一位作者津川友介,是哥伦比亚大学的医疗政策学博士,曾任职于世界银行和哈佛大学。看到这两位作者的介绍,发现他们分别在经济和医疗领域做过研究工作。这也是本书的基调,采用读者最关心的医疗和经济案例,解析最基本的因果分析原理,都是一些很基础的知识,令没有受过经济学训练的读者也能够轻松理解

在了解因果关系推理能为我们的生活带来哪些改变前,先思考两个问题:

与优秀的人在一起,也会变的优秀吗?

孩子上重点学校,成绩就会提高吗?

带着自己的答案,咱们一起看看下面的内容:

经济学领域将周围人给于的影响称为"同群效应",我们认为孩子上重点学校,能跟学霸一起学习,就算我家孩子实力差点,成绩也会逐渐提高的,所以学校附近的房价每年都蹭蹭上涨,事实真的是如此吗?

书中用"断点回归设计"方法对这个问题进行了分析

断点回归设计:任意决定的断点值两侧自然称为干预组与对照组的情况,推算因果效应的方法

选取3所初中学校,分析他们的中考录取情况,分数高的去重点中学,分数一般的去普通的高中学习。我们能看到,重点高中的学生相对比较优秀,普通高中的学生成绩自然要差一点

考上重点高中的学生,有部分是勉强过录取线的;上普通高中的学生也有部分是差个一两分没有考上的。把这两组学生用断点回归设计进行对比论证,是否和学习能力强的学霸在一起学习成绩也会提高?

这个实验是麻省理工的研究人员研究的一个课题。咱们普通人能力有限,无法进行论证,咱们了解其内在的思考逻辑就行。

咱们要明白到底是"因为和学霸在一起,所以自己的成绩提高了"(因果关系)还是,"学习能力强的孩子更愿意与学霸在一起"(相关关系)

研究结果表明,和学霸在一起几乎不会对孩子的学习能力产生影响,打铁还需自身硬,提高自己才是王道

在这个例子当中,有"因果关系"和"相关关系"两个概念。在《原因与结果经济学》这本书通篇就在讲:因果关系推理步骤和方法

为什么要学习因果关系推理方法

我们在生活中做任何决策,都会花费金钱和时间,比如,有些家长会鼓励自家的孩子跟学霸一起玩,认为跟学霸一起,自家孩子的成绩也会提高,可事实真是如此吗,我们不能够确定这里是否有因果关系,所以我们要通过这本书去学习因果思维的推理方法,如果搞不清,不仅得不到成效,还会白白浪费金钱和时间。如果依据因果关系有效的把金钱和时间利用起来,我们获得的满意成果的效率也会更高。

因果推理的4个步骤

1 区分"因果关系"和"相关关系"

因果关系:两个事件中,前一个事件是后一个事件的原因,后一个事件是前一个事件的结果

相关关系:如果一个事件变化后,另一个事件也随之改变,但二者不属于原因和结果的关系,则称它们之间为"相关关系"

2 判断因果关系的三个要点

下面我会用"变量"这个词代替因果关系中的"事件",有助于更好的理解。

判断两个变量是否属于因果关系,可以通过三个问题:

  • 是否"纯属巧合"

比如,某导演的电影上映,股票就跌

又或者,蝴蝶在亚洲煽动翅膀,南美就会刮飓风

这两个例子当中,前事件与后事件的发生没有任何关系,完全就是碰巧

在我们生活中,把纯属巧合当成因果关系的比比皆是

所以,我们在判断是否存在因果关系时,先看看两个变量之间的关系是否纯属巧合

  • 是否存在"第三变量"

第三变量,按照术语来讲就是"混杂因素"

再打一个比方,有些热衷于教育的家长让孩子锻炼身体,因为相信孩子体力好,学习成绩也会提高,同时还督促孩子学习,因此孩子的学习能力也比较强。咱们来看一下,体力与学习之间是否存在因果关系。

我们可以看到,体力好不能提高学习成绩,所以两个变量之间不具有因果关系

热衷于教育的父母和体力之间是有因果关系的

热衷于教育的父母和提高成绩是有因果关系的

所以,热衷于教育的父母是混杂因素,它把相关因素包装成了因果关系

  • 是否存在"逆向因果关系"

本以为是原因的事件其实是结果,本以为是结果的事件其实是原因

举个例子:警察多的地方,治安也差

我们思考一下,到底是因为警察多,所以那个地区的治安才差,还是说治安差的地方,警察也多

所以,我们在探讨两个变量之间是否存在因果关系的时候,要考虑两个变量的原因结果是否弄反了

3 证明因果关系需要"反事实"

比如:如果我当时没有跟他结婚,我现在生活会是啥样呢?

如果我不辞职,我现在的收入有多少呢?

发现没,反事实就是对过去的事情,假设没有发生过

举个例子,假如你在淘宝开店,考虑在情人节那天投放广告提高销量。一切就这么定了,你在那天投放了广告,如你所料,销量增长了,你很开心。

开心后,咱们来冷静思考下:广告和销量之间真的存在因果关系?问问自己,有没有可能"即使不投放广告,销量也会增长"

那么如何判断广告和销售额之间存在因果关系呢?

咱们继续,在情人节这天,你投放广告的销量是100万。然后你假象一下自己情人节那天未投广告,那天的销售量是50万,这样的话,就能确定是因为投了广告销量才增长的。

也就是说,通过反事实"如果情节人那天未投广告"证明广告与销量间是存在因果关系的。

这里还有一个问题:我们能知道事实,但无法确定反事实,就像上面举的例子,我们不能够知道未投广告的销量是多少,这个问题被称为"因果推理中的根本问题",即便如此,要证明因果关系,反事实是必经之路

4 调整到可比较的状态

还用上面的例子,假设有一家淘宝店,跟你的店是"可比较"的,它在情人节那天没有投放广告,那你就可以用它的销量作为最贴切的值,来替换上面所提到的"如果情节人那天未投广告"(反事实)

但是,这里有个问题要注意,怎样才能称为"可比较"

假设两家淘宝店,在店铺装修,流量,上架产品数量,销售人群等等有可能影响销量的各个方面都非常接近,唯一的区别就是"有没有投广告",那么,这就是可比较的

明确因果关系的方法

明确因果关系的方法有很多种,这些方法的目标都是"制造可比较的组,用最贴切的值替换反事实"

在这里先提一下"证据"这个概念,可信度高的证据是由能正确判断因果关系的方法推导出来的。所以,下面我们就利用推导可信度高的证据的方法去判断因果关系,这也是论证因果关系的工具

62c145ed22604c89b36cd4347e0aacf0.jpg

证据等级(自己拍的)

通过这张图,能看到证明因果关系最确凿的方法是元分析,其次是随机对照试验。而元分析是多个随机对照试验的整合,所以,随机对照试验是重点要了解的。

1 随机对照试验:

在医学研究中,为了确定药物疗效与安全性会拿小白鼠做试验。把生病的小白鼠分为两组,一组是吃了咱们研制的药的小白鼠(称为干预组),另一组是没有吃药的小白鼠(称为对照组)。如果吃药的小白鼠痊愈率高,则认为药物有效。

为什么要用小白鼠呢?因为在随机试验中,小白鼠的个体差异并不明显,只要数量够多,能够随即划分就行,不会因为个体的差异而影响结果

之前提到过,所有方法的目标都是"制造可比较的组,用最贴切的值替换反事实",随机试验就是用对照组替换"如果干预组没有吃药"的反事实

随机对照试验等级很高,但实施的过程中会遇到很多困难,比如,成本高,有些试验出于伦理方面的考虑无法实施等因素。那么,无法实施随机对照试验我们怎么去分析呢。

在大数据时代,我们手头有各种各样的数据,完全可以利用起来

2 利用与试验类似的偶发现象进行自然试验:

如何利用自然实验进行分析呢?还是拿开淘宝店为例,假设进行随机试验有难度,你决定为旗下的5家同淘宝店铺打广告,但由于一些原因,其中2家店铺未能投放,遇到这种情况,怎么办呢?想想看,是不是可以对投放广告和未投放广告的淘宝店进行比较,这样是不是就能评估出广告给销量带来的因果效应呢?实际上,这正式自然试验的思维方式

其实就是利用现有的数据,在与随机对照试验类似的环境下,从而明确两个变量间的因果关系

书中还介绍了很多其他的方法,比如利用第三方变量的工具法等等,方法很多。利用推理因果关系的方法和步骤,帮助自己提高时间效率和节省金钱损失

在被"大数据"包裹的今天,各种数据分析随处可见,市场上也充斥着各种分析类书籍,然而,数据本身是一连串的数字,如何解读数据才是关键。用确定因果关系的方法,能让我们少走弯路,省下更多的金钱和事件做更有意义的事情,何乐而不为呢

你可能感兴趣的:(原因与结果经济学|大数据时代,如何做一个不被蒙蔽的思考者?)