《为什么:关于因果关系的新科学 》作者: [美]朱迪亚·珀尔(Judea Pearl) / [美]达纳·麦肯齐(Dana Mackenzie)

原作名: The Book of Why : The New Science of Cause and Effect

ISBN: 9787521705072

内容简介:

在本书中,人工智能领域的权威专家朱迪亚·珀尔及其同事领导的因果关系革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位。

而因果关系科学真正重要的应用则体现在人工智能领域。作者在本书中回答的核心问题是:如何让智能机器像人一样思考?换言之,“强人工智能”可以实现吗?借助因果关系之梯的三个层级逐步深入地揭示因果推理的本质,并据此构建出相应的自动化处理工具和数学分析范式,作者给出了一个肯定的答案。作者认为,今天为我们所熟知的大部分机器学习技术,都建基于相关关系,而非因果关系。要实现强人工智能,乃至将智能机器转变为具有道德意识的有机体,我们就必须让机器学会问“为什么”,也就是要让机器学会因果推理,理解因果关系。或许,这正是我们能对准备接管我们未来生活的智能机器所做的最有意义的工作。


作者简介:

朱迪亚·珀尓(Judea Pearl),现加州大学洛杉矶分校计算机科学教授,“贝叶斯网络”之父,2011年因创立因果推理演算法获得图灵奖,同时也是美国国家科学院院士,IEEE智能系统名人堂第一批10位入选者之一。

目前已出版3本关于因果关系科学的经典著作,分别为《启发法》(1984)、《智能系统中的概率推理》(1988)和《因果论:模型、论证、推理 》(2009)。他还获得过多项顶级科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。

达纳·麦肯齐(Dana Mackenzie),普林斯顿大学数学博士,自由科学记者,知名科普作家,著有《无言的宇宙》等作品,其学术论文多次收录于《科学》《新科学家》《科学美国》《探索》等重量级期刊。


精彩书评:

壹:短评

#  打算当成一本科普畅销书来看,没想到是一本真正的科学思考书籍,对于逻辑、数学有一定基础要求。因果还是相关?这个我们曾直接接受的选项在本书中受到了质疑,固然有王婆卖瓜之嫌,但是对于do因子、非扰动因素、反事实假设、几种悖论的论述还是非常有意思,值得思考的。畅销书某种意义上让读者爽,反复用一本书,各个有点鸡汤的例子来说明一两个简单的道理;而真正有价值的书籍往往信息密度大,恨不得一本书里塞上一千个、一万个值得读者思考的点,而且不是那种能直接接受或质疑的点,是必须反复咀嚼、配合多个问题来回答的点。这本书提到的很多思维方式适合常常翻阅,刺激自己的大脑。

#  有一定难度,所谓“原因”就是“如果不这样的话则‘结果’不会发生”的思路还挺深刻的。

#  非常好看,讲述了因果推断这一个相当新的领域,而且作为一个学统计的,这里面的概念简直是mind-blowing

#  里程碑式的作品。真理掌握在少数人手中,庸人对于自己不理解的事情自有自己的解释方法。很多人看不懂,还要强行评论,汗。


贰:

若一位40岁的女性做了乳房X光检查以检测乳腺癌,其得到的检测结果为阳性。这位女性非常六神无主,问医生,这个数据可靠吗?我得了乳腺癌吗?医生说不一定啊,不过根据乳腺癌检测联合会(BCSC)的数据,对于40岁的患有乳腺癌的女性来说,乳房X光检查结果为阳性的概率为73%。若你为这位女性的家属,请问,在多大程度上她会患乳腺癌?她应该做手术吗?

或许你会说既然是73%的概率那么赶紧做吧!都这个时候了,宁愿信其有也不信其无啊!

其实,你这是走入了一个惯性推断误区。按照贝叶斯法则,这是一个典型的将前向概率混淆为逆概率的例子。

前向概率指的是,假设你的确患有乳腺癌,检测结果为阳性的概率:P(检测|疾病);逆概率指的是假定检测结果为阳性,检测者确实得了乳腺癌的概率为多大?也就是P(疾病|检测)。上述例子中的73%只是前向概率,它考察的是检测技术的灵敏性或准确度,这根本不是我们要关心的问题。显然,逆概率才是我们关心的问题,也就是根据检测结果推断疾病的概率。

那么,这个概率到底多大?这当然与患者本人的条件如是否有家族疾病史等有很大关系。但当我们不去考虑这些极端情况,只从普遍意义上考虑这个问题,那么这个逆概率就与先验概率(健康女性下一年患乳腺癌的概率)有关了。来,让我们看一看这个美丽的推导过程。(友情提示:前方高能,较为烧脑,可略过过程直接看结果)

假设D(代表疾病)指得癌症,证据T(代表检测)指乳房X光检测结果。那么P(疾病|检测)可以表示为:

P(D|T)= P(T|D)/ P(T)×(D的先验概率)

其中P(T|D)/ P(T)用一个新术语表达为似然比,它衡量的是该疾病的患者得到阳性检测结果的概率比一般群体要高多少?

已知:P(T|D)为73%, D的先验概率为1/700;(来自权威机构BCSC的统计数据)

P(T)的估算比较棘手。因为,T既可能来自患这种病的检查者也可能来自没有患这种病的检查者。因此,P(T)应该是P(T|D)(患病者检测结果为阳性的概率)和P(T|~D)(未患病者结果为阳性的概率)的加权平均。其中,P(T|~D)一般称为假阳性率,根据BCSC统计其数值为12%。为什么要加权平均值?因为健康女性(~D)的数量要远多于患乳腺癌的女性(D):699:1。

P(T)=(1/700)×(73%)+(699/700)×(12%)≈12.1%

按照逆概率方程式,我们可以得出:

P(D|T)= (73%/12.1%)×(1/700)≈ 0.0086

换言之,在拿到阳性检测结果的前提下,这名检查者的确患有癌症的概率还不到1%!!!

相信这一结果让许多人惊掉了下巴。所以,下一次如果你的检查结果为阳性时,先不必惊慌,启动一下大脑的系统二,考虑一下逆概率,到底多大可能性上我患有该疾病呢?

生活中还有许多类似的案例,均源于我们对前向概率和逆概率的认知偏差,即颠倒了因果关系或者混淆了因果与非因果关系。

教科书教我们对科学方法的描述为:(1)提出一个假设;(2)推断假设的可检验结果;(3)进行实验并收集证据;(4)更新对假设的信念。通常,教科书涉及的只是简单的正确与错误两种结果,证据要么证实了假设,要么驳斥了假设。但是生活和科学从来就不会那么简单!所有的证据都包含一定程度的不确定性。贝叶斯法则引导我们去思考的正是如何更新对假设的信念,也即反事实或者逆向思维。当有原因时很容易推断出结果,但从结果到原因就要复杂的多。

夏洛克·福尔摩斯的高明之处就在于,看起来,他在演绎推理,从假设到结论,事实上,他的拿手好戏恰恰与演绎相反,是从证据到假设,即从结果到原因的归纳思考。

“当你排除了所有不可能的 ,剩下的那个无论多么不可思议,都一定是真相。”


叁:

出生体重悖论:来自第五章 烟雾缭绕的争论

20世纪60年代中期,流行病学家发现,吸烟的母亲比不吸烟的母亲更容易生出低出生体重婴儿,然而吸烟母亲的低出生体重婴儿的存活率比不吸烟母亲的婴儿高。于是,研究人员指出,如果婴儿碰巧存在出生时体重不足的问题,那么其母亲在怀孕期间吸烟似乎反而有益于新生儿的健康。 这个被称之为“出生体重悖论”的难题显然与医学共识相悖。原因是原有的研究依从一个假设的因果关系链“吸烟-低出生体重-婴儿死亡率”,但在此因果链中,低出生体重并不是婴儿死亡率的充分必要因,造成低出生体重的原因除了“吸烟”,可能还有“先天畸形”,而后者造成的婴儿死亡率显然会更高。

出生体重悖论是对撞偏倚的一个完美的例子,对撞因子“出生体重”一旦被控制,就导致了“吸烟”与“婴儿死亡率”的伪相关。

因果图之美就在于他们让偏倚的源头变得显而易见。思考问题时,要对因果关系路径上各种要素进行可能的想象,借助因果图消除迷雾,澄清事实。 编后记: 写出这个知识卡片太不容易了。 因为这一章的逻辑还是有些绕。明明是非常符合常识的吸烟致癌,却花费了科学家们长达半个世纪的争论,因为相关并不能证明因果。科学家们找不到充分的证据证明吸烟——致癌。 但是读到最终也没有找到这个具体的证明方法到底是什么。 按照作者的解释就是画一个因果图就清晰了。但是还没有get到因果图这么强大的功能。


关注朋朋不迷路,发送简信交流更便捷;

更多书单 信息,点击个人主页查阅。

你可能感兴趣的:(《为什么:关于因果关系的新科学 》作者: [美]朱迪亚·珀尔(Judea Pearl) / [美]达纳·麦肯齐(Dana Mackenzie))