【听书笔记】《女士品茶》
【作者】【美】戴维·萨尔斯伯格
【字数】2681
001 从“决定论”到“统计学”
早期的科学界,受牛顿等物理学家及哲学家们的影响,认为世界都是可以认知和预测的。就是说只要掌握了足够多的数据,就能准确地判断出事务下一步的方向和脉络。认为世界的自然万物存在着一定的脉络和法则,遵循着一定的因果关系,这就是“决定论”。
我记得樊登读书在解读这个现象时,称之为“机械论”。
当时的统计学的作用,就是忠实地记录数据,数据记录得越多,越准确,越能精准地反馈出预测。
但是世界并非如人们理解的一样。
科学家发现,无论如何还原科学实验的条件,无论如何排除外界因素的干扰,每一次最终得出的科学数据,不会是完全一模一样的,总会存在细微的差距。随着科学的进步,随着仪器以及实验的精密度越来越高,这种差异越来越被人发觉和重视。
于是人们推论:有可能具体的数据,会存在差异,但是把大量的数据归集在一起,总结它们的规律,一定也能发现数据总体的趋势,这就是现代统计学的来源。
统计学颠覆了“决定论”,它昭示着自然界随机的变量千变万化,万事万物不可能遵循一成不变的因果关系。但是我们通过整体分析这些数据,而不是只关注于某些具体的数据,依然能够管中窃豹一样地找到事务发展的一些有限的可能性的规律,这被称为“概率”。
书中给出了定论:“统计学就是基于问题,收集数据、分析数据、解读数据的学科,人们对于统计学的接纳,也意味着对于“决定论”的抛弃。”
同时又给出了一个解释:“统计学就是帮助我们利用样本的信息来推测总体的工具,也就是从局部到整体,从已知到未知的过程。”
002 两种基本的统计学模式
1、描述性统计:处理样板数据的过程。对于大量的原始数据进行整理,让这些数据最终能呈现出简练的规律,并作为我们认识事物的客观规律。
2、推论性统计:通过从整理出来的样本数据信息,来估计总体规律,预测未来,带有一定的猜测成分。
003 统计学的应用
华为的任正非认为,所谓大数据或者人工智能,其本质就是“统计学+XXX学科”,要不就是“统计学+N多个学科。”
李开复在谈到自己早期的计算机博士研究时,说过他当时的研究课题——“语音识别系统”曾经遭遇了瓶颈。当时整个语音识别领域的设计思想是建立足够大的语音材料库,然后利用计算机的存储和检索来进行甄别,从而实现语音识别。可是第一当时的计算机硬件速度和存储量并没有今天这么高,第二这个资料库太庞大了,因此整个领域研究的成功识别率不高,只有20%左右。李开复另辟蹊径,运用了统计学的原理,即不在追求全部的数据,而是只关注频率最高的样本,最后实现了80%的识别率。并且第一次运用苹果电脑成功地实现了人机对话。
本书中回顾现代统计学的发展历史,更多地是由于第二次世界大战的影响。一方面大量的科学家遭遇希特勒的迫害跑到了美国。另一方面美国的罗斯福新上任,急需彻底了解当时经济大萧条之下美国的真实数据。因此统计学以及调查机构大量运营而生。比如尼尔森、盖洛普这样的调查公司。在这一个过程中,统计学伴随着军事上的需求越来越多地参与到了国防和科技的研发之中,统计学本身的理论也得到了极大的发展。
书中举了一个例子:正是由于美国统计学家发现当时的日本所研发的武器以及抵抗的决心,肯定会对美军造成巨大的损失,才促使了原子弹最终的投放以及二战的迅速结束。
004 对于统计学的批判
这是听书时,里最有趣的一段。
一般而言,由于共情的因素,一位作者,一个某些领域突出的专家,多半会对自己的领域有着很深的情感,很少会对自己的领域发表负面的、否定的或者质疑的言论。但戴维·萨尔斯伯格很不一样。但他以统计学领域专家的身份,对着统计学的领域来了致命的三连问,这就很有意思了。鲁迅说过:最怕自己阵营里的冷箭。但这样的质疑,对于我们这些小白来说却是福音,教会我们辩证地去看问题。
质疑1:统计方法是否过度了:统计学已经深入到了各个学科,很少有人会严格按照假设检验的思想去求证,只关心显著性,很少去思考这些方法背后的内涵(这一段没看懂!)。他建议研究人员要去关注问题本身,而不是关注数据是不是显著。
质疑2:大数据的迅猛发展,很轻易就能获得整体的数据,那么推论统计是否必要,那些反复论证的数学公式是否还有存在的意义?(还是没看懂!)
质疑3:人类构造的科学模型永远无法完整的描述现实。人们把现代统计学创始人皮尔逊的观点当做理所当然的事情,但很少有人去深究这种观点背后的哲学内涵(我理解作者是不是认为大家都把统计学的创始人像牛顿一样神话了,不去质疑了)。
作者认为:在某一阶段可能某一个模型符合现有数据,随着数据的积累,就需要对模型重新调整,以适应新的发现。(这句话我看懂了,也表示深深地赞同和敬佩)。
所以,作者最后的质疑的核心观点应该是:不要把统计学神话了,它有可能只是人类认知世界过程的某一个阶段的某一个方法或者工具而已,并不能代表全部。更不能有“掌握了统计,就掌控了世界,就掌控了未来”这种一劳永逸的思想(但是,大部分的人的心底里,就是有一种一招搞定全世界的思想)。
005 胡思乱想
《女士品茶》,这本书的书名来源于1935年的一段故事:英国剑桥的一帮子科学家,带着自己的老婆和女朋友一起喝下午茶。一位女士突然说:把茶加到牛奶里,和把牛奶加到茶里,味道完全不一样啊! 这怎么可能,科学家们炸开了锅,只要比率一样,口味的效果肯定完全一样啊。大家吵起来。科学家们的吵架,最后的结果往往就是做实验,于是一帮子既有钱又有闲的科学家开始设计了一个又一个实验验证自己的观点。这就是英国统计学家费希尔写的《实验设计》的来由。
听完这本书,突发奇想:也许现在正在进行的贸易战,川普政府针对中国的各种逼迫战,不见得是坏事呢。因为这样就把我们中国的科技、制造、文化、教育等领域,全方位的逼到了一个无法退让的地位。
正如同现代统计学是被二战逼出来的儿一样,人类的很多奇思妙想,很多学科领域的飞速进步,就是在这种激烈的竞争和博弈中被刺激出来的呢。
如果不是这样的刺激,也许我们很长一段时间,会停留在千年老二这样的错觉之中。这么一逼,无论是国家、政府还是个人,都到了退无可退的地步,都逼着发挥自己的潜能,也许,我们真的就被逼出了一个又一个世界第一,世界领先。也许李约瑟所说的,中国五百年来,对于全世界科技的没有贡献的历史,就从我们在世的这些人中开始改写。
一切都为未可知!
另外,茶里面加奶,或者奶里加茶的区别,真的没有感觉。
但是刚煮出来的咖啡,倒入一个杯中,倒入一大勺炼乳,再加入一勺糖,缓缓地搅拌,伴着咖啡浓郁的香气,喝着醇厚、甜腻的口感,这样的咖啡,是我们海南人,尤其是琼海人的最爱!
我们叫它——歌碧欧!