4 启发法与偏见
4.1 大数法则与小数定律
某县的人口稀少既不会引发癌症,也不能避免癌症,只会使癌症的发病率比人口稠密地方的发病率更高(或更低)。你会发现乡村地区的样本要比其他地区的少。
——(1)大样本比小样本更精确。(2)小样本比大样本产生极端结果的概率大。
4.1.1 小样本的出错风险可能高达50%
研究人员认为他们“对于统计直觉应抱有一些怀疑,只要条件允许,都应采用计算方法来确定样本规模,而不是依靠直觉印象作决定”。
——即使是专家,在选择样品大小时也无法充分集中注意力。小样本的出错概率很高。
4.1.2 信任多于质疑的普遍性偏见
民意调查包含了两方面的信息:新闻本身和新闻的来源。你关注更多是新闻本身,而不是结果的可信度。
——小数定律是普遍性偏见的一种表现,即对事物的信任多于质疑。我们常夸大所见事物的相容性和连贯性。
我们觉得自己对某个人你很熟悉也很了解,但事实上,我们对他却知之甚少。系统1在了解事实之前就根据零散的证据拼凑了一个饱满的形象。
———如果相信小数定律,急于下结论的机制就会运作起来,通常情况下,它会建构一个言之成理的说法使你相信自己的直觉判断。
4.1.3 对随机事件作出因果解释必然是错的
人们很容易在根本没有模式的情况下创建模式。“二战”期间,火箭弹在伦敦密集地轰炸。人们普遍相信爆炸不可能是随机地。因为地图显示,爆炸点在各的分布有明显区别。一些人猜测没有被炸得地点住有德国得间谍。
———对随机性的广泛误解有时会带来重大影响。
运动员有时投篮顺手的“事实”普遍被运动员、教练和球迷们所接受。
——在随机性中发现规律的想法往往不可逆转,肯定比某个人作了一项研究更具有说服力。
你要用多少年的观察才能肯定一个投资顾问是由有真才实学的?一个执行总裁实现多少次成功的兼并,董事会才能确定他对这项工作有着非凡的才能?
——就常常会因为把随机事件看做事有规律的事件犯错。我们都非常愿意相信生活中大多数事情并不随机的。
会发现那些较差的学校也比水平一般的学校的规模小一些。事实上,规模小的学校办学水平并一定更高。
——他们只不过更懂得变通而已。
小数定律包含在大脑工作的两个重要部分中。
——①夸大对小样本的信任只是众多错觉中的一种—比起信息的可靠度,我们会更加注重信息本身的内容,其结果就是我们会将周围的世界变得比数据所能证明的更加简单和统一。在想象的世界中过早下结论比在现实中更有把握。②统计学家的很多观察研究都可归结到因果关系的解释上,但他们却不承认是这样的。许多事实其实只是巧合,包括事件的采样。对偶
发事件作出因果关系的解释必然是错误的。
4.2 锚定效应在生活中随处可见
如果有人问你甘地死时年龄是否大于114岁,你在估测他的死亡年龄时会比锚定问题是35岁(死亡)时更高。你在考量买房要花多少钱时,也会受到要价的影响。同样的房子,如果市场价格高,它就显得比市场价格低时更有价值,即使你决心抵制价格的影响也没有用。
——一旦你要考虑某个数字是否会成为一个估测问题的可能答案,这个数字就会产生锚定效应。
你马上就知道乔治·华盛顿是1776年后成为总统的,你也知道珠穆朗玛峰峰顶上的沸水温度比100摄氏度低。你不得不去寻找从这个锚定值上移开的论据,将其调整到合适的数值。就像前文提到的那个线段的例子那样,在那个不确定区域的边缘,你不确定是否应该继续进行时就会停止。
——调整就是刻意去寻找离开锚定数字的理由:按照要求一听到锚定值就摇头的人仿佛对此有些排斥,他们会离锚定值更远。而点头则会增强他们对锚定值的概念。调整是一项需要付出努力的活动。人们在自己的大脑资源耗尽时调整较少。
4.3 暗示就是一种锚定效应
你完全不会相信甘地活到了144岁,但你的联想机制却会对一位逝去的老人产生印象。系统1理解句子的方式就是尽量相信其内容的真实性,它对相应想法的选择性激活会产生一系列的系统性误差,这些误差会使我们更容易受骗,更加坚定地相信自己的想法。
——暗示即一种启动效应,它会有选择地找出相应的证据。研究手法和理论观念。
受试者看到20摄氏度后更容易识别和夏天相关的词(比如“太阳”和“沙滩”),看到5摄氏度后则能更加轻松地识别出关于冬天的词汇(比如“冰冻”和“滑雪”)。对相应记忆的选择性激发解释了锚定效应。
——大小不同的数字能激发起记忆中不同的观念体系,而这些带有偏见的观念则成为(受试者)估测年度平均温度的依据,据此作出的估测值也因此带有一定偏见。
4.3.1 作为这幢房子的主人,你能接受的最低售价是多少?
关于那棵最高的红杉树有多高)两个组给出了完全不同的平均评估:844英尺和282英尺。两者的差距有562英尺。锚定指数就是两个不同答案的比率55%(562/1020)。
——对于那些在评估过程中过度运用锚定的人而言,锚定效应的测量结果将是100%,对于那些能够忽略锚定的人而言,锚定效应的测量结果则是零。
实验人员让一些房地产经纪人对一幢待售房子的价值进行评估。这些经纪人亲自去看了这所房子,还仔细研究了一本小册子,里面包括这幢房子的全面信息和售价。
——专业人士和对房地产一无所知的商学院学生一样,都受到了锚定效应的影响。学生承认他们受到了锚定效应的影响,而专业人士则否认这一点。
这些对环境都很敏感的探索馆参观者会说他们愿意拿出的钱平均为64美元。当锚定金额只有5美元时,平均捐款则是20美元。当锚定金额达到400美元时,人们的捐款平均数就达到了143美元。
——在人们对钱的问题所作的决定中同样体现出了强大的锚定效应,人们选择对一项事业投入多少时就会受锚定效应的影响。表明增长100美元的初始要价就能带来平均值为30美元的回报。
有人曾问过那些在法国马赛重度污染地区居住的居民,如果能住在一个污染程度较低的地方,他们能接受生活开销提高多少。锚定指数在该研究中超过了50%。在网上购物过程中也很容易观察到锚定效应,网上相同的产品经常标出不同的“立购”价。“估测”在艺术品拍卖行业中是影响第一次竞拍的锚定价格。
——许多估测和捐款意愿的研究都曾体现出相似甚至更大的锚定效应。锚定效应在某些情形下看起来也是合理的。
当我们用轮盘来估测联合国中非洲国家所占的比例时,锚定指数是44%,还算是处在看似正确且能作为提示的锚定效应的影响范围内。有些实验已观察到大小相似的锚定效应,在这些实验中,受试者社保号的最后几个数字被用做锚定值(比如为估测他们城市中医生的数量)。
——锚定值显然是任意的。对于有些锚定值没有影响,因为人们认为这些数字没有什么信息价值。
平均来看,那些掷了9的法官说他们会关她8个月,而掷了3的法官说他们会关她5个月,锚定指数是50%。
——随机锚定的影响以一些令人不安的方式出现在生活中。
4.3.2 锚定效应何时适用,何时不适用?
几年前,在艾奥瓦州的苏城的超市里,购物者遇到了坎贝尔汤罐头在作促销的情形,降价10%。有那么几天货架上写着“每人限购12罐”,而在其他几天里则写着“不限量”。购物者在限购时平均会购买7罐,是不限购时购买量的2倍。
——锚定效应解释了为什么限量购买是一种有效的营销策略。
在许多其他的活动中也是这样,在协商中率先出击的一方往往会占有优势,例如,当价钱是买方和卖方唯一要协商的事时就会出现锚定效应。第一次在集市上讨价还价也是这样,先发锚定有着重大的影响。
——先发锚定有着重大的影响。如果你认为是对方作出了无礼的提议,你应该大吵大闹,夺门而出,或者威胁对方说自己也会这样做,要让对方明白以这个数字为基准的话,谈判将难以继续。
抵制商谈中锚定效应的影响
——①在商谈中要集中注意力搜寻大脑记忆来抵制锚定效应。激活系统2的做法会很奏效。②将其注意力集中在对方能接受的最低值或对方无法接受的费用上时,锚定效应就会削弱或消除。有意地“为对方着想”的策略也许是抵制锚定效应的好方法,因为它否定了能产生这些效应的带有偏见的想法。
试试看你能不能弄清楚锚定效应对公共政策问题的影响,即人身伤害案件的损害程度的裁定。这类案件的判决有时是很严厉的。类似医院和化工企业等单单位常常是这类诉讼案件的被告,这些单位曾经游说各方为此类判决设置了一个上限。
——这条规则会消除所有的严厉判决,但锚定也会阻止法官将许多较轻罪行的量刑判得更轻。这对违法者和大公司都有好处,比给小公司带来的好处多。
这个消息的重点是故事,随便根根据什么信息编造的都无所谓,即使这则消息的信息量很少,质量很差劲也无所谓,因为眼见即为事实。当你读到一个拯救受伤登山客的人的英勇故事时,这个故事对你的联想记忆产生的影响和一篇新闻报道或电影简介大体差不多。锚定效应是由这个联想激发引起的。
——如果一则消息没有马上被视为谎言,那么不管其可靠性如何,它都会对联想系统产生同样的影响。系统2对这种影响一无所知,也无法控制。随机锚定的强大影响是锚定效应的极端例子,因为随机锚定显然没有提供什么信息。
锚定效应也以相似的方式威胁着你。你总能意识到锚定,甚至会对它格外关注,但你不知道它是如何引导和限制你的思考的,因为你不能想象如果锚定改变(或不存在)你会如何思考。
——你应该假设任何一个公开谈判时的数字都对你有锚定效应,如果概率大,你应该抵制(你的系统2)该效应。
4.4 科学地利用可得性启发法
我们问自己,人们在想要估计某类事件的出现频率时到底是怎么做的,这些事件包括“人在60岁之后的离婚概率”或“(是否是)危险的植物”等。
——从记忆中搜寻这类问题的实例,如果搜寻过程既轻松又顺畅,这些事的发生概率就会被判断为很大。
我们之前思考的问题是,到底需要在大脑中搜寻多少实例才算是轻松回忆,以获得某一印象。
——个也不用。
4.4.1 意识到自己的偏见有利于团队关系融洽
①你可以很轻松地回想起引起自己注意的突出事件。好莱坞明星的离婚事件和政客的性丑闻事件格外引人注目,想到这些实例并不难。因此,你很容易夸大好莱坞离婚事件和政客性丑闻事件的频率。②一个大事件会暂时提高此类事件的可得性。飞机失事事件会有媒体来报道,这也会暂时改变你对飞行安全的看法,接着你又看到路旁有辆汽车着火了,于是这些事故会暂时盘踞在你的脑海中,你会觉得这个世界此时充满更多难以预料的事。③亲身经历、生动的图片和鲜活的例子比发生在别人身上的事、单纯的文字或是统计数据更容易让人回想起来。一个与你相关的判决错误会逐渐削弱你对司法体系的信任度,其影响程度比你在报纸上读到类似事件的影响更深。
——你会发现启发法是如何通过一个简单的过程导致偏见的,不直接说出(事件发生的)频率,而是列举那些使你轻松想起相关实例的因素,其中的每个因素都会成为偏见的潜在来源。
研究中,研究人员问夫妻双方的问题是:你为保持此地整洁作了多大贡献?用百分比来表示。此外,夫妻俩还回答了如“倒垃圾”、“发起社交互动”等类似问题。那么这两位自我估测的贡献率合计能达到100%吗,是更多或者更少?
——他们自我估测的贡献率合计超过了100%,夫妻二人记自己的努力和贡献比记对方的清楚得多,而且可得性的不同导致了对频率判断的不同。意识到自己的偏见可以使夫妻和睦相处,而且很可能在其他的合作计划中与他人的关系也很融洽。
这对夫妻还过多地将两人的争执归因于自己,尽管这一比例比两人在那些积极正面的事件中的自评比例小得多,但也是难能可贵了。很多合作团队成员感觉他们做的事超出了自己的分内工作,还感到其他人并不感激自己作出的贡献。
——偏见不一定是自私的,我通常对人们控制偏见的潜能不是很乐观。
成功去除偏见的案例还是存在的,即我们可以很轻松地识别出功劳分配问题是何时出现的,尤其当几个人同时感到他们的努力没有得到足够的认同时更是如此。
——自己周围的那些人通常也会付出超出100%的努力工作,只要你看到这一点有时就足以缓和这种(心理失衡)情形。你做的事情偶尔会超出自己的分内事,但你应该知道,当你有可能有这种感觉的时候,你的团队里的每个成员也都可能有同感。
4.4.2 可得性偏见会影响我们对自己或他人的看法
那些列举了12件事的人认为和只列举了6件事的人相比,自己不够果断。而且,列举出自己表现不够果断的12件事的那些受试者最终却认为自己非常果断!如果无法轻松地想起懦弱的事例,你可能就会说自己一点也不懦弱。
——自我评估是由事件呈现在脑海中的轻松度来衡量的。轻松地想起某件事的体验比想起事情的数量更重要。
“微笑者”要收缩颧肌,露出浅浅的微笑:“皱眉者”要皱着眉头。如你所知,皱眉通常伴有认知紧张,且其影响是对称的:执行任务时被要求皱眉的人付出的努力更多,体验到的认知紧张也更强烈。
——皱眉者在提取果断行为时会有难度,因此会估计自己缺少果断性。结果也的确如此。
在回忆起自己多次骑自行车的经历后,依然相信他们自己不经常骑自行车。在被要求用更多的论据支撑自己的选择时自信心下降。在列出多个避免某种问题的方法后,却对避免此问题显得更加不自信。在列出某辆车的优点后,对该车变得没那么感兴趣了。
——受试者想到那些行事果断的例子的轻松程度在任务实施过程中是不断变化的。前几件事情提取时很容易,但很快就变得越来越难。当然,受试者的思考顺畅性也会慢慢下降。
他让不同组的学生列出改进课程的方法,要求不同组列出不同数量的方法。正如他所预料,列出较多改进方法的学生对这一课程的评价也更高。
——人们有时依照提取到的内容而非提取的轻松程度来作出判定。
那些对顺畅性有所认识的受试者没有将音乐看成是一种启发法;而那些得知音乐会使回忆更困难的受试者无论完成提取6件还是12件的任务,对自己果断程度的估测没什么两样。
——若通过展示曲线或直线的文本框,或屏幕的背景颜色,又或其他与实验预期不相关的因素对体验到的顺畅性作出虚假解释的话,判断便不再受提取轻松程度的影响。
用可得性来判断的过程包括了一个复杂的推理链。
——他们显然对顺畅性的下降率事先有过预计,但那些预计是不准确的:想起新事例的困难增速远远超出了他们的预计。
假设有人事先告诉过你那个住在隔壁的3岁大的小男孩经常戴着一顶礼帽坐在小推车里,那么当你真的看到他戴着礼帽时就不会像事先并不知道(这件事)那么惊讶了。
——其中一点就是这一系统具有设定预期的能力,当现实与预期相悖时它就会感到惊讶。
研究。所有的学生都要回想自己日常生活中可能会影响心脏健康的3种或8种行为(按照要求,有些学生需要回想的是危险行为,其他学生需要回想的是保护性行为)。没有心脏病家族史的学生对这项任务较随意,遵循的是可得性启发法。
——判断涉及自身情况的人往往更有可能关注他们从记忆中提取的事件数量,对顺畅度则不大关注。那些跟着系统1走的人更容易受可得性偏见的影响,比那些警惕性更高的人受影响的程度更大。提取轻松度对他们的影响要大于其回想事例内容带给他们的影响。
4.5 焦虑情绪与风险政策的设计
随着时间的推移,对灾难的记忆就会变得模糊,担忧和防备的努力程度也会减弱。记忆的动态变化为灾难、担忧和越来越松懈的心理这一循环作出了解释。
——不论是个人的还是政府的保护性行为,都能应对最糟糕的灾难。受害者和近似受害者在灾后往往心存焦虑。
4.5.1 被闪电击中与食物中毒,哪种意外致死率更高?
每组原因中,受试者要指出更常出现的原因并估测两种可能性的比率,然后将作出的判断与当时的健康统计数据进行比较。
——对死亡原因的估测因媒体报道而有所改变。报道往往偏向新鲜和尖锐的事。
不同寻常的事件(比如腐肉中毒)会格外引人注意,人们常会低估此类事件的发生概率。我们脑海中的世界并不是真实世界的准确反映。
——我们对事件发生频率的估测也会受到自己接触这些信息和频率与个人情感强烈程度等因素的影响。
对致死原因的估测几乎是联想记忆中观点激发的直接反应,也是替代效应的极佳例子。但斯洛维克和他的同事们有了更深层次的发现。他们发现,人们想到不同风险的轻松程度与其对这些风险的情感反应是紧密相连的。
——我们总是特别容易想起那些骇人的想法和画面,而那些流畅生动的骇人印象又会加深我们的恐惧。
我喜欢它吗?我恨它吗?我对它的感觉有多强烈?斯洛维克说,在生活的很多领域中,人们形成的观点和作出的选择直接表达出其情感和取舍的基本倾向,而这些行为完全是在毫无意识的情况下作出的。
——在生活的很多领域中,人们形成的观点和作出的选择直接表达出其情感和取舍的基本倾向,而这些行为完全是在毫无意识的情况下作出的。
情绪启发是替代的一种,即将简单问题(我对它感觉如何)的答案当做较难问题(我对它评价如何)的答案。在做决策前没有表现出适当情感的人可能是因为他的大脑有损伤,也可能是因为他对做出较好决策存有障碍。无法接受糟糕结果的“健康畏惧”导向是个灾难性缺陷。
——人们对结果的情感反应、身体状态,以及与之对应的取舍抉择在决策制定中都发挥了重要作用。
当人们更青睐于某项技术时,他们就会认为此项技术更有优势、风险更小;如果他们不喜欢某项技术,则只会想到其缺点和寥寥几个优点。因为几项技术刚好是从好到次排列起来的,因此无须作艰难的权衡。
——受试者对该技术的优势和风险的估测值存在非常大的负相关性。
有些短文关注的是某项技术的众多优点,其他短文则强调其风险低。这些短文有效地改变了受试者对这些技术的感性认识。实验结果令人关注,那些读到对某项技术多有褒奖的短文的人,对此项技术存在的风险也有了不同认识。尽管没有佐证,但他们现在却认为自己更喜欢这项技术了,感觉其风险没那么大。那些只知道某项技术风险较小的受试者也会对其优点越发青睐。那些只知道某项技术风险较小的受试者也会对其优点越发青睐。
——情绪启发式通过创造一个比现实更明了的世界来简化我们的生活。好的技术在我们的虚拟世界中成本较小,不好的技术没有利益,所有的决策在这里都变得很简单。
4.5.2 如何避免小概率的风险事件演变成公共危机?
感性而非理性,易被琐碎细节左右,并且对较小的可能性和极微小的可能性之间差别的感知力不够敏锐。
——专家同普通人一样,也以衰减的形式表现出同样的偏见,但他们对风险的判断和偏见往往与普通人有所不同。
善终”和“非善终”,是意外死亡还是在类似滑雪这样的自愿活动中死亡等。这些合理的区别经常被只计数事件的统计学所忽略。
——公众对风险的认识比专家更深刻。因此,他强烈反对专家或权威的观点,若专家与其他公民的观点和希冀相矛盾时,人们就不应该完全接受专家的观点。
斯洛维克列举了9种界定死亡风险的方式,从“每100万人的死亡”到“每生产价值100万美元的产品造成的死亡”,这种死亡风险与向空气中释放有毒物质的做法相关联。
——风险评估依赖测试方法的选择—这种选择极有可能是在人们心中期望得到这样或那样结果的情况下作出的。
立法者和监管人员对民众的无理要求可能会反应过度,因为当专家和公众对各自的优先权意见分歧时,“双方必须尊重对方的见解和智慧”。
——对风险带有偏见的反应是导致公共政策中优先处理权不稳定和错位的重要原因。
效用层叠是一连串自持事件,它可能开始于对相对次要的事件的媒体报道,然后会引起公众恐慌和大规模的政府行动。有些情况下,关于某一风险的媒体报道能抓住部分公众的注意力,这部分注意力进而会变成激愤和焦虑。
——此时效用层叠就要重新设定优先考虑的事件。其他风险和关乎公众利益的资源利用方式也都显得不那么重要了。
艾拉事件显然是对一个小问题做出的过激反应。这件事对公众健康的最终影响可能是致命的,因为人们吃到的好苹果越来越少了。
——我们要么完全忽视风险,要么过于重视风险,没有中间地带。
你也许知道真的是(几乎是)没有什么可担心的,但你的大脑会不自觉地闪现危险的景象。正如斯洛维克所言,焦虑对伤害的可能性还不够敏感。你想到了分子(即你在新闻中看到的悲惨新闻),却没有想到分母。桑斯坦发明了“概率忽视”这一短语来描述这一模式。
—— 必然会导致对小威胁的夸大,有时还会引发严重后果。
效用层叠是真实的,它无疑扰乱了公共资源分配的重点。卡斯。桑斯坦会探索将决策制定者从公众压力中隔离开来的机制,让资源的分配由公正的专家来决定,这些人对所有风险都了如指掌,还知道可利用哪些资源来降低风险。公众比桑斯坦更相信专家,但保罗·斯洛维克却不怎么相信这些专家。
——将专家从公众情感中隔离出来会产生公众排斥的政策,这种情形不可能发生在民主制的国家中。
政策制定者不应该忽略普遍存在的恐怖情绪,即使这些情绪是毫无缘由的也不该忽略。不论与否,恐惧都是令人痛苦且身心疲惫的。
——政策制定者必须保护公众不受恐惧情绪的影响,而不是只保护其不受真实存在的危险伤害。
拉夫运河事件可能会使过剩资源分配到有毒垃圾的治理中,但这一事件在提升公众对环境问题的关注程度方面发挥了更大作用。
——效用层叠也会通过呼吁人们关注风险和增加降低风险预算总额的措施来创造长期效应。引导民众信仰和态度可得性及情绪启发式难免有失偏颇,即使这些因素都指向正确的方向也难以达到完美结局。
4.6 猜一下,汤姆的专业是什么?
你如果再次审视汤姆,会发现他很适合的专业,并不适合人数多的企业。的确,受试者也几乎都将人数多的两大专业排到了最后。
——汤姆被刻意设计了反基础比率的角色,适合人数少的专业,不适合人数多的专业。
4.6.1 依据典型性作出预测是下意识行为
同事兼好友罗宾在听完汤姆性格描述后,猜测是计算机科学时,就会忽视这些比率。
——他用典型性的判断代替了对概率的评价。
猫王埃尔维斯·普雷斯利(Elvis Presley)的父母曾希望他成为一名牙医,她会赢得竞选,你明白她肯定会赢,他学习成绩好不了,看那一身文身吧。如果我们通过某个下巴的轮廓或铿锵有力的演讲来判断这个职位候选人是否具有领导才能,此时我们依赖的就是典型性。
——他们一定是受到了典型性启发式的影响。
4.6.2 典型性启发的两宗罪
典型的形象特征左右着我们对典型性的判断,受这种典型性启发得到的预测有可能是对的,这样的说法在某种程度上就是事实。然而在其他情况下这种典型形象却是错误的,因而典型性的启发也会造成误导,尤其会使人们忽略基础比率信息、找错预测方向。
——即使启发性具有一定的真实性,但绝对依赖启发效应就是违背统计学逻辑,是有严重“罪过”的。
典型性的两宗罪
——它过于喜爱预测不可能发生的(低基础比率的)事件。它对证据质量不够敏感。
鼓起腮帮(与感情无关的表情)的学生的预测结果与原实验结果一样:他们只依赖于典型性,而忽略了基础比率。然而不出作者所料,那些皱眉头的同学的确对基础比率表现得很敏感。
——皱眉通常可以增强系统2的警觉性,降低对直觉的过分相信和依赖。
如果皱眉能带来不同结果的话。
——懒惰也许是人们忽视基础比率的合理解释。
原则上讲,你当然知道不值得信任的信息就相当于没有信息,但是眼见即为事实使你难以遵循那条原则。
——除非你决定立刻否定证据(例如,你坚信的信息是从一个骗子口中得来的),否则你的系统1会自动将这一信息视为真实的。
当你怀疑信息的可靠性时,可以做一件事:作概率判断时,往基础比率那方面想。
——别期望遵循这条原则会很容易—它需要在付出很多努力的情况下,才能实现自我监督和自我控制。
猜测汤姆专业时
——想要得出汤姆问题的正确答案,你应该遵从最先出现在自己脑海中的想法,若认为某招生人数多的专业(人文与教育、社会科学与社会工作)被选中的概率高,则稍微降低其概率;若认为某招生人数少的专业(图书馆学、计算机科学)被选中的概率低,则稍微提高其概率。
4.7 用贝叶斯定理来约束直觉
关于贝叶斯定理,有两点我们要铭记在心,要知道我们总是喜欢把事情搞得一团糟。
——第一,基础比率十分重要,即便是在手头的案例已有证据的情况下依然如此;第二,通过分析证据得到的直观印象通常都会被夸大。
眼见即为事实与联想一致性的结合易使我们相信自己编纂的故事。以下是对贝叶斯定理关键点的总结。
——①以相对合理的基础比率对结果的可能性作出判断。②质疑你对证据的分析。
4.8 琳达问题的社会效应
琳达,31岁,单身,一位直率又聪明的女士,主修哲学。在学生时代,她就对歧视问题和社会公正问题较为关心,还参加了反核示威游行。
——然而即使在当今这个“脸谱”时代,我们仍然很容易猜到人们会对这位女士作出高度一致的判断:琳达非常适合当一个激进的女权主义者,也相当符合在书店工作且学习瑜伽的身份特征,不过却不怎么适合做银行出纳或是保险推销员。
4.8.1 琳达不可能只是一名普通的银行出纳吧?
每位受试者都看到一组列有7个结果的单子,其中只包括几个重要结果中的一个(“银行出纳”或“积极参与女权主义的银行出纳”)。有些人通过相似度来排序,而其他人则通过概率排序。
——“积极参与女权主义的银行出纳”都比“银行出纳”的排序要靠前。琳达是位积极参与女权主义的银行出纳的概率,就一定比她只是个(普通的)银行出纳的概率低。
几所重点大学中85%~90%的大学生选择了第二个选项,这一选择有悖逻辑,但却没有人因此感到羞耻。
——当人们没能运用明显相关的逻辑原则时,就会出现“谬误”。
他当然知道这个问题的正确答案,然而他还是写道:“我脑中有个小人,跳上跳下的,还对着我喊:”她不可能只是个银行出纳,看看那描述就知道了。‘“这个喋喋不休的小人当然就是古尔德的系统1了。
——即使你对谬误有了真切的了解,也仍然难以避免这种错误。
我们的受试者在汤姆问题和琳达问题中提供的概率判断与典型性判断(与原型判断类似)正相吻合。典型性属于一连串可能同时发生且联系紧密的基本评估,最具典型性的结果与特性描述结合在一起就会生成最有条理的信息。而这些最具条理的信息却不一定就是可能性最大的,但它们“貌似正确”,稍有疏忽。
——如果我们将具体描述用做预测的工具,那么不加批判地用貌似合理的判断来替代概率就会严重影响我们的判断结果。
加利福尼亚地震的情节要比北美洪灾的情节更合乎情理,尽管加利福尼亚地震的概率非常小。
——人们对更详细、更丰富的描述作出的概率判断更高,这一点有违逻辑。
下面两个论述哪个可能性更大? 简是位老师。 简是位老师,她走路去上班。
——更详细的结果只是更详细而已,不会更让人信服,或更有连贯性,或更讲得通。对貌似合理和连贯性的评估不会产生概率问题的答案。在与之相矛盾的直觉缺位时,逻辑就会起作用。
4.8.2 少即是多的逻辑悖论
对奚恺元的发现进行了复制,他在真正的市场上拍卖两套相同的高价值棒球卡片,每套各为10张,但其中一套附赠3张普通价值的卡片。
——在综合评估中,数量多的组合会比少的更有价值,但在单一评估中则正好相反。
概率(琳达是个出纳)=概率(琳达是个女权主义出纳)+概率(琳达是个非女权主义出纳)
——变量的总体性对概率判断的影响要小于其对金钱的影响。因此,综合评估只是消除了奚恺元的实验中出现的错误,却无法消除琳达实验中出现的错误。
与琳达的研究一样,典型性主导着上例的结果。几乎2/3的受试者更愿意在第二组上下注,而不愿赌第一组。
——当人们看到支持两种选择的理由时,大多数人发现正确的理由(偏向第一组的)更可信。
而在琳达问题中却不是这样,直觉常会推翻逻辑,即使在综合评估中也会如此,虽然我们确定有些场合下逻辑会占主导地位,但大胆的直觉也会将其推翻。
——在组间研究情况下作判断时,直觉就会起作用,逻辑原则则在综合评估中起作用。
如果你去法庭就会看到律师们往往采用两种批评风格:要想推翻某个案件,他们往往会去质疑支持此案的最有力证据,他们会找准证词中最薄弱的地方,让目击证人变得不值得相信。
——关注弱点在政治辩论中也很常见。
4.9 因果关系比统计学信息更具说服力
若两家出租车公司规模一样大的话,基础比率就会变成无用信息,你就只需考虑目击者的证词,因而这个问题的概率就是80%。我们可以用贝叶斯定理将这两个信息源结合起来,得出正确答案是41%。
——他们会忽略基础比率,只考虑目击者的因素。因此,最普遍的答案是80%。
4.9.1 因果关系基础比率与思维定式
而在第二个表述中,开绿色出租车的司机比开蓝色出租车的司机肇事率高5倍。于是你会马上得出结论:开绿色出租车的司机是一群莽撞的疯子!现在,你认为绿色出租车司机是莽撞的,并对这家公司所有你并不认识的司机都抱有这种印象。
——思维定式设定。我们很容易将这样的思维定式设定在因果关系里,因为莽撞是使出租车司机与肇事逃逸产生因果联系的相关事实。
“统计学基础比率”(statistical base rates)是指某一事件所属类别的事实总量,与单独事件无关;而“因果关系基础比率”(causal base rates)则会改变你对单独事件的看法。
——①统计学基础比率普遍受到轻视,当人们手头有与该事件相关的具体信息时,有时还会完全忽略这一比率。②因果关系基础比率被视为个别事件的信息,人们很容易将这一比率与其他具体事件的信息结合起来考虑问题。
第一个是肇事后逃逸,这件事使人很自然地认为莽撞的绿色出租车司机难脱干系;第二个是目击者的证词,证词特别强调肇事出租车是蓝色的。根据这两个因果事件对出租车颜色作出的推断是相互矛盾的,因此如果其中一个成立就相当于另一个被推翻。
——与因果关系相关的那个出租车问题存在一种思维定式:绿色出租车的司机是危险的。思维定式是指人们会(至少暂时会)将自己对某个团体的看法延伸到这个团体中每一个成员的身上(团体存在某些问题,其中的成员无一例外也都会有这些问题)。
系统1的基本特征之一就是它代表了范畴规范和原型范例。这样的规范和范例决定了我们怎样看待马、冰箱及纽约市的警察,因为我们会在记忆里存储与所有这些范畴的事物或人相关的一个或多个“规范的”典型形象。
——当这些范畴具有社会性时,这些典型形象就被称为思维定式。有些思维定式的错误是致命的,负面的思维定式可能会产生可怕的后果,但这样的心理学事实无法避免:不管是对是错,思维定式都是我们对不同范畴事物的看法。
4.9.2 我们并没有自己想的那样乐于助人
莽撞的出租车司机以及高难度的考试阐明了两个从因果关系基础比率中得出的推论。
——是我们容易赋予个人以典型特征,二是情境的一个重要特点就是能影响个人的思考结果。
15个受试者中,只有3个人立刻对请求做出了反应。6个人没有踏出过房间,另外5个人在“癫痫患者”明显气哽时才冲出房间。
——即使是普通、正直的人也不会冲过去提供帮助,因为他们希望别人能够处理这种令人不快的癫痫发作情况。
如果发觉自己所处的环境中还有许多人有可能去提供帮助,我可能就不会走出去了。别人的存在会削弱我最初的责任感。
——学生应该懂得这个情境的显著特点,例如责任感的淡化。这个特征会引起包括这些学生在内的普通人和高尚的人意外地没有向他人伸出援手。
尼斯贝特和博吉达怀疑学生很有可能会对这项任务和不快的感觉产生抵触情绪。当然,学生能够也愿意在实验中叙述“帮助实验”中的细节,甚至会重复实验方对责任传播的“正面”解释。他们即使知道结果,也相信自己在视频中看到的人会很快为陌生的患病者提供帮助。
——改变一个人对人性的看法很难,改变一个人对自身阴暗面的看法更难了。如果学生没有对社会环境的影响力形成一个新的认识,他们就没有从实验中学到任何有价值的东西。他们对陌生人或是自己的行为作出的推测说明,他们并没有改变原本的想法。
视频是经过精心设计的,不会提供什么信息。他们并没有提供任何理由以便让你推测出某个受试者的热心程度。因此,这样推测出来的结果并不比乱猜的准确率高多少。
——在缺少有用新信息的时候,可同时运用贝叶斯定理与基础比率来解决问题。
类似发现
——轻微的社会压力会增强人们对令人痛苦的电击的承受力,且这样的承受力超出了我们大多数人的想象。
我们播放了那两个视频,然后只是简单地告诉学生视频中的两个人没有帮助那个陌生患者,然后,他们要求学生对所有受试者的行为进行猜测。实验结果是出乎意料的:学生们的猜测十分精确。
——这些受试者不愿从普遍现象中推导出特殊性,这一点与他们愿意从特殊现象中归纳出普遍性如出一辙。
有些人的行为令人惊讶,了解这些行为的统计事实的人也会将这些事实告诉别人,就在这种转述的过程中,他们的印象得以加深。但这不意味着他们的世界观也随之改变。学习心理学面临的考验是,你对所处环境的理解是否发生了改变,而不是所处环境的理解是否发生了改变,而不是你是否了解到一个新的事实。
——相较于非因果关系的信息来说,用因果关系进行解释的统计学结果对我们的想法影响更大。但即使是具有说服力的因果关系统计数据也不会改变我们在个人经历中形成的长期坚守或是根深蒂固的信念。令人惊讶的个体案例影响甚大,是教授心理学更为有效的手段,因为个案与统计数据的分歧需要调解,并被嵌入一种因果关系里。
4.9.3 所有表现都会回归平均值
当时我告诉他们关于技能训练的一条重要原则
——对良好表现得嘉奖比对错误的惩罚更有效,不管是对鸽子、老鼠、人类,还是其他什么动物的研究。
这条统计学原则我已经讲授了很多念,而这一次我从一个新的角度重新认识了它,这的确是一个顿悟的时刻。那个飞行教练是正确的,但同时他也彻彻底底地错了。他的观察是精明且到位的:他表扬之后,很多学员很有可能会表现得很糟糕;惩罚反而促使他们进步。
——他所观察到得就是总所周知得的“回归平均值”现象,这种现象与表现质量的随机波动相关。跟表扬和惩罚毫无关系,这个教练把不可避免的随机波动与因果解释联系起来。
第一次投掷得比较好的人第二次都做得不好,而第一次没有掷好得人第二次大都有了进步。
——糟糕得表现常常会有提高,而好得表现则会变得糟糕,这跟表扬与惩罚都没有关系。
生活给予我们的反馈常常违背常理。
——因为当别人取悦我们时,我们也会对他好,当别人对我们不好时,我们也会对他产生厌恶之情。
4.9.4 第二次的表现与第一次并无因果联系
运气常常会促成成功,然而当我们把这个并不令人吃惊的想法用到高水平高尔夫棉锦标赛前两天的比赛中时,却出现了令人惊讶的结果。为了简单说明这个问题,我们假设这两天中参加比赛的选手平均绩点为72标准杆。我们关注了一位在第一天表现非常不错的选手,他在当天比赛结束时得分为66杆。
——最直接的推断就是这个球员要比锦标赛中其他选手有更高的天赋以及那一天有着非比寻常的天气,那么“这个成功的高尔夫球手很幸运”这个结论肯定和“他很有天赋”这个结论一样可信了。
事实上,对选手第二天的表现最准确的预测通常是最保守、最接近平均值的,而不是基于第一天分数的预测。
——原始数据越极端,我们所期待的回归就越明显,因为极好的分数常常表明这一天的运气很不错。
回归效应无处不在,很多可以说明这一效应的误导性因果事件同样司空见惯。有一个经典的例子,那就是“体育画报的诅咒”—凡是登上《体育画报》(Sports Illustrated)这本杂志封面的运动员都会在接下来的赛季中表现欠佳。
——般来说,人们会认为过度自信以及人们对其期望过高的压力造成了这些人表现不佳。
如果我们测一下运动员的心跳,可能会发现不佳的表现之后确实会放松,当然也可能不会。
——运动员第一跳和第二跳的表现之间不存在因果关系。
4.9.5 回归现象的意义不亚于发现万有引力
两个值之间的“相关系数”指的是两个值共有因素的相对比重。这个值在零和1之间浮动。我们拥有父母各一半的基因,对于像身高这种受环境因素影响很小的特征来讲,父母和子女的相关系数在0.5左右。
——两个值之间的“相关系数”指的是两个值共有因素的相对比重。这个值在零和1之间浮动。
如果夫妻二人智商之间的相关性并不是绝对的(如果男人和女人在平均智商上没有差异),那么从数学上来讲,高智商女人嫁给那些不如她们智商高的男人是顺理成章的(反之也成立)。
——对于这一现象,用回归平均值效应来解释要比用并不绝对的相关性来解释更通俗,也更有说服力。
我们的思维常会对因果关系的解释带有很强的偏见,而且不善于处理统计数据。当我们把注意力集中在某一事件上时,相关的记忆就开始探寻其原因—更确切地说,我们会对所有早已存在于记忆中的原因进行自动搜索。当发现有回归效应时,因果关系解释就会被激活。
——事实上这些解释都是不对的,因为回归平均值虽然可以用来解释现象,却无法找出其中原因。
如果一个商业评论员声称“今年的生意比去年要好,因为去年太糟了”,尽管他说得没错,但也很有可能很快就被电台噤声。
——事实上,那些能够为回归效应提供巧妙解释的人往往赚得盆满钵满。
你就知道将每家店的销售额增加10%显然是不对的。你应当使自己的预测具有回归性:对于业绩不好的店,预测增长率应高于10%;对于业绩较好的店,预测值应低于这个值(甚至是负值)。
——正如高尔顿历经艰难才发现的那样,回归的概念从来就不是显而易见的。
4.10 如何让直觉性预测更恰当有效?
有些预测判断,比如那些工程师所作的预测,主要就是通过查找表格、精确计算以及对类似项目的结果进行仔细分析得来的。还有一些预测则需要直觉和系统1的共同参与,主要有两种类型。
——有些直觉主要依靠反复训练得来的技能和经验。还有些直觉有时从一开始就难以从主观上进行区分。这种直觉受启发法的影响,通常会用简单的问题来替代难以回答的问题。即使证据很不充分,决定亦不可更改,人们依此作出直觉性判断时往往也会信心十足。
4.10.1 偏离预测方向的直觉
你应该很容易就能看出所有这些运作都是系统1的特点,我按照不同步骤依次将它们列在这里,当然联想记忆的大量激活并不遵循这一顺序。
——由信息和问题激发起联想记忆,然后自我反馈,最后选定最具连贯性的合理性方案。
受试者通过评估一个案例中的描述做出的判断结果(百分比成绩)和另一个案例中的最终预测结果。结论很明显:两个判断结果完全相同。尽管两组问题不同(一组关于该生的描述,另一组关于该生未来的学术表现),但受试者将这两个问题看成了一个。与朱莉的例子相同,受试者并没有将对未来的预测和对当前信息的估测区别开来—预测与估测相匹配。
——当人们按要求预测时,他们总会将预测替换为对所描述问题的估测,而且没有意识到他们回答的问题并不是那个被问到的问题。这个过程证明预测时会存在系统偏见;他们完全忽略了一点,即应该回归到平均值上来。
这些发现提供了一个引人注目的例子,这个例子涉及替代和强度匹配两个方面。作出预测的军官完全将这两个任务混淆在一起了。
——他们运用强度匹配将自己的评级简单地转换为军官学校的评分结果。由于无法解决预测中存在(相当大)的不确定性,他们的预测又一次完全无法回归(平均值)。
4.10.1 对直觉性预测的偏见进行修正
可以运用这个方法,例如在预测平均绩点、投资效益、公司发展的业绩时,这个方法就可以派上用场。这个方法以你的直觉为基础,但是削弱了直觉的影响,使它回归到平均值上了。
——以你的直觉为基础,但是削弱了直觉的影响,使它回归到平均值上了。当你有充分的理由对自己的直觉性预测的准确性充满信心时,即证据和预测之间联系非常紧密,进行调整的余地就会很小。
而是根据儿童时期的成就来预测其大学时期的分数,那么你多半会对孩提时代阅读能力强的人在大学时代取得的学术成绩颇感失望,而那些较晚开始阅读的孩子的大学成绩反而会给你带来惊喜。
——修正过的直觉性预测消除了这些偏见,所以预测(过高或过低)高估真实值或低估真实值的可能性大致是相等的。当你不带偏见地预测时仍然会犯错,但这时的错误较小,也不会导致过高或过低的估值。
4.10.2 两位教授候选人,应该选择哪一位?
我还曾描述过抵制不连续预测中的常见偏见的步骤,比如忽略基础比率,对信息的优劣不敏感。 有些预测偏见是通过一个数值范围来表达的,例如某学生的平均绩点或某公司的收益,这些偏见与我们在判断结果的可能性的过程中所持偏见相似,而两种偏见的修正过程也十分相似。
——1、都包含一种基准线预测,如果你对手头这个案例的情况一无所知,便会作出这种预测。在绝对的情况下,这个基准线是基础比率;在有数字的情况下,这个基准线就是相关结果的平均值。2、都包含一种直觉预测,无论是可能性或是平均绩点,这种预测会将呈现在大脑中的数值通通表达出来。3、在上述两种情况中,你的目的都是要作出一种预测,这种预测可在基础比率和直觉性反应之间充当媒介。4、在没有什么有价值的信息的情况下,你会坚守基准线。5、在其他极端情况下,你还会坚守自己最初的预测。当然,只有在对支持自己最初预测的证据进行过严格验证之后,你才会信心十足地坚持那个预测。6、在大多数情况下,你会发现自己有理由怀疑自己的直觉判断和真理之间的关联其实并不完美,而你最终会给出介于两者之间的判断。
修正你的直觉性预测的偏见是系统2的任务。要想找到相关的参照物、对基准预测作出估测或者对证据的质量进行评估,往往需要付出很大的努力。只有在风险很高而你又特别渴望避免犯错误时,这种努力才显得合乎情理。
——你应该知道纠正你的直觉也许会使你的生活变得复杂。无偏见预测的一个特征就是,只有在信息非常有效时才允许人们对罕见或极端的事件作出预测。如果你期待自己作出恰当有效的预测,那么你的预测结果就永远不会太离谱或者偏离平均值太多。
若一位风险投资家只为寻找“下一件大事”,那么他错过下一个谷歌或脸谱网的风险就会远远大于对刚刚创立的公司(最终破产)进行适度投资带来的风险。风险投资家的目标是正确判断极端情况,甚至以高估其他许多风险为代价也在所不惜。对于借出大笔贷款的保守银行家来说,某一位借款人破产带来的风险会比拒绝几位可能会履行债务的潜在客户带来的风险更大。在这种情况下,即使作出这些判断所依据的信息效度只是适中,使用极端的语言(“前景非常好”,“违约的严峻风险”)也可能会为其带来舒适感。
——一定要严肃对待那些反对适度的直觉性预测原则的意见,因为摆脱偏见并非总是头等大事。如果不问具体情况,对所有预测的错误都同样对待,那么对无偏见预测的偏爱就是合理的了。然而总有那么一些时候,一种错误比另一种错误更糟糕。
毕竟一个理性的风险投资家知道,即便是最有前景的新建公司,其成功概率也只是中等水平而已。她将自己的工作视为从所有赌注中找到的前景最好的赌注,而且关于要投资的那家新建公司的发展前景问题,她觉得没有必要欺骗自己。
——对于一个理性的人来说,无偏见且适度的预测不应该引发问题。
修正你的直觉性预测的偏见是系统2的任务。要想找到相关的参照物、对基准预测作出估测或者对证据的质量进行评估,往往需要付出很大的努力。
——只有在风险很高而你又特别渴望避免犯错误时,这种努力才显得合乎情理。此外,你应该知道纠正你的直觉也许会使你的生活变得复杂。
我们并不都是理性的,我们中的一些人也许还需要歪曲判断作为保护来掩盖自己的无能为力。
——如果选择接受极端的预测来蒙蔽自己,你就会清楚地意识到自己对自己的纵容。
我们直觉会选择金,因为她给人的印象更深刻,而且眼见即为事实。但与简的信息相比,金的相关信息则少很多。我们可以回想一下小数原则。事实上,你从关于金的描述中得到的信息样本比简的要小,而且在小样本中更容易发现极端的结果。
——小样本的结果往往有更多的运气成分,因此在判断金将来的表现时,更应该回归平均值。
小样本的结果往往有更多的运气成分,因此在判断金将来的表现时,更应该回归平均值。
——跟着我们的直觉走比违背直觉感觉更自然、更亲切。
信息不足时,极端预测和预测罕见事情的愿意都源于系统1。联想机制会很自然地将极端预测和作出这些极端预测所依据的可察觉的信息极端性匹配在一起—这也正是替代的运行机制。
——你的直觉会产生极端预测,而你也很容易对这种极端信心满满。
沟通和理解皆非易事。高尔顿在弄懂这一概念之前也颇费了一番心思。很多统计学老师在讲到这一问题时,心中也很没底,学生们最后对这个重要概念也是似懂非懂,只有个很模糊的概念。这个例子说明系统2需要经过特殊训练。
——将预测和信息匹配起来不仅是我们的直觉行为,这样做似乎也是很合理的。我们无法根据经验理解回归性。即使我们对回归性已经有了明确认识—就像我们在飞行教练员的故事中看到的那样—也只会用因果关系来解释这一特性,而这个解释往往又是错的。