第二章 误判心理学〈二〉2.奖惩机制

奖励与惩罚

      奖励什么就会得到什么,这是生活的刚性原则。

      如果你想吸引蚂蚁,就把糖放在地上。

                                    ——查理·芒格

      约翰的所作所为让他名利双收,这也促使他继续发扬这样的行事风格。

    我们贯彻能够带来奖励的行为,避免会导致惩罚的行为,所以通过行为的后果——我们了解是非对错。通过正强化可以使某种行为不断重复下去,而惩罚将使得某种行为被终止。 能带来利益、快乐的行为将会不断得到重复,而带来惩罚的行为则会消除。这就是说,奖励(或消除痛苦)能强化行为,惩罚(或剥夺快乐)能结束行为。如果某种行为在不断重复后,能够及时地贯彻奖赏或惩罚,则效果最佳。

    习得某种行为后,各种不同的奖励将会强化该行为。奖赏如果事先无法预测,则反应最大,且这种行为最难以消退。赌博得到的奖励就是如此。我们无法预测奖励何时来临,就无止境地尝试。此外,奖励的诱惑越大,则行为消退的阻力越强。

    究竟什么属于奖励性行为,什么属于惩罚性行为,我们总习惯把它们与过去的经历、结果或者与生俱来的价值观、 偏好相联系作出判断。(联结效应

    得到强化的行为将越来越深入骨髓。这也是习惯、迷信、 嗜好形成的原因,它们很难一时消除。18 世纪英国作家萨缪尔·约翰逊曾说 :“习惯的枷锁最初总是难以察觉,等你察觉的时候,已把你牢牢拴住。”

    这意味着什么?意味着人们总是实施那些对他们有利的 行为。就像蜜蜂对花蜜一样,它们去能够得到奖励的地方。 这同样表明,如果给我们的奖励是我们不需要的东西,我们同样照收不误。正如加勒特·哈丁(Garrett Hardin)在《鸵鸟政策》(The ostrich factor)中所说的 :“如果一个社会法律奖励抢劫银行的行为,那这个社会就会多出许多银行抢劫犯。如果选拔官员的方法青睐于傻瓜,那我们就会冒出更多愚蠢的政客。”

    根据瑞典的调查显示,疾病保险系统的变化将直接影响职工病假行为。如果疾病保险系统的改革意味着病假能得到更为慷慨的赔偿,则每位雇员的病假天数呈直线上升状态。根据美国有关医疗服务的调查显示,一旦医疗成本费用由其他人支付,则病人将会过分消费(overconsume)医疗服务。

      为什么人们会滥用 医疗保健和 福利系统? 政府给自己买单,我们使用系统不是很自然吗?如果不必为福利掏钱,则势必导致这种权利的滥用。一旦越来越多的人从滥用系统中受惠,群体将日趋漠视这种行为。从个人来说,他们获得巨大利益,而对社会来说,损失也很有限。最后每个人都形成这样的思维。古希腊哲学家亚里士多德曾说 :“越是共有的东西,受到的关注越少,因为人们只是关注私人财产,对于公共财产却不甚热心。”

为什么有人会偷窃?

    有一项调查显示,在不会被抓住的情况下,23%的人表示将会实施偷窃行为。经预测,每年美国企业由于偷窃造成的损失约达到 4,000 亿美元,其中 1/3的损失金额都是自己的员工所为。为什么? 几率和奖励。用查理·芒格的话说 :“在无法抗拒的诱惑面前,常常导致最糟糕的滥用行为。”如果环境让偷窃容易得逞,就变相鼓励了偷窃行为(坏行为将形成风气)

    查理·芒格告诉我们一种糟糕的政策是如何成为规范的 :

    美国警察部门有个简单的制度 :养老金将根据退休前一年的最后收入来派发。所以,在工作生涯的最后一年,大家一起合作,把当事人的加班时间累积增加到 1,000 个小时。退休后——尽管有些人的服务时间才达到20 年——就有一 笔可观的收入。当然了,这都是与同事们合作、欺骗国家系统的结果。大体就是这样,但有一点可以保证的是 :没有一 个人为此感到羞耻。不久,他们反而觉得这是自己的义务。这样,前有古人,后有来者——不间断矣。

迷信的鸽子:为什么网球选手都喜欢在决赛时穿着自己的幸运服?

    美国心理学家 B.F. 斯金纳(B.F.Skinner)在一个实验中,每隔一段时间就向鸽笼投放少量的食物。连续几次后,鸽子们开始表现一些“迷信行为”。如果鸽子正在摇头的时 候,食物掉下来,这只鸽子就认为是摇头使食物掉下来。于是它们开始重复这种行为——因为每次这么做,总会出现食物,但实际上,食物的出现与鸽子的行为毫无关系。斯金纳 在《鸽子的迷信》中说 :“人类有同样类似的行为......一些习惯性行为与好的行为结果之间偶然的联系将使得这种行为保持下去。尽管其中出现许多负强化的例子。”

正确的诱因重要吗?

    诱因可以作为强化物(也可称为激励,诱因指引起个体动机,满足个体需求的外在刺激和奖赏——译者注) 查理·芒格曾通过一个小故事来阐明建立正确诱因的重要性 :

    在众多企业的激励案例中,我最喜欢的一个是联邦快递。它运行系统的核心——也是能使产品一体化的关键——就是在午夜时分,聚集所有的飞机,把所有的包裹从一个飞机转到另外一个飞机。如果稍有延迟,整个操作就无法顺利地把产品送到联邦快递的客户手中。但联邦快递的员工总是搞砸,从没有准时完成过任务。管理者尝试了其他许多方法——道德劝说、威胁等等,但并不奏效。最后,有人想出了一个好方法,即降低小时薪资,但提高每个班次的薪水——一旦所有的工作都完成,他们就可以回家。瞧,一个晚上就把老问题解决了。

    约翰投资了一家生化行业的新兴企业,但公司业绩不佳,最终约翰亏损了一大笔钱。

    如果获得成功,我们就会成为意气奋发的风险偏好者。相反,失败了,则让我们畏首畏脚,消沉起来,成为风险厌恶者——即使成功或失败完全取决于运气好结果并不意味着我们之前作出了好决策,而坏结果同样不代表做出了坏决策。

    所以,如果下面有人给约翰介绍一个到生化行业新兴企业投资的机会,约翰很可能就此拒绝。因为大家认为过去能反映未来,约翰当然不会接受这个投资机会。假设约翰的第一个投资业绩非常出色,他是否会把新提议与过去成功的经历相联系起来吗?因而更加积极地参与投资计划?这种与过去成败经历自动联接的天性使得我们面对新状况、新环境时反应活跃度下降

    对于盲目依赖过去经验来应对现在和未来的危险性,马克·吐温了解得很透彻 :“有时候我们满足于从经验中获取智慧,并停止尝试。应谨慎这种行为,否则就如一屁股坐上了热火炉盖(on a hot stove-lid) 的猫一样。它再也不会爬到这个热火炉盖上,但从此也不会有机会坐到一个冷火炉盖上。”

那奖励与惩罚的程度或者前后顺序有什么影响?

    玛丽从不把孩子的礼物全部放在同一个礼盒里。

    如果把生活经历分割成一个个小片段,人生似乎更有嚼 头。所以,我们喜欢把愉快的经历分成小片段,而把痛苦的经历揉成一团。这也是为什么玛丽把礼物放在几个不同礼盒中的原因。不断有奖励就会不断有惊喜。比如说,一下子赢得 100美元的感觉不如连续两次赢得 50 美元的感觉好,因为每次赢钱都会让人有成就感。而一下子输100 美元比两次输掉 50 美元的感觉要棒,因为每一次输钱都是痛苦的过程。

    我们希望事情发展越来越好。所以,先输 100 美元,再赢得 50 美元要好于先赢得 50美元再输 100美元的结果。我们希望先把失败的阴霾通通驱赶掉,所以宁可先输钱,而不是先赢再输。因为讨厌失败的经历,我们也不喜欢在等待失败的过程中煎熬。我们喜欢能尽快从失败中走出来。

    联结效应和强化都是条件反射的表现。查理·芒格曾举了一个例子,讲述如何利用这种心理力量来发明一种不含酒精的饮料。

    饮料中的食用价值等作为强化物,而饮料瓶的包装、商标名和饮料的外观等作为刺激物......然后,我们继续利用第二种条件反射——巴甫洛夫的条件反射理论。如何利用该理论取得巴甫洛夫的联结效应呢? 显然,我们只要把该饮料和商标与大众喜欢的东西联系起来 :让人热血沸腾的经历、性感的尤物、快乐的时光——诸如此类。

    那在什么情况下昔日奏效的条件反射又失去作用呢?查理·芒格继续说 :如果顾客尝试另外一种饮料品牌,并发现该品牌为一大 强化物(reinforcer),他将会改用这种品牌正如我们所知,在婚姻中,如果你一直陪伴左右、随时待命,则伴侣换用另外一种品牌的可能性就小,因为婚姻的设置并不包括长久的分离。同样,如果你销售的产品随处可见,那顾客改用其他产品的可能性也小,由此,就产生了强化作用。

注意点

    1·美国政治家、科学家和哲学家本杰明·富兰克林告诉我们 :“一小匙的蜂蜜比一加仑的醋更能吸引苍蝇。”在改变行为方面,表扬比惩罚更有效,所以鼓励正确的行为要比 打击错误行为的效果更明显。

    2·蒙田曾说 :“司法部门传统的做法就是杀一儆百。惩罚人们过去的错误无疑是愚蠢的,正如柏拉图所说 :做过的 事,泼出去的水。”但这么做的目的是防止重蹈覆辙,也是防止其他人犯同样的错误绞死犯人,我们不是为了让他赎罪,而是为了改造其他人。

    3·不要从自己或别人的成败经历中过度学习(overle-arn)。同样的行为在不同的情况下可能会取得不同的结果

    4·区分技能和运气。查理·芒格说 :“如果你坐上了具有竞争力的高薪职位,你心里应该弄清楚,今天的成就与能力和成功的动力因素 有几分关系,而 运气因素 又占到几成。”

    5·美国小说家厄普顿·辛克莱(Upton Sinclair)说 :“一个人的兴趣范围取决于他所拿薪水要求的范围。”因为我们只做能奏效的事情,所以应保证诱因的正确性要把激励机制和业绩联系起来,也要与你最终达成的目标因素联系起来。让别人知道正确和错误行为的分水岭,并了解他们的表现、奖励以及你最终要达成的成果三者之间的联系。比如说, 把经理的薪酬与其(管理的部门)取得的商业价值联系起来,剔除其中所花费的成本因素等。汽车保险商盖可(GEICO) 的计划就体现了伯克夏·哈撒韦公司的薪资原则沃伦·巴菲特表示 :

    目标的制定,必须遵循 :(1)与经营业务的财政状况相符合 ;(2)简单扼要,便于顺利执行 ;(3)与方案参与者每日的活动直接挂钩。最后(4)我们必须避免类似于“中彩票” 的方案,比如说派发伯克夏股票期权用来激励员工,因为它们的最终价值——0 ∞——完全不在我们想要影响的目标人 群的掌控内。我们认为,不切实际的薪资系统对于业主来说是一种浪费,而且可能抵消我们在管理层推行的行为价值观。

    6·奖励需要落实到个人的表现,而非表扬整个组织机构的努力或进度等 ;此外,事后进行奖励,而非事前奖励。

    7·不要把金钱作为惟一的激励。有时候完成自己喜欢的事情后得到奖励,会把自己热爱的东西沦为冷冰冰的工作。奖励会改变我们的想法。曾经我们因为喜欢做而做,现在变成为了赚钱而做,所以其中的玄机就是要表明奖励的性质。因为取得了成就而得到嘉奖将激发更强的斗志,因为我们感觉到额外的满足。如果一种奖励让人感觉受控,则会变成为了取得报酬的被动产物,也会让这件事的吸引力大打折扣。 布莱兹·帕斯卡尔(Blaise Pascal)曾说 :“我们通常能被自己所发现的原因说服,而不是别人告诉我们的理由。”

    8·制度或者章程的建立必须大力倡导和鼓励目标行为对于不提倡的行为不要给予物质奖励。在这种制度下,必须让那些负面行为付出代价、难逃惩罚。同时,不受欢迎 的行为 付出的代价 必须要高于其带来的利益。比如说,盗窃得逞的快乐必须要低于入狱的痛苦。

    9·有时候,很难改革一种制度。沃伦·巴菲特说 : 如果手握重权的人从某种体制中获得巨大收益,特别是所获利益跟该体制不成比例,这时候,一个体制就很难被改革

    10·决策人应对自己的行动负责。美国哲学家查理·弗 兰克尔(Charles Frankel)在《现代人的案例》(The Case for Modern Man)中是这样定义“责任”的 :“负责任的决定就是决策人或组织必须对间接或直接受到该决策影响的人负责。”查理·芒格也曾表示 :“有个例子可以用来解释所谓的‘责任体制,这就是罗马人在建造拱门时设立的一 套制度。负责拱门设计的人必须在施工架撤掉后,自己先站在拱门下。这就像自己帮自己捆扎降落伞一样。”

你可能感兴趣的:(第二章 误判心理学〈二〉2.奖惩机制)