摘取改变自《策略思维》(by Dixit …

      俄罗斯轮盘赌中胜负纯粹依靠运气。但是另外一场轮盘赌中,一个博弈论专家本可稳抄胜券,却因为未曾细想其策略而满盘皆输。

      巴里.奈尔巴夫(Barry Nalbuff)是一个博弈论经济学家。他与迪克西特(A. Dixit)合作的《策略思维》是一本非常著名的博弈论科普之作。在那本书中记录了巴里的一次深刻教训。话说当年巴里大学毕业时,为了庆祝一番,参加了剑桥大学的五月舞会。庆祝活动的一部分包括在一个堵场下注。每人都得到相当于20美圆的筹码,截止舞会结束时候,收获最大的一位将免费获得下一年度舞会的入场券。到了最后一轮轮盘赌的时候,纯粹是出于一个令人愉快的巧合,巴里手中已经有了相当于700美圆的筹码,独占熬头。第二名是一名拥有300美圆筹码的英国女子。其他参加者实际上已经被淘汰出局。该女子提出与巴里分享下一年的入场券,但是巴里拒绝了。是的,自己占有绝对的优势,怎么可能满足于得到一般的奖赏呢?

      为了理解接下的策略,有必要交代一下轮盘赌的规则。典型的轮盘赌是轮盘上刻有37个数字,标记为从0到36。轮盘赌的输赢取决于轮盘停止转动时小球落在哪一格。假如小球落在0处,就算庄家赢。玩轮盘赌最可靠的玩法就是堵小球落在偶数还是奇数。这种玩法的赔率是一赔一,比如1美圆赌注变成2美圆,不过取胜的机会只有18/37(37个格中除了0外只有18个偶数,或18个奇数)。采取这样一种玩法,即使该女子押上全部300元筹码也不能稳抄胜券。因此她被迫选择一种风险更大的玩法,她把全部的筹码押在小球落在3的倍数上。这种玩法的赔率是二赔一(若她赢了,则她的300美圆将变成900美圆),但取胜的机会只有12/37(37格中除0外有12个数字是3的倍数)。
现在,那名女子已经将她的筹码摆上桌面,表示已经下注,不能反悔。那么巴里应该怎么办呢?

      读者也可以先想一想巴里应该怎么办。真实的结果是,巴里将200美圆押在偶数上,并且嘀咕他输掉冠军宝座的唯一可能性就是他输并且她赢,而这种可能性发生的几率为1:5,因此形势对他非常有利。然而,几率1:5的事件也时有发生。在这里,结果是那名女子赢了。

      事后,巴里承认做出这种错误的押注方式是因为当时已凌晨三点,喝了太多香槟,没有办法保持头脑清醒了。他真正应该采取的策略是模仿那名女子的做法,同样把300美圆押在小球落在3的倍数上。为什么呢?因为尽管小球是否落在3的倍数上是不确定的,但若巴里采取与女子同样的押注方式,那么只会出现的结果是要赢一起赢,要输一起输,但无论输赢巴里都会比女子多出400美圆而获得冠军宝座。相反,如果巴里采取与女子不同的押注方式,则女子赢得赌注而巴里输掉赌注的可能性就是存在的——而这正是真实的故事。

      这件事给了巴里一个深刻的教训。保持清醒的头脑来选择最恰当的策略对于在博弈中取胜是至关重要的。不过,在毕业晚会上这样兴奋、疲倦的时刻,保持清醒头脑可能也很不容易。不仅巴里如此,其实那个女子也是在不清醒的状态下偶然取胜的。怎么可以判断出来?很简单,巴里只要采取与女子一样的策略则女子必败,只有两人采取不一样的策略时女子才有获胜的可能;既然如此,该女子就不应率先下注,因为率先下注则巴里就可以跟随其下同样的注;她应该等巴里先下注,然后再下与巴里不同的注,这样才有反败为胜的可能。

       巴里的这个故事所蕴涵的道理是深刻的。在现实中,我们常常会发现类似的领先者模仿落后者的例子。比如帆船竞赛,领先者总是试图与落后者保持同一航道,而落后者总是希望走上与领先者不同的航道。因为帆船会受到风速、风向的随机影响,对于不同航道的船,这种随机影响可能有差异,同一航道则影响往往是一致的。领先者维持与落后者同一航道,则可避免因随机因素影响而失败;而落后者选择与领先者不同航道,虽不能保证胜利,但却可以通过随机因素获得反败为胜的机会。在一个市场中的企业其实又何尝不是如此?先进的企业常常采取大多数企业所采取的比较保守的常规战略,而后进的企业中也有不少则提出“超常规发展”。遵循常规的后进企业没有机会超越先进的企业,而“超常规发展”战略虽然面临更大的风险,却的确也成就了少数恰好碰对了运气的企业。同样的情形也出现在股市分析员和经济预测员身上。业绩领先的预测员总是想方设法随大流,尽量做出与其他人差不多的预测。这样一来,大家就不容易改变对这些预测员能力的看法。另一方面,初出茅庐预测员则常常会采取一种冒险策略:他们喜欢预言市场出现繁荣或者崩溃。通常他们都会说错,以后再没人相信他们。不过,偶尔也有人做出了正确的预测而一夜成名,从此扬名立万。

      从太太的回答中,我突然明白了为什么行为博弈理论(behavioral game theory)现在大行其道。


     下面要讲到的例子与美国1970年代的一个电视节目有关,其中的概率计算困扰着成千上万的大众。在节目中,节目参与者将在3扇门之间选择其中一扇。这 3扇门中有且仅有一扇门的后面装着奖品,另外两扇门则装着讽刺性礼品比如鸡崽(chicken)或者笨驴(donkey) 。当节目参与者选定一扇门之后,主持人就会打开另外两扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参与者要不要改变最初的选择。

      这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门?

     大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因为在做最初的选择时,选择正确的概率是1/3;而一旦选择之后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信念修正为自己选择正确的概率为1/2,选择失误的概率也是1/2。此外没有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。

      但是,上述看法不符合真实的情况。真实的情况是,如果参与者改变自己最初的选择,那么获得奖品的概率是2/3,而不改变最初选择则获得奖品的概率仅为 1/3。也就是他应该改变自己最初的选择。奇怪的是,将这个结果告诉给参与者后,他们也常常还难以理解为什么会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误的门的概率是2/3。如果参与人一开始的确选择了错误的门,那么主持人随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初的选择中参与人的确选正确了(概率为1/3),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了则参与人应该换门并一定获得奖金,如果参与人一开始就选对了则应该坚持并一定获得奖金——于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择出现错误的概率是2/3,为正确的概率是1/3。因此,在不知自己选择是正是误的情况下,在第二阶段改变主义转换到另一扇门,的确增加了获得奖品的概率。

      对于有些读者,可能仍难以明白上述道理。那么我建议你可以做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你来选择一张牌;你的朋友将你没选取的牌中拿走没有硬币的一张,再问你是否改变你当初选的牌。为了证明转换选择不不转换选择将更有可能获得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次),再以“不转换选择”为策略进行同样多的次数(比如50次)。结果你会发现什么?你将发现“转换选择”的策略中,得到硬币的次数基本上是“不转换选择”策略中得到硬币的次数的两倍,而两种策略中硬币出现的频率也基本上分别接近2/3和1/3。

      当然,在一次性节目中,并不允许这样的重复实验。而且大多数人的确也不明智地选择了“不转换选择”。我曾在学生中做这个实验,结果32人中有20人坚持“不转换选择”。说明大多数人是不清楚这样复杂的概率思考的。更有意思的是,我跟我太太(一个没有修过高等数学的文学士、教育学硕士)玩这个游戏时,她也是坚持“不转换选择”。当我告诉她如果转换则可以成倍提高获奖概率时,她却说:如果我开始选对了,改变了结果错了就会后悔,所以心理素质好的就不应该改变。当然,她说的已经不是纯粹的概率计算,但也不是没有道理的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择对了,那么后来改变了选择会令人后悔。但是,如果后来你知道开始的选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回答更经典:“一开始选择错了,我就只认为运气不好,没什么可后悔的;如果开始对了,后来改变错了,才是后悔的。”这让我理解想到人们日常生活中常提到的道理:从没得到的东西,也就不会有失去它痛苦,而已得到的失去了,就会深感创伤。从太太的回答中,我突然明白了为什么行为博弈理论 (behavioral game theory)现在大行其道。

你可能感兴趣的:(摘取改变自《策略思维》(by Dixit …)