囚徒困境

例子1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监1年。若二人都互相检举(相关术语称互相"背叛"),则二人同样判监8年。用表格概述如下:解说如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益,这也就是经典经济学中的"理性人假设"。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。[2]囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:[2]若对方沉默时,背叛会让我获释,所以会选择背叛。若对方背叛、指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论--选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。而且纳什均衡是较常发生的。


实例

上述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:[2]

折叠地产例子

著名作家三盅在他的《杂文也疯狂》中有这样一个单篇--《泡沫中的"囚徒困境" 》。记述了2008年房地产领域的囚徒困境。

我们学习宏观经济学的时候必定会学习博弈论,学习博弈论就必定涉及"囚徒困境"模型,而我一直认为,在所有市场博弈模型中,"囚徒困境"是最为接近心理学的一个,也是最能揭示善恶的一个,更是最能体现集体智慧的一个,选择背叛还是合作,始终是它不变的主题[2] 。

我们把眼光聚焦到当前的房地产市场中来吧,一个不小的"囚徒困境"已经展现在我们眼前,首先放弃帕累托最优解决方案的是万科,可想而知,在当前的市场环境下,它预期到的博弈的纳什均衡,显然是未来困境下的房地产商之间的普遍相互背叛,也就是说,万科在这场"囚徒困境"中,之所以选择首先动手,出卖所有除它之外的房地产商,是因为它预计在这种困境中,如果不尽早出卖所有同伴,自己将面临被出卖的结局,毕竟,这是一个非零和博弈游戏,出卖行为是可以换取非常大的利益的[2] 。

在这里,我为何要刻薄地使用"出卖"二字?我们回顾一下房地产商们过去N年中所缔造出来的"攻守同盟"便可理解,我曾经因为"房地产行业是否存在暴利"及"房地产开发成本是否应该公开"的问题在第一财经频道与反方争得面红耳赤,我从来就认定房地产开发企业存在着的暴利现象(至于在当前市场环境中它是否有存在的合理性,可以阅读笔者的《解读08房地产市场》中的相关描述),而当时几乎所有的开发商都是众口一辞地否认暴利的存在,更有甚者,潘先生羞答答地把成本比喻为自家老婆的奶子,充分论证了成本不可示人是理所当然的,当然,其中也有万科的声音……如今的万科,则践踏了自己曾经参与的"同盟",跳出来用实际行动来证明了暴利的存在,它不仅想证明自己存在暴利,也试图揭发所有同伴的暴利,所以,我说他的行为是"出卖"[2] 。

通过出卖同伴,万科真的能够获得个体的最大利益吗?理论上说它能够获得,但在实践中,也许它最终是打错了算盘,因为在所有的实践中,"囚徒困境"式的博弈必须是在一个信息极不对称的封闭环境中产生结果,所有囚徒式的自身恐惧与"理性决策"都是被相互隔绝的,而且这种博弈是不可被重复的(Douglas.Hofstadter创建),而当前的市场环境已经被不止一次重演过了(海南、05全国、08深圳),这种重复博弈最终将令所有参与者脱离困境,"囚徒困境"至此被彻底打破[2] 。

另外,最关键的一条是,在这场博弈中,政府也参与其中了,他直接参与的环节在于源头,即土地的供应(租借),这将加速打破"囚徒困境",因为与所有参与博弈者有着本质不同的是,政府是整个游戏的设计者,是囚禁规则的设计者,也是盖牢房、拆牢房的人,你很难想象一个有着政府参与其中的"囚徒困境"可以被称之为真正意义上的"困境",再回头看万科,在所有被他出卖的所谓同伴中,正有政府的身影……我这么说也许是不严谨的,毕竟这不是一个理想状态下的"囚徒困境",囚徒之间并没有相互隔绝,信息最起码在业内并非极度不对称,万科是否背负着某种使命,至今还不得而知[2] 。

最后,需求方同样面临"囚徒困境",从邹涛的"不买房运动"到"万人大团购"中便可管窥一二。

我认为,房地产商乃至房地产市场若想最终走出"囚徒困境",只有两种可能,一是前文提到的那位最为尊贵的囚徒如何作为,囚禁自己还是大赦天下,二是所有囚徒在重复博弈的过程中明智地选择停止博弈、创建合作,在过去的几年里,他们曾经做到过,如今,也许又到了这样做的时候了,他们需要的仅仅是集体智慧,而那些已经被出卖者窃走的蛋糕,恐怕也只能暂时性地延续出卖者的生命,却最终导致其今后连做囚徒的资格也不会有了……只为两个字,"信任"![2]

而在此之后,也许"囚徒困境"将演变成另一种新的模型,我姑且称之为"重复博弈结果下的囚徒报复"……

你可能感兴趣的:(囚徒困境)