囚徒困境

聪明囚徒的困境

谈这个,首先要提个题外话题,什么叫博弈论,左右也是无意中涉及到这个话题,在网上搜了一圈,摆度如下:

古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…

简言之博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。

言归正传“聪明的囚徒”

甲、乙两个人一起携枪准备作案,被警察发现抓了起来。因为没有其他犯罪证据,警方只能以非法携带枪支的轻罪处罚他们。但是警方怀疑这两个人可能还犯有其他重罪,于是分别进行审讯。警方告诉他们:如果主动坦白,就有可能得到宽大处理。否则,一旦同伙主动交代,抗拒者则必将受到重罚,而坦白者可以立功减刑。

在这种情形下,这两个囚犯必须作出自己的选择:或者他们相互背叛,与警方合作;或者保持沉默,和自己的同伙合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):

1、如果两人都不坦白,警方会以非法携带枪支罪各判两人1年徒刑;

2、如果其中一人招供,而另一人不招,坦白者作为证人将被免予起诉,另一人将会被重判10年;

3、如果两人都招供,则两人都会因抢劫罪各判5年。

我们假设这是两个聪明的囚犯,现在这两个聪明的囚犯该怎么办呢?是选择相互合作还是相互背叛?从表面上看,他们应该相互合作,保持沉默,因为这样他们俩将得到对双方来说都是最好的结果——只获刑1年。但是,由于信息被封闭,两人无法交流,而他们又不得不考虑对方可能采取的选择。由于甲、乙两个人都十分精明,所以他们都会优先考虑如何才能减少自己的刑期,至于同伙被判多少年已经顾不得许多了。

这里左右先卖个关子,只是想问,如果是我,身处其中,会如何抉择?会不信任同伴还选择招供还是……说实话,对人性的判定,事情如果没有真实发生,一切都只是个假设,人性的弱点也只有在危难来临时方能淋漓体现。好像有些跑题了,今天先抄到这里。需要做出说明的是:全文基本引用我朋友发过来的书,因没有首页,不太清楚叫什么名字,好像叫关于策略的63个有趣话题,只是觉得很有意义,拿出来其共享。

囚徒困境的结果就是两个人全招供,用唐邑的话说,全被警察博弈了.

因为人都会有私心的,每个人都会这样推理:假如对方不招,我一招就可以马上出去,而不招会判1年,假如对方招了,我也招了,那只判5年而已,而不招会判10年.可见,无论对方招与不招,我的最佳选择都是招认,两个人都会基于同样的想法做出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择.但就整体而言却是一个最差的结果.

其实两个人明明知道合作可以达到一个最优的结果,可事实却往往总是事与愿违呢?为什么会发生这样的事?

因为人类的天性是趋利避害的,是自私的.用英国哲学家堆布斯的话说,"自然状态"中人与人之间像狼与狼一样,是"每个人对每个人的战争".在这种状态中,每个人都力图保护自己的利益,并企图占有别人的东西,此时每个人是每个人的敌人.此时没有任何规则,没有财产,没有正义或不正义,只有战争.而"囚徒困境"恰恰准确地抓住了人性真实的一面:相互防范背叛与不彼此的不信任.

这倒使我想起荀子的一段话:"凡人有所一同。饥而欲食,寒而欲暖,劳而欲息,好利而恶害。是人之所生而有也,是无待而然者也,是禹桀之所同也。目辨白黑美恶,耳辨音声清浊,口辨酸咸甘苦,鼻辨芬芳腥臊,骨体肤理辨寒暑疾养。是又人之所生而有也,是无待而然者也,是禹桀之所同也。可以为尧禹,可以为桀跖,可以为工匠,可以为农贾,在执注错习俗之所积耳。汤武存则天下从而治,桀纣存则天下从而乱,如是者岂非人之情固可与如此,可与如彼也哉?材性知能,君子小人一也。好荣恶辱,好利恶害,是君子小人之所同也。人之生固小人,无师无法则唯利之见耳。尧禹者,非生而具者也,夫起于变故,成乎修为,待尽而后备者也。”——《荀子·荣辱》

但这里与“囚徒困境”案例中有个不同之处:这就是博弈论专家所谓的“重复的囚徒困境”,它更

逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。

其实我曾也就这个问题问过周围的一些人,大家不约而同会想到:对方是什么人?对象不同,采取的行动也会不同。可见每个人心里都有一个评判风险的系统,良好的信誉才能营造良好的信任,从而打破博弈论中“囚徒的困境“。

你可能感兴趣的:(囚徒困境)