在一在二不在三(博弈论的诡计)

 

公元前512年,吴王阖闾执政,为了称霸诸侯,他四处网罗人才,先后把伍子胥和孙武收到自己的麾下。不久。吴国和楚国之间爆发了一场大规模的战争。

 

说起这场战争的起因却非常简单,吴国边境有一个小镇叫卑粱,这里与楚国的边境小镇钟离接壤。虽然分属于两个不同的国家,但是两个小镇的人之间相处得一直十分和睦。有一日,吴国的一个小筏子采桑叶,与楚国的小孩子吵了起来,双方的边民因此发生争斗。楚平王得知以后,派大兵去平了卑粱。吴王以牙还牙。也派公子光带兵去攻打楚国。吴国大军浩浩荡荡开赴边境,不费吹灰之力就把楚国防守的钟离和居巢荡平了,乘势直追楚国的腹地,逼得楚国急忙撤军。

 

公元前506年,楚国为了报复。出兵攻打已经归附吴国的小国——蔡国。吴国派大将孙武率领兰万精兵,乘船逆淮河而上教援。楚军赶忙遣兵,在汉水设防。没想到孙武却突然弃船登岸,从陆路奔袭楚国腹地。吴军五战五胜,占领了楚的国都郢城。然而,这时越国乘吴军伐楚之机进攻吴国,秦国又出兵帮助楚国对付吴军,这样,阖闾不得不引兵返吴。此后,吴又继续伐楚,孙武率领大军挥师直下,一直打到郢都,迫使楚昭王仓皇出逃。

 

因为两个小孩的争吵而导致楚国几乎被灭亡的这一连串战争,在其演进过程中,我们可以清晰地看到一报还一报策略的作用机制。

 

一报还一报的策略解释了一个纯粹自利的人何以会选择合作,只因为合作是自我利益最大化的一种必要手段。如果对方知道你的策略是一报还一报,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取一报还一报策略,那么双方均愿意采取合作策略。但是这个策略面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的策略。

 

在这里,一报还一报策略反映出了自己的局限性。两个以牙还牙者会从合作开始,然后,由于各方反应一致,合作似乎注定可以永久地持续下去,从而彻底避免囚徒困境问题。但是,不管出现误会的几率怎样微乎其微(即便是小到万亿分之一),只要有可能出现误会,长期而言,一报还一报策略会有一半时间合作,一半时间背叛。理由是,一旦出现误会,双方将问题复杂化与澄清误会的可能性一样大。这么一来,一报还一报策略其实就跟扔硬币决定合作还是背叛的随机策略差不多,因为后者选择合作和背叛的几率也是相同的。即使出现误会的几率很小,也只是将出现麻烦的时间推迟了。而且,反过来,一旦出现误会,就要花更长时间才能澄清。

 

由于资源的约束。在现实中没有人有足够的时间、精力来辨识和维持对别人的各种回报,尤其是当他拥有很多博弈对手的时候。由于各种偶然的因素,误解随时随地都有可能发生。比如,两个小孩于之间的争吵可能被看敌对行为的开始而引发战争。

 

如何做到回报的“相称”又是一个问题:对手偶然背叛了你,你通过行动或者不行动来显示你对此介意,你自己觉得是相称的“警告”,但对手很可能认为你反应过度,小题大做。因而会出现这样一种情况:哪怕是微不足道的误解一旦发生,一报还一报策略的双赢就会土崩瓦解。

 

这个缺陷在人工设计的电脑锦标赛中并不明显,因为电脑根本不会出现误解。但是,一旦将一报还一报策略用于解决现实世界的问题,误解就难以避免,结局就可能是灾难性的。一方对另一方的背叛行为进行惩罚。对手受到惩罚之后,不甘示弱,进行反击。这一反击又招致第二次惩罚。无论什么时候,这一策略都不会只接受惩罚而不做任何反击。由此将形成一个循环惩罚与报复就这样自动持续下去。

 

从这个角度来说,一报还一报策略在现实世界中会出现两种缺陷:第一,实在太容易激发背叛;第二,它缺少一个宣布“判此为止”的机制。

 

当博弈中考虑到这种随机干扰——即由于误会而开始互相背叛的情形时,吴坚忠博士经研究发现,以修正的一报还一报策略对双方会更有利。这种修正包括两个方面:一是“宽大的一报还一报”,即以一定的概率不报复对方的背叛;二是“悔过的一报还一报”,即以一定的概率主动停止背叛。

 

当某一背叛行为看上去像是一个错误而非常态举止的时候,你应该保持宽容之心。必须记住的一个重要原则是,假如有可能出现误会,不要对你看见的每一次背叛都进行惩罚,而要采取“在一在二不在三”的策略。你必须猜测一下是不是出现了误会,不管这个误会来自你还是你的对手。这种额外的宽容固然可能使别人对你稍加背叛,不过,假如他们真的背叛,他们的善意也就不会再被相信了,误会一再出现时,你也不会再听之任之。所以,如果你的对手有投机倾向,他终将自食其果。

 

如果对手的这一背叛是故意的,你当然也不想太轻易地宽恕对方而被对方占了便宜。但是经过一个漫长的惩罚循环之后,也许到了该叫停并尝试重建合作的时候了。

 

爱克斯罗德在《合作的进化》一书结尾早已指出:友谊并不是合作的必要条件,即使是敌人,只要满足了关系持续、互相回报的条件也有可能合作。合作不依靠善意、诚信或者一个外来的仲裁者,也完全可能从自私自利的冷酷盘算中产生。比如,第一次世界大战期间在战场上自发产生的“自己活,也让他人活”的原则。德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契——互相不攻击对方的粮车给养,约束自己不开枪杀伤人,只要对方也这么做。使这个原则能够实行的原因是,双方军队都已陷人困境,三个月的时间给了他们相互适应的机会。

 

这个例子说明,友谊不是合作的前提。因此,我们也可以为“在一在二不在三”迈向合作的一步。合适的策略也能达成并保证合作,可以制定一些具体的操作:

(1)开始合作。

(2)继续合作。

(3)计算在你合作的情况下对方看上去背叛了多少次。

(4)假如这个百分比变得令人难以接受,转向一报还一报策略。

 

注意,与以前不同,此时的一报还一报策略不是作为对良好行为的奖赏,相反,却是对企图占你便宜的另一方的惩罚。要想确定令人难以接受的背叛的百分比是多少,你必须了解对方行为的短期、中期和长期历史。仅看长期历史是不够的,一个人合作了很长时间并不意味着他不会在声誉开始下降的时候企图占你的便宜,你还要知道“最近他都对你做过什么”。这种策略的确切规则取决于错误或误会发生的几率、你对未来获益和目前损失的重要性的看法等等。不过,在并不完美的现实世界里,这种策略很可能胜过严格的一报还一报策略。

 

你可能感兴趣的:(在一在二不在三(博弈论的诡计))