博弈论:悲观的策略得出最乐观的良性环境

北京大学汇丰商学院经济学教授何帆说“人性只在幽明之间,从幽的角度来看,我们是无法预测他人行为的;从明的角度来看,他人有心,不可度之,而博弈论就是在幽明之间观察一个人的行为”。

博弈论是什么,博弈论说的简单些就是一个有关策略的理论,使用博弈论的前提需要有博弈的对象,即博弈论的使用需要在至少两个以上的人之间才能产生。而博弈论的三个要素则分别为支付结构、参与的人数、博弈的次数,其中支付结构是指成本和收益之间的关系、参与人数就是参与博弈关系的人数,人数越多博弈结果越不可控、博弈的次数也就是双方在博弈过程中需要考虑短时利益还是长远利益。

博弈论中最著名一个理论就是“囚徒困境”,简单来说,就是A、B因为犯罪而被隔离讯问,而A、B有如下三个选择,第一个选择是如果A承认犯罪事实,B也承认犯罪事实,则A、B都会被判刑5年;第二个选择是A或B其中一人承认犯罪事实,而另一人否认犯罪事实,则承认犯罪事实的一方免罪,否认的则会被判刑10年;第三个选择是A、B都否认犯罪事实,则A、B都会被免罪。但A和B都不知道对方会做什么选择,基于此,即产生一个困境,背叛对方还是选择合作,背叛可以使自己获得相对最大的利益(免罪或判刑5年),不背叛有一定的几率会免罪,但也有一定的几率会被判刑10年。基于此,就需要考虑构成博弈论的三个因素,即支付结构、博弈次数、博弈人数,如果A或B考虑到背叛的成本远大于收益,则他们不会选择背叛,反之,他们则会选择背叛;如果A、B需要多次博弈,那么他们也不会选择背叛,因为背叛对方一次也意味着下一次对方也会背叛你,这对双方均没有好处,反之,如果仅有一次博弈,那么他们背叛的可能性将会更高;此外,如果参与的人数除了A、B之外还有其他人,那么因为意见的难以统一,则A、B选择背叛的可能性会更高,反之,则会降低。

以上,就是博弈论的基本框架,而且该框架运用的前提是参与博弈的人都是理性人,即完全按照逻辑、利益成本等模式思考问题的人。如果参与博弈的为非理性人,上述博弈的框架适用性也就存在问题了。不过,我们相处的世界远比博弈论的框架复杂,所以,基于博弈论的存在,人们也会越来越重视诚信。为什么会重视诚信呢,因为诚信可以实现各方利益的最大化,政治学家阿克斯罗德的一个著名的研究即验证了上述结论。他曾邀请了很多计算机专家、心理学家、经济学家设计不同的游戏规则,并用计算机程序模拟出来,然后将代表各种游戏规则的程序都输入计算机,让这些游戏规则相互博弈,看哪一种会最终胜出,经过无数次的博弈后,最终胜出的冠军叫做“一报还一报”,这个游戏规则由如下三条构成:第一、不主动作恶;第二、以牙还牙,即如果对方选择攻击,那么被攻击方也会选择攻击;第三、如果对方停止攻击,那么另一方也会选择停止,且不计前嫌。这个策略的特点是它不会主动陷害别人,但它也不盲目的选择善良,且他会选择适时的宽容。当然,这个策略在一开始遇到其他更狡诈的策略是很吃亏的,但是,只要持续坚持这个策略,那么,这个策略也会影响其他的策略,最终就会产生一个结果,“一报还一报”的策略越来越壮大,最终其他策略最好的选择就是与它融为一体,否则,面临的就是被消灭。何帆教授的一句话很好的概括了这个策略:“即使这个世界已经沉沦,只要有那么一批人愿意坚持道德底线,你仍然可以过得很好,没有人强迫你堕落,除非你自愿”。

一个良性的“生态圈”可能不是以德而铸就的,因为如果一个放弃德并因此而获得了利益,那么将会有更多的人采取放弃德的策略,最终这个所谓的良性“生态圈”也就会消失。但如果良性“生态圈”是以具有威慑力的规则和策略构建的,那么,凡是违背规则和策略的人,必然会受到惩罚,但是,如果选择遵守,则不仅会降低各方的交易成本,也可提高交易的效率,这对参与博弈的各方来说均是双赢的选择,这就是博弈论想让我们看到的理想环境,也是我们自己应该恪守规则的原因所在。

博弈论的立足点在于每个人都是自私且理性的人,但是,经过多次的博弈,自私的人将会发现自己的策略只会加快自己利益的减损,于是,自私的人也开始试着去变得无私一点,他也没有想到自己这一点微小的改变却是“蝴蝶效应”,参与博弈的各方像多米诺骨牌一样,都转换了自己的博弈策略。

无私的人曾经也可能是自私的,乐观的人曾经也可能是悲观的,但是,当长远利益产生时,一切都会改变,不变的可能只是一个坚守。

你可能感兴趣的:(博弈论:悲观的策略得出最乐观的良性环境)