纳什均衡学习心得

纳什均衡用百度百科的解释就是"纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。

很显然用百度百科的解释有点复杂,看过《五分钟商学院》关于纳什均衡润总是这样通俗的解释的“简单来说,纳什均衡就是一种博弈的稳定结果,谁单方面改变策略,谁就会损失。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。为了让大家更好的理解纳什均衡,下面举例说明,让大家更容易理解。

例1:市场上有2家企业A和B,都在同一个地区从事地产开发,房子的单方成本都是10000元钱,A和B都卖15000块钱。有一天A降价到14000,于是A销量大增,B销量大减。B看到了后,降价到13000,于是B销量大增,A销量大减。但如果价格战一直这样打下去,对谁也没有好处,于是A也选择降价到13000,和B一样。B看到了A降价到13000,B既不敢涨价,也不敢降价。涨价了市场就丢了,降价了,就赚不到钱甚至赔钱。所以A和B都不会再去做改变,这就是纳什均衡。


例二:经典案例 囚徒困境

图片发自App

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌 疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8 年。如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:

假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这 样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。

基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

从上面的例子可以看出,当每个人仅在考虑自身利益的时候,恰恰最终得到了对自身利益最坏的结局。其实破解这样的困境,只需要我们的出发点变一变即可,也就是,做决定的时候,从对方利益最大化的入口思考。当每个人都这样思考的时候,最终的结果恰恰对自己也是最好的。

我不入地狱,谁入地狱。正是这样的大愿力,方能普度众生。

在狭隘的个人利益观虾,对自我利益的理性追求导致了每一方都最终采取了对整体利益不利的行为,因为追求私利的每一方都将他不考虑的成本强加给对方。

然而,对于凡人来讲,能做到这一点,确实不易,但开拓的路本就不是容易屈服的人能开拓的,否则也不会称之为困境。

你可能感兴趣的:(纳什均衡学习心得)