耶鲁大学《博弈论》课程——纳什均衡

纳什均衡 Nash Equilibrium

纳什均衡(Nash Equilibrium):策略组合是一个集合,该集合包括每个参与人的一个已选策略,用S1 *,S2 *,…,Sm 表示(假设这个博弈一共有m个参与者组成),纳什均衡是满足如下条件的均衡: 对于任意此集合内的参与者i,他所选的策略Si 是其他参与者所选策略的最佳对策(Best Response),也就是说每个参与者都选择了最佳对策,此时,在别人都不改变行为的情况下,自己改变行为没有任何好处

为什么要学纳什均衡?

  • 纳什均衡“不后悔”,即不为当时做出的决定后悔,因为已经采取了最优反应
  • 纳什均衡有自我实现(self-fulfilling)的动机,所有人都会自觉的保持这个均衡状态,因为此时大家都是对方所选策略的最佳决策。任何参与人都严格不会改变策略,改变策略都严格不会使参与人收益(其他参与人不改变行为的前提下,自己改变行为并没有任何好处。)
  • 某些情况下,博弈会朝着趋向于均衡的方向自然发展。当有多个均衡状态时,纳什均衡可能取决于初始条件与阈值(即超过阈值往好的方向发展,低于阈值往差的方向发展不稳平衡

【例1】:

耶鲁大学《博弈论》课程——纳什均衡_第1张图片

这里我们用蓝色表示参与者1的最佳策略,红色表示参与者2的最佳策略。 可以看出:

BR1(l) = M BR1© = U BR1® = D

BR2(U) = l BR2(M) = c BR2(D) = r

(D,r)是纳什均衡。

将纳什均衡和优势劣势联系起来,如下例2、例3:

【例2】:

我们又重新回到囚徒困境的情况来分析。同样用蓝色表示参与者1的最佳策略,红色表示参与者2的最佳策略。

耶鲁大学《博弈论》课程——纳什均衡_第2张图片

可以看出:(α,α)是纳什均衡。 – 因为在任何情况下我们都不会去考虑那些绝对劣势策略(如这里的β)。

【例3】:

耶鲁大学《博弈论》课程——纳什均衡_第3张图片

弱劣势情况就不像绝对劣势情况那样好处理。

这种情况系产生了两个纳什均衡,即(α,α)和(β,β)。 虽然看上去选(β,β)的情况很傻,但是也是有其一定依据,如下面例子。

投资】游戏:

全班同学进行一个游戏,每位同学可以选择投资10美元或者不投资,如果全班有90%以上的人都选择了投资,那么投资的人会得到50%的利润,否则,投资的人会损失掉投资的钱,而不投资的人始终是0利润。

这种情况下有两种纳什均衡:【全班都投】 或者 【全班都不投】。显然“全班都投”能带来利润,而“全班都不投”不能带来利润。但是在实验中,会发现最开始可能有一半人投,一半人没投,此时没投的没收益,投了的亏损,然后进行第二次游戏,此时基本上所有人都不投了。为什么?

这是因为初始条件对于投资并不利,那部分投资的人开始对投资没有信心,就趋向于不再投资。

总的来说,这个游戏可能有下面两种情况:

  • 如果初始全班有超过90%的人投资了,那么在下一次投资的时候会有更多的人投资,趋向于“全班都投”的纳什均衡。
  • 如果初始全班只有不到50%的人投资了,那么下一次投资的时候会有更少的人投资,趋向于“全班都不投”的纳什均衡。此时较优的纳什均衡处于帕雷托优势。而这个时候如果有一个人站出来跟大家讲道理,说服大家往投资的方向上走,大家还是很有可能趋向于“全班都投”的。

所以纳什均衡和囚徒困境不同的一点在于:

  • 纳什均衡是可以通过说服来改变参与者的选择的,仅通过沟通而非合同就可以改善结果,是一种协调博弈(Coordination game)。(但若协调失败,就会趋向于较劣均衡。)
  • 而囚徒困境是不能通过说服改变参与者的选择的,因为没有一个人会傻到选择绝对劣势策略。

银行挤兑】案例:

**银行挤兑:**群众对银行失去信任,蜂拥而至去银行取钱。银行有两种均衡:较优均衡是大家都对银行有信心,纷纷把钱存到银行,银行就可以把钱以更高的利率贷出去;较劣均衡是大家对银行没有信心,开始疯狂提款,银行没有足够的现金来兑现,银行就要破产关门。

在上个世纪30年代经常发生在银行挤兑上,坏风气还导致市场泡沫。电影《美丽人生》中就发生过类似银行挤兑的事,但是那家银行没有倒闭,因为Jimmy Stewart站出来指挥大家,只取出生活必须的一小部分钱;最后银行挤兑时间过去之后,大家发现银行没有倒闭,于是又把钱存了进去。人群有一种跟风的想象,就是好的情况出现的时候大家的态度都会趋向于好的情况,坏的情况出现的时候大家的态度都会趋向于坏的情况。

可以将纳什均衡看成一种自我实施的协议,假设每个人都相信大家都会遵守协议,那么大家就都会遵守。

纳什均衡是和**领导力**紧密联系的。在协调博弈中,领导力的作用就是促成人们达到某个特定均衡而不是其他均衡,尤其是某些缺乏领导的混乱状态,在这类博弈中领导力的作用举足轻重。

约会游戏】案例:

alex(男)和rina(女)约定好去看电影,但是他们忘了去看哪一场电影,只记得是在最后一排碰面,下面是他们看每一部电影的收益:

耶鲁大学《博弈论》课程——纳什均衡_第4张图片

《白雪公主》对于两个人都是劣势策略,可剔除。对于剩下的两部电影,如果rina之前说过她肯定会去看《霍比特人》,那么alex也会选择霍比特人。这个博弈的学名叫做性别大战 The Battle of the Sexes。性别大战属于协调博弈,它主要是因为不同参与者的偏好不同造成的。

古诺双寡头模型 Cournot Duopoly】:

参与者1和2从事饮用水行业,假设他们的产量为qi,i=1,2。单位产量的成本为c,总产量为q时水的价格P=a-b*q。
参与者1的收入为: P*q1-c*q1 = (a-b*(q1+q2))*q1-c*q1 = (a-c)*q1-b*q1^2-b*q1*q2
将对q1求导为零的方程为: a-c-2*b*q1-b*q2 = 0
可得: BR1(q2) = q1 = (a-c)/(2*b)-q2/2
同理: BR2(q1) = q2 = (a-c)/(2*b)-q1/2
当q1=q2时,为纳什均衡点,可得q1* = q2* = (a-c)/(3*b)

所以,在纳什均衡点处,总产量为古诺产出 2*(a-c)/(3 * b),大于垄断时(q1或q2为0)总产量(a-c)/(2 * b),小于完全竞争时(令上面两个式子=0时求出的q1或q2)的产量(a-c)/b(价格大小完全相反);从生产者的角度来说,纳什均衡优于完全竞争,劣于垄断。

耶鲁大学《博弈论》课程——纳什均衡_第5张图片 耶鲁大学《博弈论》课程——纳什均衡_第6张图片

这个博弈不同于之前的合伙人博弈,合伙人博弈的两条曲线都是向一个方向倾斜的,“我投资的概率越大,你也就越想投资”,是**【策略互补博弈,而这个博弈的两条曲线是反向的,一个参与人的产量越多,另一个参与人的减产就要越少,这是一个策略替代博弈】**。

在古诺模型中,多少如我们所预料的,事情很自然的处于极端情况之间,即行业产量在某种程度上是介于在垄断和完全竞争两种情况之间的。它比在垄断下的价格低,比在完全竞争下的价格高;行业利润比垄断下的利润低,比完全竞争时的利润高。

但是在另外一种情况下能够得到一种完全不同的模型 – 伯川德竞争(Bertrand competition)

伯川德模型Bertrand competitio】案例:

前面的古诺双寡头模型是产量的竞争,这个伯川德模型是价格的竞争。

同样是卖饮料,但是这次的的策略是每单位商品的价格p,
我们设:
    有两个参与者1和2,他们分别卖可口可乐和百事可乐。
    参与者i的出价策略为pi,i=1,2。
    边际成本为c。
    对于参与者1,对于不同的出价p1,对应的销量q1为:(总销量为1-min(p1,p2))
        当p1p2,q1=0
        当p1=p2,q1=(1-p1)/2
参与者1的收益为:BR1(p2) = p1*q1-c*q1 = q1*(p1-c) = (1-p1)*(p1-c) = p1-c-p1^2+p1c
这种情况下p1=p2=c为纳什均衡。
如果参与者1选择某个大于c的价格p1=c+3*ε,参与者2就会选择一个更低的价格,如p2c+2*ε,此时对于参与者2来说,在有盈利的同时又会有更大的销量,然后参与者1会选择更低价格......从而迫使价格趋向于两者的边际价格c,达到纳什均衡。

选民投票】案例:

n个人的政治立场平均分布在一条直线上,其中越左边的人的政治立场越偏向于左翼,越右边的人的政治立场越偏向于右翼。他们可以选择竞选总统或者作为选民。如果他们作为选民,那么他们的选票将会投给离他自己政治立场最近的一个参选者,如果有位置一样的则平分选票。(与前面的中位选举案例不同的是,这里的候选人不能自己随意选择立场,因为大家都清楚他的实际立场)
举个例子,如果现在在x位置有一个人
  如果x位置的人参选并且获胜,他将得到收益b-c(这里假设b=2*c,c是竞选的成本)   如果x位置的人参选,而y位置的人获胜,他将得到收益-c-|x-y|   若果x位置的人没有竞选总统,而离他最近的y位置的人赢得了竞选,他将得到的收益为-|x-y|。
  
假设n为奇数,如果现在每个位置平均只有一个人,那么:
	 1.只有中间那一个人竞选时,是纳什均衡,因为当他竞选时不管是他左边有个人想站出来竞选还是他右边有个人想站出来竞选都不会成功;
	 2.中间那个人的左边和右边各站出来一个人时(对称位置),是纳什均衡,因为这个时候有任何一个人站出来都不能竞选成功(如左派有新的候选人加入,就会使右派获胜的几率更大);(注意,只要这两人没在左右两侧的1/6范围内,就是均衡状态,否则就会是下面这种情况)
	 3.当两个人太极端,如一个在最左侧,一个在最右侧的时候,就不是纳什均衡,因为这个时候在中间有任何一个人站出来竞选都会获得所有选民的一半选票。
如果现在每个位置平均分配两个人,那么:
	 中间位置的两个人同时站起来不是纳什均衡,因为当他们旁边如右侧有一个人站起来时,这个人将获得他右侧所有人的选票,而这两个在同一位置的人将平分左侧的选票。

选址模型】 案例:

假设有两个小镇,分称为东镇和西镇,每个小镇最多能容纳10万人,然后假设世界上一共有20万人,分为两类,分别是大个子和小个子。
策略是你选择东镇还是西镇。并假定如果某个小镇的人数超过10万,我们会采取随机策略选出多出来的人将他们移到另一个小镇。参与者的收益与其所在小镇中的同类人数呈下图关系:
(初始时的分布并不平均,比如东镇可能有40%或60%的大个子。)
耶鲁大学《博弈论》课程——纳什均衡_第7张图片
这里的纳什均衡一共有三个:
1. 大个子全都集中在东镇,小个子全都集中在西镇;或者大个子全都集中在西镇,小个子全都集中在东镇。(为什么说这时候时纳什均衡,因为此时对某个参与者来说,并不存在更有利情况,只有两种策略,如果你这时候选择另一种策略,那么你的收益只会是0,因为别人并不一定会去另一个城镇。)
	 因为当初始情况不平等时,那些在城镇中占少数人群的人为了获得最大利润或选择去另一个城镇,从而导致了【种族隔离】(人们会严格偏爱同类是大多数人的城镇)。  (注意,这个模型中隔离的结果,不能作为人们喜欢种族隔离的论据,最多只能说是个体的选择共同导致了这一种社会现象。)
2. 每个小镇的大个子和小个子的比例刚好是50%/50%。
	 这种情况下大家都达到最大利润。但这其实是一种弱纳什均衡,此时既没有促使参与者变动策略的动机,也没有促使参与者不变动的动机(因为对一个个体而言,他住在哪里都不影响整体50%的利益),而且此时微小的改动很可能导致趋势像上者转移,因为原本均衡的城镇,一旦有一小部分人搬家了,就会出现种族隔离的情况,大家会跟着去自己同类更多的城镇。
3. 所有的人都搬到东镇或者所有的人都搬到了西镇。
	 这种情况下将随机选择出50%的人移向另一个小镇。因为根据大数定理,随机产生的人群里面大个子和小个子的比例接近于50%/50%。(不要小看这个规则细节,有的时候从限制条件可以得到纳什均衡,如这里的【策略随机化】。如哈弗的学生公寓分配、校车接送等都是随机策略,避免种族隔离问题,最好由个体自己策略随机化,更加体现民主。)

你可能感兴趣的:(博弈论,职场和发展)