2.2子博弈精炼
现在我们讨论一个更加复杂的博弈:和之前的完全且完美博弈相同,完美继续假设博弈的进行分为一系列阶段,下一阶段开始前,所有参与者均可观察到前面所有参与者的行动。与上一节不同的是,在这一节中,每一个阶段存在着同时行动。
考虑如下博弈,我们把这类博弈很没有创意的称为完全非完美信息两阶段博弈:
- 参与者1,2同时从自己的可行集A1和A2中挑选行动a1和a2
- 参与者3,4在观察到第一阶段结果后,然后同时从各自的可行集A3,A4中选择行动a3和a4
- 收益为ui(a1,a2,a3,a4) i,j=1,2
许多形况都适用于上面的例子,之后我们会给出两个例子,下面先给出此类问题的解决方法。
我们依然运用逆向的想法,不过区别在于每一步逆向的过程不再是单人的决策优化,而变成了求解一个真正的博弈问题(在给出参与者1,2的结果中求解参与者3,4的第二阶段同时的博弈)。对于第一阶段博弈可能结果,其后会对参与者3,4的博弈生成一个唯一的纳什均衡,表示为,(a3*(a1,a2),a4*(a1,a2))。
如果参与者1,2预测到了参与者3,4的博弈结果,那么对于参与者1,2他们的博弈将会有以下形式:
1. 参与者1,2同时从自己的可行集A1和A2中挑选行动a1,a2
2. 参与者1,2的收益函数为ui(a1,a2,a3*(a1,a2),a4*(a1,a2)) i,j=1,2
假定为唯一的博弈平衡,那么我们称为这一两阶段博弈的子博弈精炼解。
下面给出一个例子:银行挤提问题
规则如下:
两位投资者每人存入银行一笔存款D,银行已将这些存款存入一个长期项目。如果该项目到期前,银行被迫对投资者变现,则共可收回2r,这里D>2r>D/2,不过如果银行允许投资项目到期,则项目共可收回2R,这里R>D。
有两个日期,投资者可以从银行提款:日期1在银行的投资项目到期之前,日期2在项目到期之后。
如果两个投资者都在日期1提款,则每个人都可以获得r,博弈结束。
如果两个投资者只有一个在日期1提款,则他可获得D,另一个人只能获得2r-D博弈结束。
如果两个博弈者都不在日期1提款,则决策到第二阶段,也就是日期2进行。
如果两个人都在日期2提款,则每个人都获得R,博弈结束。
如果两个人都没有在日期2提款,则每个人获得R,博弈结束。
如果只有一人在日期2提款,则他获得2R-D,另一个人获得D,博弈结束。
我们会在后面,讨论这类博弈的正确表示方法,这里我们暂且用两个标准式来表示(虽然这样不够精确):
1\2 提款 不提
提款 (r,r ) (D,2r-D)
不提 (2r-D,D) (下一阶段)
1\2 提款 不提
提款 (R,R ) (2R-D,D)
不提 (D,2R-D) (R , R )
首先我们从后往前来分析此博弈,首先考虑日期2的标准模式博弈。由于 很明显有“提款”严格优于“不提款”,那么这个博弈会有一个唯一的纳什均衡。
之后我们简单的可以把日期2的纳什均衡带入日期1(因为当两个人都是理性人的时候,一旦选择进入了第二阶段必然会得到唯一的平衡,也就是唯一的收益)。
则我们可以把博弈简化为:
1\2 提款 不提
提款 (r,r ) (D,2r-D)
不提 (2r-D,D) (R,R)
由于 我们可以很容易求出这个博弈中,得到两个纯战略平衡:
(1) 两个投资人都在日期1提款,收益情况为(r,r)
(2) 两个投资人都在日期2提款,收益情况为(R,R)
前一种情况可以解释为两者对对方不信任,所以同时选择日期1提款,后一种情况为两者互相信任,在日期2提款,这种情况下,两者的福利有所提高。
这其实是一种不同于第一章的囚徒困境:这两个囚徒困境中,都存在对于整体低效率的纳什均衡。不过对于第一章中的囚徒困境中,这个纳什均衡是唯一的,而对于这个例子中,有一个纳什均衡是对于社会低效率的,而另一个纳什均衡则是高效的。
所以这个模型无法预测出银行何时会出现挤提问题,但是可以证明挤提会作为均衡出现。
我们再举一个完全非完美信息两阶段博弈例子
关税和国际市场的不完全竞争
两个完全相同的国家, 1 和 2, 同时选择它们的关税税率,分别记为t1, t2,.
来自country 1的 Firm 1和来自country 2的 firm 2生产同质的产品供给本国消费和出口.
观察到两国的税率后, firm 1 and 2同时选择用于本国消费和出口的产品数量,分别用(h1, e1)和(h2, e2)表示.
两个国家的市场价格Pi(Qi)=a–Qi,for i=1, 2.
Q1=h1+e2, Q2=h2+e1.
两个企业的边际成本为常数c.
每个企业在向其他国家出口时都要支付关税.
Country 1 和 2分别是 player 1 和 2
Firm 1 和 2 分别是player 3 和 4