读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议

读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议

战略协议(Strategic Bargaining)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。

一个两人协议博弈的过程:

  • 第一回合
    • 玩家1提出分配\((x, 1-x)\),玩家1得到x,玩家2得到1-x。
    • 如果玩家2表示接受,博弈结束,\(v_1 = x, v_2 = 1-x\)。如果玩家2反对,进入下一轮
  • 第二回合
    • 剩余变成了\(1 - \delta\)。折扣率\(0 < \delta < 1\)
    • 玩家2提出分配\((x, 1-x)\),玩家1得到x,玩家2得到1-x。
    • 如果玩家1表示接受,博弈结束,\(v_1 = \delta x, v_2 = \delta (1-x)\)。如果玩家1反对,进入下一轮。
  • 第三回合及以后
    • 博弈如上继续,在奇数回合,玩家2的反对则导致其在下一轮变成提议者,反之亦然。
    • 每个回合的继续,到导致剩余的一次折扣,在第t个回合,剩余未\(\delta^{t-1}\)

协议博弈和之前博弈的不同之处:

  • 如果提议被接受,博弈会在任何回合结束。
  • 收益只有在整个博弈结束时才产生,而不是每个回合就会产生。

只有一轮的协议:最后的话博弈(The ultimatum game)

take it or leave it.
推论:11.1

在一个T=1的协议博弈中,剩余的任何分配都能被支持为一个纳什博弈:\(x^* \in [0, 1], (v_1, v_2) = (x^*, 1 - x^*)\).
推论:11.2
在一个T=1的协议博弈中,允许一个唯一的子博弈精炼均衡,在这个均衡中,玩家1提供\(x=1\),并且玩家2接受任何\(x \leq 1\)

有限回合的协议博弈

推论:11.3

任何子博弈精炼均衡必定导致玩家们可以在第一回合达成一致。
两人奇数回合的协议博弈的结果
\[ v_1^* = x_1 = \frac{1 + \delta^T}{1 + \delta} \ and \ v_2^* = (1 - x_1) = \frac{\delta - \delta^T}{1 + \delta} \\ \lim_{T \to \infty} v_1^* = \lim_{T \to \infty} \frac{1 + \delta^T}{1 + \delta} = \frac{1}{ 1 + \delta} \\ \lim_{T \to \infty} v_2^* = \lim_{T \to \infty} \frac{\delta - \delta^T}{1 + \delta} = \frac{\delta}{1 + \delta} \\ \lim_{\delta \to 1} \lim_{T \to \infty} v_1^* = \lim_{\delta \to 1} \frac{1}{1 + \delta} = \frac{1}{2} \\ \lim_{\delta \to 1} \lim_{T \to \infty} v_2^* = \lim_{\delta \to 1} \frac{\delta}{1 + \delta} = \frac{1}{2} \\ \]

说明了

  • 玩家1拥有last-mover take-it-or-leave-it 优势和 first-mover折扣优势,意味着: \(v_1^* > v_2^*\)
  • 如果玩家都是有耐性的(也就是说不接受达到自己最低要求的提议),则last-mover take-it-or-leave-it优势消失了。
  • 长期的回合消除了last-mover take-it-or-leave-it优势。
  • \(\delta = 1\)消除了first-mover优势。

无限回合的协议博弈

两人无限回合的协议博弈的结果
\[ \overline{v}_1 = \overline{v}_2 = \overline{v} \\ \underline{v}_1 = \underline{v}_2 = \underline{v} \\ \underline{v} = 1 - \delta \overline{v} \\ \overline{v} = 1 - \delta \underline{v} \\ \underline{v} = \overline{v} = \frac{1}{1 + \delta} \\ where \\ \overline{v} \text{ : the best subgame-perfect equilibrium} \\ \underline{v} \text{ : the worst subgame-perfect equilibrium} \\ \]

协议立法

封闭规则协议(Closed-Rule Bargaining)

博弈规则:

有N奇数个玩家,需要\(\frac{N+1}{2}\)个接受才能是提议通过。
在每个周期里,每个玩家都有相同的可能性称为提议者。
博弈结果:
\[ where \\ k \text{ : the proposer's best response} \\ v \text{ : the expected payoff for any player i} \]

提议者的最佳收益:需要得到n-1的人的同意,由于折扣优势,这个n-1个人的收益为\(\delta v\)
\[ k = 1 - \frac{N - 1}{2} \delta v \\ \]
回应者的收益:有\(\frac{1}{N}\)可能性成为提议者,拿到k;
\(\frac{N - 1}{N}\)的可能性成为回应者,并且只有\(\frac{1}{2}\)的可能性(因为提议者只提供收益给回应者中的一半人)拿到\(\delta v\)
\[ v = \frac{k}{N} + \frac{N - 1}{2N} \delta v \\ \]

计算结果:
\[ v = \frac{1}{N} \\ k(N) = 1 - \delta ( \frac{N - 1}{2N}) \\ \]

说明了

  • 当回扣率增加,提议者的收益变少。
  • 玩家越多,提议者收益越大,回应者收益越少。

开放规则协议(Opened-Rule Bargaining)

博弈规则:

有N奇数个玩家。
提议者提出一个协议,
有一个修订者提出一个修改协议。
如果提议者的协议通过了\(\frac{N+1}{2}\)。则被接受。
否则,修改协议变成主协议。
一个新的修订者提出一个修改协议。
再次投票,重复上面的过程。

保证方案(guaranteed success)

无论那个响应者成为修订者,都可通过的方案。
案例:3个玩家。
\[ where \\ k \text{ : the proposer's best response} \\ v(k) \text{ : the expected payoff for any player i} \]

回应者的收益:一方面为\(\frac{1 - k}{2}\),一方面为\(\delta v(k)\)
\[ \frac{1 - k}{2} = \delta v(k) \\ \]
修订者的收益:由于对称性,修订者的给自己的收益\(v(k)\)应该是k。
\[ v(k) = k \\ \]

计算结果:
\[ k = \frac{1}{1 + 2 \delta} \\ \]

说明了

  • 玩家越有耐心,提议者的付出越多。
  • 封闭规则对提议者有利。
冒险方案(risky success)

冒一个部分响应者不会成为修订者的风险。
\[ where \\ k \text{ : the proposer's value to himself} \\ v(k) \text{ : the expected payoff for proposer} \\ v(0) \text{ : the expected payoff for the player who will be offered 0} \]

回应者的收益:一方面为\(1 - k\),一方面为\(\delta v(k)\)
\[ 1 - k = \delta v(k) \]
提议者的期望收益:有\(\frac{1}{2}\)可能性拿到k;如果冒险失败,有\(\frac{1}{2}\)可能性拿到v(0)。
\[ v(k) = \frac{1}{2} k + \frac{1}{2} \delta v(0) \\ \]
得到0的玩家的期望收益:有一半的可能性得到v(k)。
\[ v(0) = \frac{1}{2} \delta v(k) \\ \]

计算结果:
\[ k = \frac{4 - \delta^2}{4 + 2 \delta - \delta^2} \\ v(k) = \frac{2}{4 + 2 \delta - \delta^2} \\ \]

说明了

  • \(\delta > \sqrt{3} - 1\)时,冒险方案更好。

参照

  • Game Theory An Introduction (by Steven Tadelis)
  • 读书笔记: 博弈论导论 - 01 - 单人决策问题
  • 读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
  • 读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识
  • 读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
  • 读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡
  • 读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
  • 读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识
  • 读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
  • 读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈
  • 读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈
  • Nash bargaining solution

转载于:https://www.cnblogs.com/steven-yang/p/8290494.html

你可能感兴趣的:(读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议)