读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
理性和公共知识
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
纯策略中的优势(dominance)
- 数学表达: 除了玩家i以外所有玩家的策略集合
\[ S \equiv S_1 \times S_2 \times \cdots S_n \\ S_{-i} \equiv S_1 \times S_2 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots S_n \\ s = (s_1, s_2, \cdots, s_n) \\ s_{-i} = (s_1, s_2, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n) \\ s = (s_i, s_{-i}) \]
\(S\): 所有人的所有策略组合。
\(S_{-i}\): 除了玩家\(i\)以外,所有人的所有策略组合。
\(s\): 所有人的一种策略组合。
\(s_{-i}\): 除了玩家\(i\)以外,所有人的一种策略组合。
引进\(S_{-i}\)和\(s_{-i}\)是为了
- 通过看玩家i以外的所有玩家的策略,来考虑玩家i的策略。
- 或者专门看玩家i策略。
劣势(被支配)策略(Dominated Strategies)
- 定义 4.1:严格劣势于
对于玩家i,策略\(s'_i\)严格劣势于\(s_i\),则:
\[ v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), \forall s_{-i} \in S_{-i} \]
断言 4.1
一个理性玩家不会选择一个严格劣势策略。
优势策略(Dominant Strategies)
- 定义 4.2: 严格优势策略(strictly dominant strategy)
策略\(s_i \in S_i\)是一个严格优势策略,如果玩家i的任何其它策略都严格劣势于\(s_i\)。
\[ v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), \forall s'_i \in S_i, s'_i \neq s_i, and \ \forall s_{-i} \in S_{-i} \]
- 定义 4.3: 严格优势策略均衡(strictly dominant strategy equilibrium)
策略组合\(s^D \in S_i\)是一个严格优势策略均衡,如果其中每一个玩家i的策略都是严格优势策略。
\[ s_i \equiv s_i^D, \forall i \in N \]
推论 4.1
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一个严格优势策略均衡\(s^D\),则\(s^D\)是唯一的严格优势策略均衡。
断言 4.2
如果有的话,玩家一定会选择优势策略。
策略,策略集合,策略组合和策略均衡
策略(strategy)
\(s_i\)是玩家的一个策略。策略集合(strategy set)
\(S_i\)是玩家的所有策略集合。\(s_i \in S_i\)
\(S\)是所有玩家的所有策略的组合的集合。策略组合(strategy profile)
\(s\)是N个玩家的一种策略组合。\(s = (s_1, s_2, \cdots, s_n), s \in S\)策略均衡(strategy equilibrium)
\(s\)是任何一种导致合理结果的策略组合。
方法:严格劣势策略的迭代消除
博弈论方法就是一个寻找均衡的过程。
方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本逻辑:
一个理性玩家不会选择一个严格劣势策略。
如果有的话,玩家一定会选择优势策略。
过程:略
- 迭代消除均衡(Iterated elimination equilibrium)
严格劣势策略的迭代消除(IESDS)过程中幸存下来的博弈组合\(s^{ES}\)。
推论 4.2
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一个严格优势策略均衡,则\(S^*\)是唯一的严格劣势策略的迭代消除(IESDS)均衡。
信念(Beliefs),最佳响应(Best Response)和可合理化(Rationalizability)
在已经学习的两个方法严格优势策略和严格劣势策略的迭代消除(IESDS)之外的情况下,如果玩家i的一个策略\(s_i\)不是一个严格劣势策略,那就意味着在一定条件下(对手的某些策略下),策略\(s_i\)是一个合理的响应。
最佳响应(best response)
玩家i的策略\(s_i \in S_i\)是对手策略\(s_{-i} \in S_{-i}\)的最佳响应,则:
\[ v_i(s_i, s_{-i}) \geq v_i(s'_i, s_{-i}), \forall s'_i \in S_i \]信念(belief)
一个玩家i的信念就是一个他对手们的可能策略组合\(s_{-i} \in S_{-i}\)。最佳响应对应(best-response correspondence)
最佳响应对应\(BR_i(s_{-i})\),是玩家i,在他的对手们的策略组合\(s_{-i}\)上的所有可能最佳响应的集合。
\(BR_i(s_{-i})\)可以认为是一个函数,其结果是一个集合。不是一个最佳响应(never a best response)
玩家i,对于他的对手们的策略组合\(s_{-i}\)的最佳响应集合\(BR_i(s_{-i})\),如果\(s_{-i}\)不是在信任集合里,则\(s_i \in BR_i(s_{-i})\)都不是最佳响应。
总结
方法
- 严格优势策略
- 严格劣势策略的迭代消除(IESDS)
- 去掉不可信的策略组合(或者保留可信的策略组合)。
推论 4.1
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一个严格优势策略均衡\(s^D\),则\(s^D\)是唯一的严格优势策略均衡。
推论 4.2
如果博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一个严格优势策略博弈,则\(S^*\)是唯一的严格劣势策略的迭代消除(IESDS)均衡。
推论 4.3
对于玩家i,一个严格劣势策略\(s_i\),不可能是任何\(s_{-i} \in S_{-i}\)的最佳响应。
推论 4.4
在一个有限普通形式的博弈中,\(s^*\)是一个严格优势策略,或者是一个唯一的严格劣势策略的迭代消除(IESDS)均衡,
则s_i^*是一个对于任何\(s_{-i} \in S_{-i}\)的最佳响应。
断言 4.1
一个理性玩家不会选择一个严格劣势策略。
断言
如果有的话,玩家一定会选择优势策略。
断言 4.2
一个理性玩家,在认为他的对手选择策略\(s_{-i} \in S_{-i}\)时,总会选择\(s_{-i}\)的最想响应。
断言
一个理性玩家只会选择(他对手们的策略组合的)最佳响应。
参照
- Game Theory An Introduction (by Steven Tadelis)
- 读书笔记: 博弈论导论 - 01 - 单人决策问题
- 读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
- 读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识