此部分博弈论笔记参考自经济博弈论(第四版)/谢识予和老师的PPT,是在平时学习中以及期末备考中整理的,主要注重对本章节知识点的梳理以及重点知识的理解,细节和逻辑部分还不是很完善,可能不太适合初学者阅读(看书应该会理解的更明白O(∩_∩)O哈哈~)。现更新到博客上供大家浏览,希望能够帮助到正在学习博弈论的大家。
在一个静态博弈中,至少有一个博弈方不完全清楚其他某些博弈方的策略或得益等信息,但知道其策略或得益等信息空间的概率分布,这种博弈叫不完全信息静态博弈,也叫贝叶斯博弈。
暗标拍卖
暗标拍卖通常有这样几个基本特征:(1)密封递交标书; (2)统一时间公证开标; (3) 标价最高者以所报标价中标。
古诺模型
假设:两寡头同时作产量 决策, 市场需求为 P ( Q ) = a − Q , Q = q 1 + q 2 P(Q)=a-Q, Q=q_1+q_2 P(Q)=a−Q,Q=q1+q2 为市场总产量, q 1 、 q 2 q_1 、 q_2 q1、q2 分别是两个厂商产量。厂商 1 成本函数 C 1 = C 1 ( q 1 ) = c 1 q 1 C_1=C_1\left(q_1\right)=c_1 q_1 C1=C1(q1)=c1q1, 即无固定成本, 边际成本为 c 1 c_1 c1, 这是两个厂商都知道的。厂商 2 的成本有两种可能情 况, 一种 C 2 = C 2 ( q 2 ) = c H q 2 C_2=C_2\left(q_2\right)=c_H q_2 C2=C2(q2)=cHq2, 另一种 C 2 = C 2 ( q 2 ) = c L q 2 C_2=C_2\left(q_2\right)=c_L q_2 C2=C2(q2)=cLq2, 而 c H > c L c_H>c_L cH>cL, 究 竟是哪种成本厂商 2 自己知道,厂商 1 只知道前一种的概率 θ \theta θ, 后一种的概率 1 − θ 1-\theta 1−θ 。
分析:
求解:三个式子各自求极值,然后联立求解,得:
q 2 ∗ ( c H ) = a − 2 c H + c 1 3 + 1 − θ 6 ( c H − c L ) q 2 ∗ ( c L ) = a − 2 c L + c 1 3 − θ 6 ( c H − c L ) q 1 ∗ = a − 2 c 1 + θ c H + ( 1 − θ ) c L 3 \begin{aligned} & q_2^*\left(c_H\right)=\frac{a-2 c_H+c_1}{3}+\frac{1-\theta}{6}\left(c_H-c_L\right) \\ & q_2^*\left(c_L\right)=\frac{a-2 c_L+c_1}{3}-\frac{\theta}{6}\left(c_H-c_L\right) \\ & q_1^*=\frac{a-2 c_1+\theta c_H+(1-\theta) c_L}{3} \end{aligned} q2∗(cH)=3a−2cH+c1+61−θ(cH−cL)q2∗(cL)=3a−2cL+c1−6θ(cH−cL)q1∗=3a−2c1+θcH+(1−θ)cL
讨论:当 c 2 = c H c_2=c_H c2=cH时, q 2 ∗ ( c H ) > q 2 ∗ q_2^*(c_H)>q_2^* q2∗(cH)>q2∗,当 c 2 = c L c_2=c_L c2=cL时, q 2 ∗ ( c L ) < q 2 ∗ q_2^*(c_L)
当厂商2实际高成本时,他本应生产较少,但他考虑到对方不知道自己高成本, 所以对方选择的产量会小于知道自已高成本时的最佳产量, 因此自己可以适当多生产一些。
在完全信息静态博弈时,我们将其表示为: G = { S 1 , ⋯ , S n ; u 1 , ⋯ , u n } G=\left\{S_1, \cdots, S_n ; u_1, \cdots, u_n\right\} G={S1,⋯,Sn;u1,⋯,un},
其中 S i S_i Si 是博弈方 i i i 的策略空间, 即全部可选策略的集合, u i u_i ui 是其得益函数 u i = u i ( s 1 , ⋯ , s n ) u_i=u_i\left(s_1, \cdots, s_n\right) ui=ui(s1,⋯,sn) 。
到了不完全信息静态博弈中,需要表示信息的不完全性,用 T T T来表示: t i t_i ti 表示博弈方 i i i 的类型, T T T ,表示博弈方 i i i 的类型空间 t i ∈ T i , u i ( a 1 , ⋯ , a n , t i ) t_i \in T_i, u_i\left(a_1, \cdots, a_n, t_i\right) ti∈Ti,ui(a1,⋯,an,ti) 表示博弈方 i i i 在策略组合 ( a 1 , ⋯ , a n ) \left(a_1, \cdots, a_n\right) (a1,⋯,an) 下的得益。信息不完全可以通过 t i t_i ti 的取值只有博弈方 i i i 知道而其他博弈方不清楚这一情况来反映。
另一个需要添加的是博弈方对不完全信息概率的判断:如果用博弈方 i i i 在自己类型为 t i t_i ti 的前提下, 对其他博弈方类型的所有可能(或类型组合) = ( t 1 , ⋯ =\left(t_1, \cdots\right. =(t1,⋯ t i − 1 , t i + 1 , ⋯ , t n ) \left.t_{i-1}, t_{i+1}, \cdots, t_n\right) ti−1,ti+1,⋯,tn) 的条件概率 p i = p i { t − i ∣ t i } p_i=p_i\left\{t_{-i} \mid t_i\right\} pi=pi{t−i∣ti}, 作为反映不完全信息的概率判断, 则可用 G = { A 1 , ⋯ , A n ; T 1 , ⋯ , T n ; p 1 , ⋯ , p n ; u 1 , ⋯ , u n } G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n ; p_1, \cdots, p_n ; u_1, \cdots ,u_n\right\} G={A1,⋯,An;T1,⋯,Tn;p1,⋯,pn;u1,⋯,un}表示不完全信息静态博弈问题。
以不完全信息古诺博弈为例:
厂商 1 的行动空间- A 1 = { q 1 } 厂商 2 的行动空间- A 2 = { q 2 } 厂商 1 的类型空间- T 1 = { c 1 } 厂商 2 的类型空间- T 2 = { c H , c L } 厂商 1 的得益- - u 1 = π 1 ( q 1 , q 2 , t 1 ) 厂商 2 的得益– u 2 = π 2 ( q 1 , q 2 , t 2 ) 厂商 1 条件概率- p 1 { c H ∣ c 1 } = θ ; p 1 { c L ∣ c 1 } = 1 − θ 厂商 2 条件概率- p 2 { c 1 ∣ c H } = 1 ; p 2 { c 1 ∣ c L } = 1 \begin{aligned} & \text { 厂商 } 1 \text { 的行动空间- } A_1=\left\{q_1\right\} \\ & \text { 厂商 } 2 \text { 的行动空间- } A_2=\left\{q_2\right\} \\ & \text { 厂商 } 1 \text { 的类型空间- } T_1=\left\{c_1\right\} \\ & \text { 厂商 } 2 \text { 的类型空间- } T_2=\left\{c_H, c_L\right\} \\ & \text { 厂商 } 1 \text { 的得益- - } u_1=\pi_1\left(q_1, q_2, t_1\right) \\ & \text { 厂商 } 2 \text { 的得益-- } u_2=\pi_2\left(q_1, q_2, t_2\right)\\ & \text { 厂商 } 1 \text { 条件概率- } p_1\{c_H|c_1\}=\theta;p_1\{c_L|c_1\}=1-\theta\\ &\text { 厂商 } 2 \text { 条件概率- } p_2\{c_1|c_H\}=1; p_2\{c_1|c_L\}=1 \end{aligned} 厂商 1 的行动空间- A1={q1} 厂商 2 的行动空间- A2={q2} 厂商 1 的类型空间- T1={c1} 厂商 2 的类型空间- T2={cH,cL} 厂商 1 的得益- - u1=π1(q1,q2,t1) 厂商 2 的得益– u2=π2(q1,q2,t2) 厂商 1 条件概率- p1{cH∣c1}=θ;p1{cL∣c1}=1−θ 厂商 2 条件概率- p2{c1∣cH}=1;p2{c1∣cL}=1
海萨尼( Harsanyi )1967年提出将“不完全信息静态博弈” 转化为“完全但不完美信息动态博弈”:
在作了海萨尼转换之后, 仍然有对 “类型” 的判断问题。但这时对类型的判断形式上变成了对博弈进程,即 “自然”对实际博弈方类型选择的判断, 其概率分布与类型的概率分布相同, 即 “自然”以概率分布 p 1 , ⋯ p_1, \cdots p1,⋯, p n p_n pn 分别选择 t 1 , ⋯ , t n t_1, \cdots, t_n t1,⋯,tn 。
将纳什均衡推广到不完全信息静态博弈中,基本思想与完全信息静态博弈的纳什均衡是一样的, 各博弈方的策略必须是对其他博弈方策略(或策略组合)的最佳反应。不同的是, 这里的策略比完全信息静态博弈复杂一些,不是简单的行为选择,而是由类型决定行为选择的函数。这种策略有新含义的纳什均衡, 称为 “贝叶斯纳什均衡”。
定义在不完全信息静态博弈 G = { A 1 , ⋯ , A n ; T 1 , ⋯ , T n G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n\right. G={A1,⋯,An;T1,⋯,Tn; p 1 , ⋯ , p n ; u 1 , ⋯ , u n } \left.p_1, \cdots, p_n ; u_1, \cdots, u_n\right\} p1,⋯,pn;u1,⋯,un} 中, 如果对任意博弈方 i i i 和他的每一种可能的类型 t i ∈ T i t_i \in T_i ti∈Ti, 策略函数 S i ∗ ( t i ) S_i^*\left(t_i\right) Si∗(ti) 所对应的行动 a i a_i ai 都能最大化其期望得
益:
max a i ∈ A i ∑ t = i { u i [ S i ∗ ( t 1 ) , ⋯ , S i − 1 ∗ , a i , S i + 1 ∗ ( t i + 1 ) , ⋯ , S n ∗ ( t n ) , t i ] p ( t − i ∣ t i ) } \max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\} ai∈Aimaxt=i∑{ui[Si∗(t1),⋯,Si−1∗,ai,Si+1∗(ti+1),⋯,Sn∗(tn),ti]p(t−i∣ti)}
则称策略组合 S ∗ = ( S 1 ∗ , ⋯ , S n ∗ ) S^*=\left(S_1^*, \cdots, S_n^*\right) S∗=(S1∗,⋯,Sn∗) 为 G G G 的一个 (纯策略) 贝叶斯纳什均衡。
另:即使某博弈方清楚自己的实际类型 t i t_i ti,但仍需对每种可能类型 t i ∈ T i t_i\in T_i ti∈Ti都设定行动:因为别的博弈方的行为要根据本博弈方的不同类型来计算
例:
假设:
(1) 两投标者:博弈方1、博弈方 2
(2) 两博弈方对拍品估价: v 1 , v 2 v_1, v_2 v1,v2
(3) 若标价 b i b_i bi 中标, 其得益: v i − b i v_i-b_i vi−bi
(4) 各博弈方不知对方估价, 但知对方估价是 [ 0 , 1 ] [0,1] [0,1] 上的均匀分布,即取 [ 0 , 1 ] [0,1] [0,1] 中任何数值的概率相等。
(5) 博弈方都风险中性:一单位期望得益和一单位确定性得益价值相同。
表示为不完全信息静态博弈
把上述问题表示为标准的不完全信息静态博弈, 需要找出两个博弈方的行为空间、类型空间、判断和得益函数。
行为空间:博弈方 i i i的行为就是自己的标价 b i b_i bi,其中 0 ≤ b i ≤ v i ≤ 1 0\leq b_i\leq v_i\leq 1 0≤bi≤vi≤1
类型空间:博弈方 i i i 的类型即自己的估价 v i v_i vi, 类型空间 T i T_i Ti 就是 估价可能取值区间 [ 0 , 1 ] [0,1] [0,1]
判断:博弈方知道对方的类型是 [ 0 , 1 ] [0,1] [0,1] 上的 标准分布, 这就是他们对对方类型的判断。
得益函数:
u i = u i ( b 1 , b 2 , v 1 , v 2 ) = { v i − b i , 当 b i > b j ( v i − b i ) / 2 , 当 b i = b j 0 , 当 b i < b j u_i=u_i\left(b_1, b_2, v_1, v_2\right)=\left\{\begin{array}{c} v_i-b_i, \text { 当 } b_i>b_j \\ \left(v_i-b_i\right) / 2, \text { 当 } b_i=b_j \\ 0, \text { 当 } b_i
式中 i = 1 i=1 i=1 时 j = 2 , i = 2 j=2, i=2 j=2,i=2 时 j = 1 j=1 j=1 。
寻找贝叶斯纳什均衡
先要构筑两博弈方的策略空间,即根据类型决定行为的函数关系:
本博弈中, 博弈方 i i i 的策略是符合要求的函数关系 b i ( v i ) b_i\left(v_i\right) bi(vi), 所有这种函数关系 b i ( v i ) b_i\left(v_i\right) bi(vi) 的集合构成博弈方 i i i 的策略空间。
分析贝叶斯均衡
策略组合 [ b 1 ( v 1 ) , b 2 ( v 2 ) ] \left[b_1\left(v_1\right), b_2\left(v_2\right)\right] [b1(v1),b2(v2)] 是一个贝叶斯纳什均 衡, 意味着博弈方 1 的策略 b 1 ( v 1 ) b_1\left(v_1\right) b1(v1) 与博弈方 2 的策略 b 2 ( v 2 ) b_2\left(v_2\right) b2(v2) 相互是对对方的最佳反应,对每个博弈方 i i i 的每个类型 v i ∈ [ 0 , 1 ] , b i ( v i ) v_i \in[0,1], b_i\left(v_i\right) vi∈[0,1],bi(vi) 都满足中标的期望得益最大化:
Max b i { [ v i − b i ( v i ) ] P ( b i > b j ) + 1 / 2 [ v i − b i ( v i ) ] P ( b i = b j ) } \operatorname{Max}_{b_i}\left\{\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i>b_j\right)+1 / 2\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i=b_j\right)\right\} Maxbi{[vi−bi(vi)]P(bi>bj)+1/2[vi−bi(vi)]P(bi=bj)}
实例:线性策略函数的贝叶斯纳什均衡
假设博弈方的报价:由基价和估价的一个固定比例组成,即:
b 1 ( v 1 ) = a 1 + c 1 v 1 , b 2 ( v 2 ) = a 2 + c 2 v 2 b_1\left(v_1\right)=a_1+c_1 v_1, \quad b_2\left(v_2\right)=a_2+c_2 v_2 b1(v1)=a1+c1v1,b2(v2)=a2+c2v2
其中 a 1 < 1 、 a 2 < 1 a_1<1 、 a_2<1 a1<1、a2<1; c 1 ≥ 0 、 c 2 ≥ 0 c_1 \geq 0 、 c_2 \geq 0 c1≥0、c2≥0
简化:由于 v j v_j vj 服从标准分布, b j = b j ( v j ) = a j + c j v j b_j=b_j\left(v_j\right)=a_j+c_jv_j bj=bj(vj)=aj+cjvj, 也服从标准分布, 因此 P { b i = b j } = 0 P\left\{b_i=b_j\right\}=0 P{bi=bj}=0(概率趋近于0) 。这样上式变为:
max b i ( v i − b i ) P { b i > a j + c j v j } = max b i ( v i − b i ) P { v j < b i − a j c j } = max b i ( v i − b i ) b i − a j c j \begin{aligned} & \max _{b_i}\left(v_i-b_i\right) P\left\{b_i>a_j+c_j v_j\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) P\left\{v_j<\frac{b_i-a_j}{c_j}\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) \frac{b_i-a_j}{c_j} \end{aligned} ==bimax(vi−bi)P{bi>aj+cjvj}bimax(vi−bi)P{vj<cjbi−aj}bimax(vi−bi)cjbi−aj
求一阶导可得: b i = ( a j + v i ) / 2 b_i=\left(a_j+v_i\right) / 2 bi=(aj+vi)/2
分析:
当 v i < a j v_i
b i ( v i ) = { v i + a j 2 当 v i ⩾ a j a j 当 v i < a j b_i\left(v_i\right)= \begin{cases}\frac{v_i+a_j}{2} & \text { 当 } v_i \geqslant a_j \\ a_j & \text { 当 } v_i
若要求双方策略是严格的线性函数,可以要求 a j ≤ 0 a_j \leq 0 aj≤0,这样 v i v_i vi的最佳反应变为:
b i ( v i ) = v i + a j 2 b_i\left(v_i\right)=\frac{v_i+a_j}{2} bi(vi)=2vi+aj
将此式与之前的策略空间 b i ( v i ) = a i + c i v i b_i\left(v_i\right)=a_i+c_i v_i bi(vi)=ai+civi相比较,最终可得$a_i=a_j / 2, c_i=1 / 2 $,另一个博弈方同理,联立得最终结果:
a i = a j = 0 , c i = c j = 1 / 2 a_i=a_j=0, c_i=c_j=1 / 2 ai=aj=0,ci=cj=1/2
计算出 b i = v i / 2 b_i=v_i/2 bi=vi/2,即博弈方最佳策略:把报价定为对拍品估价的一半。
上述贝叶斯纳什均衡是在上述暗标拍卖博弈中, 双方采用线性策略时唯一的贝叶斯纳什均衡。如果没有限定采用线性策略, 贝叶斯纳什均衡会发生改变。如果博弈方估价的概率分布不是上述标准分布, 暗标拍卖博弈的贝叶斯纳什均衡也会发生变化。此外,参与投标人数更多时情况也要更复杂一些,但分析思路是相同的。
此部分用于对所学内容的快速梳理记忆
不完全信息静态博弈和贝叶斯纳什均衡
暗标拍卖和古诺模型两个例子的简要介绍
一般表示方法 G = { A , T , p , u } G=\{A,T,p,u\} G={A,T,p,u}
海撒尼均衡的四个转化步骤
贝叶斯纳什均衡:一种更强的概念:
如果对任意博弈方 i i i 和他的每一种可能的类型 t i ∈ T i t_i \in T_i ti∈Ti, 策略函数 S i ∗ ( t i ) S_i^*\left(t_i\right) Si∗(ti) 所对应的行动 a i a_i ai 都能最大化其期望得益
max a i ∈ A i ∑ t = i { u i [ S i ∗ ( t 1 ) , ⋯ , S i − 1 ∗ , a i , S i + 1 ∗ ( t i + 1 ) , ⋯ , S n ∗ ( t n ) , t i ] p ( t − i ∣ t i ) } \max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\} ai∈Aimaxt=i∑{ui[Si∗(t1),⋯,Si−1∗,ai,Si+1∗(ti+1),⋯,Sn∗(tn),ti]p(t−i∣ti)}
联想古诺模型中的 max q 1 { θ [ a − q 1 − q 2 ∗ ( c H ) − c 1 ] q 1 + ( 1 − θ ) [ a − q 1 − q 2 ∗ ( c L ) − c 1 ] q 1 } \max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\} maxq1{θ[a−q1−q2∗(cH)−c1]q1+(1−θ)[a−q1−q2∗(cL)−c1]q1}
求和实际上是求期望
暗标拍卖