博弈论——战略式博弈

战略式博弈

图1 战略式博弈

1. 问题提出

囚徒困境(prisoner’ dilemma)——Tuncker 20世纪50年代(纯战略)

两个小偷作案后被警察抓住,分别 不同的屋子里审讯。在审讯之前,小偷从律师那里得知:如果两个人都坦白,将被各判刑4年;如果两个人都抵赖,将会因为证据不足而各判1年;如果其中一人坦白而另一人抵赖,坦白的将会得到宽大处理而被无罪释放,而抵赖的将重判,判刑6年。试问两个小偷将会如何选择?

纯战略:参与人在给定信息下只选择一种特定的战略(行动)。

猜硬币(混合战略)

两个参与人各握一枚硬币,双方同时选择是正面向上(记作O)还是背面向上(记作R),即他们的战略空间都是{O,R}。若两枚硬币是一致的(即全部背面向上或者全部正面向上),参与人2赢得参与人1的硬币;若两枚硬币不一致,则参与人1赢得参与人2的硬币。

混合战略:参与人在给定信息下以某种概率分布随机地选择不同的行动(战略空间上的概率分布)。解释了一个参与人对其他参与人所采取行动的不确定性

在一个给定的n人战略式博弈clip_image004中,对于任一参与人,设clip_image006,则参与人i的一个混合战略为定义在战略集clip_image008上的一个概率分布clip_image010,其中clip_image012表示参与人i选择战略clip_image014的概率,即clip_image016满足:clip_image018clip_image020

2. 问题描述——战略式博弈

战略式博弈(strategic form game):也称标准式博弈,是一种相互作用的决策模型,这种模型假设每个参与人仅选择一次行动或行动计划(战略),并且这些选择是同时进行的。

适用:不需要考虑博弈过程完全信息博弈问题(特别是完全信息静态博弈)

战略式博弈三要素

1) 参与人集合clip_image022

2) 每位参与人非空的战略集clip_image008[1],即clip_image025

3) 每位参与人定义在所有战略组合clip_image027上的偏好关系clip_image029或者效用函数clip_image031

有限博弈clip_image033(参与人人数有限)且clip_image035clip_image037(每个参与人的战略数有限),记为clip_image039clip_image041

“囚徒困境”博弈战略式描述:

囚徒困境博弈战略式描述

表1 “囚徒困境”战略式描述

“猜硬币”战略式描述:

猜硬币博弈战略式描述

表2 “猜硬币”战略式描述

3. 问题的解——Nash均衡(纯战略)、混合战略Nash均衡(混合战略)

1) 重复剔除劣战略行为(化简原博弈问题)

在n人博弈中,如果对于参与人i,存在战略clip_image047,对clip_image049,有clip_image051,则称战略clip_image053为参与人i的劣战略(严格劣战略),或者战略clip_image055相对于clip_image053[1]占优;有clip_image057,且clip_image059,使得clip_image061,则称战略clip_image053[2]为参与人i的弱劣战略

参与人i将会把clip_image053[3]clip_image008[2]中剔除掉,直接从战略集clip_image063中选择自己的战略。clip_image065------------------------->clip_image067,其中clip_image069

注:如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关

2) 纯战略——Nash均衡(Nash Equilibrium——John Nash 20世纪50年代

在一个给定的n人战略式博弈clip_image004[1]中,战略组合clip_image071是一个Nash均衡,当且仅当clip_image035[1]clip_image074时,有clip_image076或者clip_image035[2]clip_image078

3) 混合战略——混合战略Nash均衡

在一个给定的n人战略式博弈clip_image004[2]中,混合战略组合clip_image080为一个Nash均衡,当且仅当clip_image035[3]clip_image082,有clip_image084

支撑求解法

支撑(记为clip_image086)是指参与人按照clip_image088选择战略时,纯战略组合clip_image090中以大于0的概率出现的所有纯战略组合的集合,即clip_image092

有限n人战略式博弈的支撑求解法:

1) 构造出所有的混合战略均衡的支撑。

2) 对于每个给定的支撑,求解如下方程组。

clip_image094

clip_image096

3) 验证方程组的解。

a) 解都大于0。即clip_image098

b) 不存在一个不属于支集clip_image100的战略clip_image102,给定其他参与人的战略clip_image104,参与人i采用clip_image102[1]所得到的期望效用大于采用支集clip_image100[1]中战略的期望效用。即clip_image106clip_image108clip_image110

规划求解法

将求解博弈的混合战略Nash均衡转换为对一个规划问题进行求解。

有限n人战略式博弈的规划求解法:

clip_image112

Wilson奇数定理(oddness theorem):几乎所有的有限战略式博弈都有有限奇数个Nash均衡。

 

参考文献:

[1] 罗云峰. 博弈论教程. 北京: 清华大学出版社, 北京交通大学出版社, 2007.

你可能感兴趣的:(博弈论——战略式博弈)