博弈论沉思04占优战略均衡

19 博弈论的基本概念

村子里有两户富户，他们是邻居，墙倒了，有两种可能：一家修，另一家就不修；一家不修，另一家就得修。

冷战期间，美苏抢占地盘：一方抢占一块地盘，另一方就占另一块。

夫妻吵架，一方厉害，另一方就出去躲躲。

注意，此处在混合战略纳什均衡条件下，也可能是两败俱伤。

因此，博弈论的基本概念包括：

参与人：博弈论中选择行动以最大化自己效用的决策主体。

行动：参与人的决策变量。

战略：参与人的选择行动的规则。

信息：参与人的博弈中的知识，特别是有关其他参与人的特征和行动的知识。

支付函数：参与人从博弈中要获得的效用水平。

结果：博弈分析真正感兴趣的要素的集合。

均衡：所有参与人的最优战略的组合。

20占优战略均衡

历史故事，黔之驴——驴虎博弈

作者，唐柳宗元。

黔无驴，有好事者船载以入。至则无可用，放之山下。虎见之，庞然大物也，以为神，蔽林间窥之。稍出近之，慭慭然，莫相知。

他日，驴一鸣，虎大骇，远遁；以为且噬己也，甚恐。然往来视之，觉无异能者；益习其声，又近出前后，终不敢搏。稍近，益狎，荡倚冲冒。驴不胜怒，蹄之。虎因喜，计之曰：“技止此耳！”因跳踉大㘎，断其喉，尽其肉，乃去。

噫！形之庞也类有德，声之宏也类有能。向不出其技，虎虽猛，疑畏，卒不敢取。今若是焉，悲夫！

占优战略均衡：不论其他人选择什么战略，参与人的最优战略是唯一的，这样的最优战略称为“占优战略“（dominant strategy）。

注意：如果所有人都有（严格）占优战略的存在，那么，占优战略均衡就是可以预测的唯一均衡。

占优战略只要求每个参与人是理性的，而不要求每个人参与人知道其他参与人是理性的（也就是说，不要求理性是共同知识），为什么？

21重复剔除的占优均衡

思路是，首先找到某个参与人的劣战略（假定存在），把这个劣战略剔除掉，重新构造一个不包含剔除战略的新的博弈，然后再剔除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。

这个唯一剩下的战备组合就是这个博弈的均衡解，称为“重复剔除的占优均衡”。

如果这种唯一战略组合是存在的，我们就说该博弈是重复剔除占优可解。注意，如果重复剔除后的战略组合不唯一，该博弈就不是重复剔除占优可解的。

例如，卑斯麦之战。

卑斯麦之战发生在1943年的南太平洋上，日本海军上将木村受命将日本陆军运抵新几内亚，其间要穿越卑斯麦海。

而美国上将肯尼欲对日军运输船进行轰炸，穿越卑斯麦之战海通往新几内亚的有两条航线，木村必须从中选择一条，而肯尼则必须决定将其飞机派往何处去搜索日军，如果肯尼将他的飞机派到了错误的航线上，他虽可以召回它们，但可供轰炸的天数将减少。

结果是，俾斯麦海之战预示的情形已经显露无疑：盟国陆基航空兵完全封锁了新几内亚的日军和外界的一切联系和交通。美国陆航和澳大利亚皇家空军在新几内亚作战的胜利，成为往后各国陆基航空兵实施对海作战所借鉴的经典战例。

这是一个重复剔除的占优均衡，这是有两点决定的。

一个是，重复剔除的占优均衡结果与劣战略的剔除顺序是否有关，这取决于剔除的是否是严格劣战略。

另一个是，重复剔除的占优均衡，要求每个人参与人是理性的，而且要求“理性”是参与人的共同知识。也即是说，所有参与人知道所有参与是理性的，所有参与人知道所有参与人知道所有参与是理性。

22什么是纳什均衡

纳什均衡的定义：在博弈G=﹛S1，…，Sn：u1，…，un﹜中，如果由各个博弈方的各一个策略组成的某个策略组合（s1*，…，sn*）中，任一博弈方i的策略si*，都是对其余博弈方策略的组合（s1*，…s*i-1，s*i+1，…，sn*）的最佳对策，也即ui（s1*，…s*i-1，si*，s*i+1，…，sn*）≥ui（s1*，…s*i-1，sij*，s*i+1，…，sn*）对任意sij∈Si都成立，则称（s1*，…，sn*）为G的一个纳什均衡。

假设N个参与人在博弈之前达成一个协议，规定每一个参与人选择一个特定的战略，令s*=( s1*，…，sn*)，代表这个协议，在没有外在强制力的情况下，如果没有任何人有积极性破坏这个协议，则这个协议是自动实施的，这个协议就构成了纳什均衡。

一群赌徒围成一圈赌博，每个人将自己的钱放在身边的地上（每个人都知道自己有多少钱），来了一阵风吹，把所有的钱混在一起，使他们无法分辨哪些钱是自己的，他们为此而发生争执，后来请了律师。

纳什均衡为什么能解决这个问题呢？

律师说：每个人把自己的钱写在纸条上，然后交给律师；如果所有人要求的加总不大于钱的总数，每个人得到自己要求的部分（如果有剩余的话，剩余部分归律师）；如果所有人要求的加总大于钱的总数，所有的钱都归律师所有。

这是一个很经典的穷途困境模型，律师把所有赌徒全部置于了穷途，设想一下，如果每个赌徒都是理智的话，肯定都想要占便宜，但如果要求总数超过了总数，钱将都属于律师，那么这明显是最不智慧的选择，所以这里所有赌徒都只有唯一一个选择就是写出自己真实的数字，然后拿回自己的那份钱，这就是最后的纳什均衡。

这也说明，纳什均衡与占优战略均衡及重复剔除的占优均衡。

第一种情况是，每一个占优战略均衡及重复剔除的占优均衡一定是纳什均衡，但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡。

第二个是，纳什均衡一定是在重复剔除严格劣势战略过程中没有被剔除掉的战略组合，但没有被剔除掉的组合不一定是纳什均衡，除非它是唯一的（不适用于严格弱劣战略的情况）。

博弈论沉思04占优战略均衡

你可能感兴趣的:(博弈论沉思04占优战略均衡)