混合策略纳什均衡

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

名词说明

纯策略:1和0 绝对的侧率选择。比如选择去公园和不去公园就是纯策略

混合策略:参与者使他的的纯策略的选择随机化,那么就是混合策略。比如选择去公园的概率是0.6,这就是一个混合策略

举例说明:

混合策略纳什均衡_第1张图片

设警察去街道的概率是p,那么去公园的概率就是1-p

毒贩去街道的概率是d,那么去公园的概率就是1-d

混合侧率的目标:使得每一纯策略具有相同的期望值

在该情况下:

clip_image004

同理,也可以求出毒贩的d=6/13

clip_image006

纯冲突和防范行为博弈

极大极小策略即用来使参与者达到最优状态的策略,即会设想到其他参与者通过选择策略来使参与者支付最小。

举例说明:

混合策略纳什均衡_第2张图片

用VH(PH,SM)表示福尔摩斯的期望支付,如果他选择混合策略PH(去多尔佛的概率),SM表示莫瑞特的纯策略。

福尔模式的极大极小策略可以解决以下问题:在已知PH的情况下,当SM被选择来使VH(PH,SM)最小化时,用PH来使VH(PH,SM)最大化。

当莫瑞特去多尔佛时,福尔摩斯的期望支付是VH(PH,)=PH*20+(1-PH)*70=70-50PH

同理可以多瑞特去坎特伯雷时,福尔摩斯的期望支付是VH(PH,)=10+80PH

混合策略纳什均衡_第3张图片

莫瑞特会根据PH使得福尔摩斯的支付最小,福尔摩斯的极大点是PH=6/13。如果一个参与者知道你会做出的选择,那么你做出随机化的选择将更好。对方很难进行一个揣测。

总结

可以看出混合策略是算别的参与者的支付相等,最终使得每一个参与者无论选择哪一种纯策略都有相同的支付。而最大最小策略是使自己无论选择哪一种策略,都可以获得相同的支付,那么其他参与者就无法通过纯侧率来降低自己的支付。

你可能感兴趣的:(博弈论)