博弈论:帕累托最优与纳什均衡的联系和区别

博弈论:帕累托最优与纳什均衡的联系和区别_第1张图片
囚 徒 困 境 中 , ( C , C ) 为 纳 什 均 衡 , 其 他 为 帕 累 托 最 优 囚徒困境中,(C,C)为纳什均衡,其他为帕累托最优 (C,C)

帕累脱最优(特点:不能损害对手的利益)

帕累托改进

如果对某一种方案而言,存在着一种调整策略,使得原方案经过调整后,能让至少一个人受益的同时不让任何人受到损失,那么这种调整策略就称为帕累托改进。

帕累托最优

找不到任何的帕累托改进的余地,我们就说这个方案达到了帕累托最优。这意味着,帕累托最优的局面是所有人都满意的整体有利的方案。在这种情形下,如果某些人还想增加自己的利益,就只能损害别人的利益。所以很明显的是,帕累托最优是一种整体上的评价。

纳什均衡纳(特点:非合作,动态平衡)

纳什均衡纳什均衡是非合作博弈论中的一个基础概念。
而非合作博弈是指排除玩家结盟的情形,每个玩家都是独立的。 一般而言,每个玩家的决策都会影响到别人,所以当你改变策略时,别的玩家就会相应变换自己的对策,整个游戏局面就会不断地发生变化。
而纳什均衡却指出了游戏过程中可能出现的一种特殊状态。在这个局面下,如果其他玩家的策略不变,每一个玩家都没有动机改变自己现在的策略。这个时候所有的玩家就进入了一种平衡态,称为纳什均衡。也就是说,在纳什均衡下,每个人都满意自己当前的策略。

博弈论:帕累托最优与纳什均衡的联系和区别_第2张图片
甲:“
假如乙不招供,我只要招供,立即可以获得自由,而不招供却要坐牢1年,显然招供比不招供好;
假如乙招供了,我若不招供,要坐牢10年,我招供了只坐5年牢,显然还是招供的好。可见,无论乙招供与否,我的最佳选择都是招供。”
乙同理。

纳什均衡存在定理

在 混 合 策 略 的 情 况 下 , 有 限 个 玩 家 与 有 限 个 动 作 的 情 况 下 , 至 少 存 在 一 个 纳 什 均 衡 点 。 比 如 在 零 和 博 弈 的 “ 石 头 剪 子 布 ” 游 戏 中 [ 1 3 , 1 3 , 1 3 ] 策 略 为 纳 什 均 衡 策 略 在混合策略的情况下,有限个玩家与有限个动作的情况下,至少存在一个纳什均衡点。\\ 比如在零和博弈的“石头剪子布”游戏中[\frac{1}{3},\frac{1}{3},\frac{1}{3}]策略为纳什均衡策略 [31,31,31]

帕累托最优与纳什均衡的数学描述

博弈论:帕累托最优与纳什均衡的联系和区别_第3张图片
博弈论:帕累托最优与纳什均衡的联系和区别_第4张图片

Minimax定理

极小化极大决策函数

你可能感兴趣的:(其他,博弈论)