极简博弈论之一:极小极大与纳什均衡

极简博弈论之一:极小极大与纳什均衡_第1张图片
冯·诺依曼(左)和约翰·纳什(右)

两位大师,两个原理。

如果你是两个孩子的母亲,要给两个馋嘴的孩子分一块蛋糕,不管怎么分,最后的结果总是,有一个孩子(甚至是两个孩子)觉得自己的那块更小。

这是博弈论中的一个经典问题:分蛋糕。该怎么分才能让两个孩子都满意?博弈论可以帮我们破了这个局。

冯·诺依曼和约翰·纳什

我们把分蛋糕问题暂且搁到一边,先来认识一下博弈论的两位大师——冯·诺依曼和约翰·纳什。

冯·诺依曼(后文简称冯)有两个领域的鼻祖,他被称为“计算机之父”,现代计算机的原型正是出自冯的设计,这个原型一直沿用到今天,他还被称为“博弈论之父”,因为他最早对零和博弈进行了深入研究,提出了“极小极大原理”。

约翰·纳什(后文简称纳什)比冯晚出生20多年,他年轻有为,在博士论文中便提出了著名的“纳什均衡”理论,可惜天妒英才,纳什的妄想症随着年龄的增长越发严重,然而他的妻子从未抛弃他,一直陪伴纳什到人生的最后一刻,方才有了震撼人心的电影《美丽心灵》。

分蛋糕问题

回到分蛋糕的问题,我们请冯和纳什两位大师出场,来解决分蛋糕问题。
首先,我们要把分蛋糕问题需要转化为两个孩子博弈问题,博弈的规则是:两个孩子分蛋糕,一个切蛋糕,另一个先选蛋糕。

博弈论的目标就是寻找问题的理性解——不考虑情感因素,单从理性角度分析所得的答案。

我们先把两个孩子的策略和对应的结果做成一个表格。记切蛋糕的孩子为A,选蛋糕的孩子为B,用“A得到的蛋糕大小,B得到的蛋糕大小”表示分蛋糕的结果。

| B选大块 | B选小块
:----:|:-----:|:----:
A切成两块一样大 | 一半,一半 | 一半,一半
A切成两块不一样大 | 小块,大块 | 大块,小块

极小极大原理

先请冯来切蛋糕,即冯是A,他自然要运用“极小极大原理”。

“极小”指的是B一定会挑选大块,所以留给自己的肯定是小块,也就是表格中的左边一列;
“极大”指的是A要使自己的蛋糕尽量大;
“极小极大”组合起来的意思是,A已知B会选大块,所以会把较小的一块切得大一些,对A来说,最好的结果就是表格的左上角“一半、一半”,即两人各分得半块蛋糕,这就是这个问题的理性解。

这就是极小极大原理,是不是很简单?

纳什均衡

纳什均衡也不难!

这次换做纳什来切蛋糕了(即纳什是A),他自然要运用“纳什均衡”来寻找理性解。A假设自己切成不一样大小的两块,B自然会选大块,也就是表格中左下角一格。

这时,A会分别问B和自己一个问题:你后悔吗?
B想:我得到了大块,我不后悔!
A想:如果我切成一样大的两块,能得到的更多,我后悔了!

于是A改变策略,切成一样大的两块,对应表格的左上角。还是重复刚才的问题,你后悔吗?
B想:既然两块蛋糕一样大,后悔也没用,我不后悔!
A想:既然B已经选了大块的,我能得到半块蛋糕已经是最好的结果了,我也不后悔!
当两人都不后悔时,纳什均衡就达成了!

寻找纳什均衡点一定要注意:“是否后悔”是对方不变更策略的前提下做出的选择。这很像球迷们看球时候的心情,每当看到空门不进,球迷们的心声总是:不会吧!这球换我也能射进啊!

单从分蛋糕的例子来看,两个理论得到的答案是一样的。二者的区别在于适用范围,极小极大原理只能用来分析零和博弈——双方利益总和不变的博弈问题,纳什均衡对零和博弈、非零和博弈都适用,这也是纳什均衡厉害的地方。不过,纳什均衡为的是找到“使双方都不后悔的理性解”,这个理性解未必会给博弈中的个体或集体带来利益最大化。

至此,我们认识了两位大师——冯·诺依曼和约翰·纳什,学习了两个原理——极小极大和纳什均衡。

接下来,我们就来学习一个熟悉又陌生的博弈问题——囚徒困境。

还有哦:极简博弈论之二:你我都是囚徒

你可能感兴趣的:(极简博弈论之一:极小极大与纳什均衡)