认知训练营:博弈论概念入门

Three Ocean Kayaks On A Summer Beach.jpg

王烁老师说,每个人都要学点博弈论的知识。让我们首先从了解博弈论的一些基本概念开始。

零和博弈

零和博弈(英语:zero-sum game),又称零和游戏零和赛局,与非零和博弈相对,是博弈论的一个概念,属非合作博弈。在零和博弈中,博弈各方是不合作的。

在零和博弈中,人人都想损人利己。因为其中的所有博弈方(受益人)的利益之和为零或一个常数。我不禁想起了众人分蛋糕的场景。大家围着一块蛋糕,你分得多,我就分得少。这种关系是竞争关系,不可能产生合作。

同样,在比特币的世界,矿工们通过解数学谜题来完成竞争。先得到答案的矿工获得比特币奖励。而其余的矿工付出的算力都付诸东流,一杯羹也分不到。这是一个成王败寇的世界。


认知训练营:博弈论概念入门_第1张图片
分蛋糕.jpg

非零和博弈

非零和博弈与零和博弈相对。非零和博弈表示在不同策略组合下各博弈方的得益之和是不确定的变量,故又称之为变和博弈。如果某些战略的选取可以使各方利益之和变大,同时又能使各方的利益得到增加,那么,就可能出现参加方相互合作的局面。因此,非零和博弈中,博弈各方存在合作的可能性。

在非零和博弈中,损人也不会利己。同样是分蛋糕的场景,在非零和博弈中,如果博弈各方合作,这块蛋糕有可能变大。那么,每个人分得的蛋糕自然也变多了。

目前区块链技术还是新兴技术,出现了各种各样的区块链项目,越来越多的人投入其中。相信在不久的将来,区块链行业的蛋糕将越做越大,参与其中的各方也在上演一场非零和博弈。

猎鹿赛局

猎鹿赛局由卢梭所描述,是一种非零和博弈。在这一场景下,两名猎人一起去打猎,他们可以猎取鹿,也可以猎取野兔。鹿需要两个人合作才能获取,野兔一个人就可猎得,但猎鹿所得的收益大于猎野兔所得的收益。

在比特币挖矿中,矿工可以选择独自挖矿,也可以选择加入矿池合作挖矿。如果独自挖矿,没有解出谜题,没有任何收益。而合作挖矿,即使没解出谜题,也会按照工作量分得相应的收益。加入矿池的平均收益要大于独自挖矿的收益。

再举个例子,凤凰传奇的两位歌手,如果单飞,都没有很强的优势。而他们组合在一起,却为乐坛带来了一股清新的民族风,成绩斐然。

囚徒困境

囚徒困境(Prisoner's Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1.若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2.若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3.若二人都互相检举(互相“背叛”),则二人同样判监5年。

认知训练营:博弈论概念入门_第2张图片
囚徒困境.jpg

纳什均衡:甲乙都选择背叛的策略以及被判5年的结局被称作是“纳什均衡”(也叫非合作均衡),在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。也就是说,给定一方的选择,另一方改变自己的现有选择没有好处。

若甲选择背叛的前提下,乙选择沉默,乙要做10年牢。乙选择背叛,两人都做5年牢。而甲选择沉默的前提下,乙选择沉默,两人都做半年牢。乙选择背叛,乙获释。在乙不知道甲的选择的情况下,乙选择背叛能获得更大的利益。在乙做出了个人最佳选择后,团体最佳选择(甲乙都只做半年牢)只能被放弃了。

两国之间的关税战就是典型的囚徒困境的例子。两国达成关税协定,就是所谓的合作。而单方面提高关税,就是所谓的背叛。其中一方不遵守协定,提高关税,另一方也会提高关税,引发关税战,两国经济受损。接着,两国会重新达成关税协定。

胆小鬼博弈

胆小鬼博弈(英文:The game of chicken),又译懦夫博弈,是博弈论中一个影响深远的模型,逻辑就是“不要命的最大”。模型中,两名车手相对驱车而行,谁最先转弯的一方被耻笑为“胆小鬼”(chicken),让另一方胜出,因此这博弈模型在英文中称为The Game of Chicken(懦夫游戏),但如果两人拒绝转弯,任由两车相撞,最终谁都无法受益。

如果两国发起了核战争,对于人类和地球的损害将是毁灭性的。

我国历史上有名的胆小鬼博弈是诸葛亮的空城计。司马懿有15万雄兵,而诸葛亮只有2500名士兵。司马懿大军压境之际,诸葛亮却令士兵将城门打开。自己在城楼悠闲抚琴,另外二十几个士兵扮作平民扫城。司马懿认为诸葛亮非常谨慎,一定是有埋伏,最终撤军了。这场较量中,司马懿是胆小鬼。

纯策略和混合策略

策略集合是由玩家能够施行的纯策略所组成的集合。例如“剪刀、石头、布”中,玩家只有剪刀、石头和布这三个策略。纯策略就是只使用策略集合中其中一条策略。
混合策略允许玩家随机选择一个纯策略。因为机率是连续的,所以即使策略集合是有限的,也会有无限多个混合策略。

还以诸葛亮为例,他平时行事谨慎,一旦使出空城计时,就让敌人信以为真。这也是混合策略。

我们在教育孩子时,也不能总是和颜悦色,偶尔发发疯,也许是好事。

使用混合策略的前提是要克服我们人性中对一致性的追求。偶尔自相矛盾一下,也不见得是坏事。

博弈论的这些概念很有意思,了解了它们,我们就能对一些经济问题和政治问题看得更加透彻。如果把博弈想象成双方在拔河,这种博弈就是零和博弈。而当今,更多的是非零和博弈,人们相互合作,谋取最大的共同利益。

你可能感兴趣的:(认知训练营:博弈论概念入门)