Day 56: 无处不在的囚徒困境 《博弈论》

D1 打卡《博弈论》

先来讲讲博弈论中经典的个人最优选择并非团体最优选择的例子—囚徒困境。

囚徒困境

一天,警局接到报案,一位富翁被杀死在自己的别墅中,家中的财物也被洗劫一空。经过多方调查,警方最终将嫌疑人锁定在杰克和亚当身上。因为有目击者事发时看到他们两个从富翁家中仓皇逃离。

但是到了拘留所里面,两人都矢口否认自己杀过人,他们辩称自己只是路过那里,想进去偷点东西,结果进去的时候发现主人已经被人杀死了,于是他们便随便拿了点东西就走了。这样的解释不能让人信服,再说,谁都知道在判刑方面杀人要比盗窃严重得多。警察决定将两人隔离审讯。

隔离审讯的时候,警察告诉杰克:“尽管你们不承认,但是我知道人就是你们两个杀的,事情早晚会水落石出的。现在我给你一个坦白的机会,如果你坦白了,亚当拒不承认,那你就是主动自首,同时协助警方破案,你将被立即释放,亚当则要坐10年牢;如果你们都坦白了,每人坐8年牢;都不坦白的话,可能以入室盗窃罪判你们每人1年,如何选择你自己想一想吧。”同样的话,警察也说给了亚当。

一般人可能认为杰克和亚当都会选择不坦白,这样他们只能以入室盗窃的罪名被判刑,每人只需坐1年牢。这对于两人来说是最好的一种结局。可结果会是这样的吗?答案是否定的,两人都选择了招供,结果各被判了8年。

事情为什么会这样呢?杰克和亚当为什么会做出这样“不理智”的选择呢?其实这种结果正是两人的理智造成的。

当警察把坦白与否的后果告诉杰克的时候,杰克心中就会开始盘算坦白对自己有利,还是不坦白对自己有利。杰克会想,如果选择坦白,要么当即释放,要么同亚当一起坐8年牢;要是选择不坦白,虽然可能只坐1年牢,但也可能坐10年牢。虽然(1,1)对两人而言是最好的一种结局,但是由于是被分开审讯,信息不通,所以谁也没法保证对方是否会选择坦白。选择坦白的结局是8年或者0年,选择不坦白的结局是10年或者1年,在不知道对方选择的情况下,选择坦白对自己来说是一种优势策略。于是,杰克会选择坦白。同时,亚当也会这样想。最终的结局便是两个人都选择坦白,每人都要坐8年牢。

上面这个案例就是著名的“囚徒困境”模式,是博弈论中最出名的一个模式。可以看出,两人都选择了对自己最有利的选项,可是双双都得到了差的结果。

虽然这是个二者博弈的例子,但是“纳什平衡”提到了N方博弈均衡的概念。这让我联想到了些什么。

前段时间刘瑜《我的孩子正势不可挡地成长为一个普通人》引发争议,在集体教育军备竞赛中,每个家长的个人选择和大环境下其他人的选择也是一种N方博弈。家长的选择跟老师,学校,补习机构也是N方博弈。这种动态的N方博弈如同“纳什均衡”一样,必须在各自利益都稳定而不能更改的时候达到均衡稳定,不然就是无休止的N层博弈,没有赢家。

很多家长估计还来不及老鹰保护小鸡,就妥协给了学校或者是培训机构。现实就是目前的这种教育现状就是“负和博弈”。

虽然博弈论在经济学领域广泛运用,但细心留意的话,就会发现其实我们周围无处不在。了解一些博弈论的原理,帮助我们做好日常决策。

你可能感兴趣的:(Day 56: 无处不在的囚徒困境 《博弈论》)