用博弈论的视角看“基层减负年”

生活中充斥着很多不合理的现象,明明亟待解决,大家却束手无策。比如国与国之间的军备竞赛,各国都停止武器研发而改为发展民生,那么不论哪个国家人民的生活质量都会提升一大截;又比如商家斥巨资打广告、请明星代言,何不将经费用于降低商品售价,那我们

岂不是可以买更多物美价廉的产品;再比如到处都是的各类补习班、喜欢扎堆的商店以及让我们无比痛恨的工作留痕、形式主义等等。

我们看问题的角度受自己知识所限,有些知识一旦掌握便会有种豁然开朗的感觉,就像曲径通幽之后的别有洞天。

毫无疑问,博弈论就是这样一门学科。

博弈论的发明人是著名的现代计算机之父冯诺依曼,不过在他手上博弈论还只是单纯的数学游戏。直到1951年,一位大经济学家约翰纳什出手,才将博弈论从抽象的数学王国带到了现实世界。

什么是博弈论?博弈论并不是十八般武艺,让你学了就能用,帮你在与他人斗智斗勇时取胜;也不是九阴真经九阳神功这样的内功心法,让你学了就境界大增,从此看其他人都成了渣渣。

博弈论是一门启发智慧的学问,它是一个后门,让你能够看清楚人类社会协调与合作的本质。它就像LIGO探测到引力波后,人类探索宇宙又多了一“感”。从此,字宙呈现在我们眼前的又是另一番模样。

博弈论研究什么?

假如领导说明天要来检查,那我就会做好迎检的准备;但如果领导想深一层,下面既然已经知道了自己会去检査,那肯定是做好了准备,这样再去检查就变得没有意义,所以就决定明天不去检査;可如果我足够聪明,猜到领导会猜到我做好准备,进而猜到领导不会来,那我第二天就不会做准备;再如果领导猜到我猜到他猜到我不做准备,那他第二天又应该来检查……只要我们双方足够聪明,那我们就会这样一直猜下去。这种情况在《三体》里叫做猜疑链,在博弃论里面叫做混合战略纳什均衡。

这个例子对理解博弈论来说并不是特别好,但由于更贴近我们实际,为了引起大家的兴趣所以才提出的。

那么什么例子更好?

这就要数囚徒困境了。但凡讲博弈论,没有不提囚徒困境的。假设有两位犯人因犯罪被抓,他们非亲非故,关系也没有好到爱对方胜过爱自己。他们被关到警局之后,分开审讯。这时有两个选择摆在他们面前:招供还是不招供?如果两个人都招供,那么由于犯罪嫌疑人对犯罪行为供认不讳,便各判6年;如果两个人都不招供,由于证据不足,便只能各判1年;如果一方招供,另一方不招供,招供的因为将功补过被无罪释放,而选择不招供的则因态度恶劣被判10年。

那么问题来了,如果你是其中一位罪犯,你会选择招供还是不招供?

我们很容易想到的答案是,两个人都不招供,那样都只会被判1年,皆大欢喜。但在我们想当然的这样认为之前,不妨理性的分析一下这个问题,也就是说用博弈论的方法来试着回答。

博弈论,主要是根据对方的反应来做决策,但在这个例子当中,我们并不需要考虑别人的选择,因为只要自己理性,我们都应该选择招供。

为什么?如果对方招供,你不招供,则被判10年,招供则判6年,所以你应该招供;如果对方不招供,你也不招供,则被判1年,招供则无罪释放,所以你还是应该招供。结果就是,无论对方招不招供,你都应该招供。

可是如果对方足够理性,那么他的策略将和你一样,也选择招供。最终导致两人都招供,都被判6年。这种独立于他人选择的最优战略称为该 player的占优战略。

下面,就从囚徒困境这个例子入手,介绍一下博弈论中的七个基本概念,任何一项博弈都由这七个或者少于这七个所决定。

首先第一个概念是 player,也可以叫做玩家、参与人,但有的作者认为玩家或者参与人在中文语境中含义太广,所以直接用 player来特指博弈论中的参与决策的多方主体。囚徒困境中的两名嫌犯就是player。Player可以是一个人,也可以是一个企业、一个组织甚至是一个国家,只要他能够做出最终决策,那我们就可以将其视为player。

第二个概念是行动,就是你可以做哪些选择。上述例子中的行动就是招供或者不招供。而所有players做出行动的集合就叫做行动组合,囚徒困境中共有四种行动组合:甲招乙招、甲不招乙不招、甲招乙不招、甲不招乙招。

第三个概念是信息。信息是每个player知道些什么。举个三国演义中著名的例子一一空城计。诸葛亮为人谨慎,这是个信息(零阶知识);司马懿知道诸葛亮为人谨慎,这是个信息(一阶知识);诸葛亮知道司马懿知道诸葛亮为人谨慎,这是个信息(二阶知识)。到这就足够空城计成功了,因为诸葛亮比司马懿多知道一层信息,司马懿之所以被骗是因为,他不知道诸葛亮知道司马懿知道诸葛亮为人谨慎(三阶知识)。所以说信息在博弈中非常关键,但是在囚徒困境中信息就显得没那么重要,除了什么情况下判几年,就只要知道自己是理性的就足够了。因为他们的选择都是占优战略。

第四个概念是战略。教科书上是这样定义的:战略可以理解为player的相机行动计划。通俗的话就是什么情况下该怎么做。在囚徒困境中的战略就是“对方招供,我招供;对方不招供,我招供”。而这种不依赖于对方的决策,自己最优战略都一致的就叫做占优战略。

第五个概念是支付。还是用囚徒困境来解释,对任意一个囚犯来说他的支付都是6(都招)、1(都不招)、0(我招他不招)、10(我不招他招),理性的人都会在可选择的情况下让支付最大化(该例子中的最大支付是6和0,因为坐牢肯定是越短越好)。

第六个概念是均衡,也叫纳什均衡。纳什均衡是博弈论中最最核心的知识。1999年诺贝尔经济学奖得主迈尔森评价到:发现纳什均衡的意义可以和生命科学中发现DNA双螺旋结构相媲美。可见它有多重要。

纳什均衡是博弃中的一种稳定状态,在这一状态下,所有的palyers都不愿意单方面改变自己的战略。囚徒困境中两人都招供是一个纳什均衡,因为没有人会在他人招供的情况下将自己的策略改为不招供;而两人都不招供就不是一个纳什均衡,因为在得知对方不招供的情况下,自己肯定会选择招供;同理一个招另一个不招也不是纳什均衡。

第七个概念是结果。上述例子的结果就是,两人都招供,两人都被判6年。不过有一点需要注意,这个结果特指博弃论模型中推导出来的结果,而不一定是现实世界中的最终结果。因为现实世界中可不是每一名嫌犯都会理性到用博弈论的方法来分析选择,说不定会巴巴的指望对方也不招供,然后大家都判1年呢?

到这大家肯定会有一个疑问,明明最好的结果是两个人都不招供各判1年,可最终却成了都判6年。这就引入了博弈论所重点研究的领域,即个体理性和集体理性之间的矛盾,而要解决这个矛盾有着很多方法,这些方法有着一个共同的目标一一促进人类社会的协调与合作。

不过在讨论个人理性与集体理性矛盾之前,我们先试着用博弈论的视角解释为何工作留痕、形式主义久治不愈的问题。

首先,工作为什么要留痕?为什么要准备各种各样的资料?因为要应付检査。那为什么上级要检査资料?因为要了解基层工作干还是没干。

这种上面不留死角的检查和下面不不遗余力的应付是一个囚徒困境,但也形成了一个纳什均衡。

机关和基层双方都无法单方面的改变战略。基层不敢,因为机关要査;机关不敢,因为担心基层不干。所以才导致了形式主义积弊难除。

那该如何解决?这同样也是个体与集体之间的矛盾。

解决矛盾的最好方法是引入第三方的监管力量。用社会上经常听到的话来说就是:让政府来管。

再给大家举一个美国烟草的例子。1967年,美国有这么一个规定,凡是在电视上播一条香烟广告,就必须搭配播一条“吸烟有害健康”的公益广告。这一下子就让美国的烟草公司陷入了囚徒困境。越打广告,观众就越会知道吸烟的危害,因此吸烟的总人数会减少,烟草公司的收入就会下降;如果不打广告,别家的烟草公司打广告,那么你家的香烟销量就会越来越少,最终被淘汏出局。最终,各家烟草公司宁愿利润越来越少也不得不花钱去打广告。从那之后,烟草行业一度濒临破产。

直到1970年,美国国会通过了一项法案,直接禁止烟草公司在电视上播放广告。可结果就是,由于广告费减少了,利润反而上升了,烟草公司一下子起死回生了。

我们可能会认为美国国会好心办了坏事,本来想打击烟草行业,反而促进了发展。其实,禁止烟草广告的法案,是烟草公司自己运作的结果。因为他们想解决当前的囚徒困境,所以引入了第三方的力量——政府插手。

理解了这个例子,也就能想明白今年为什么要定为基层减负年了,因为单从机关和基层两方面来看,是无法打破形式主义的囚徒困境的。因此,不得不通过国家的力量强制下令:发给县以下的文件、召开的会议减少30%到50%,领导带头,实行“一票否决”制等等。通过法规进行约束。

博弈论是一门成熟的学科,所包含的内容和知识也绝非一朝一夕就能掌握了,多重均衡、聚点均衡、重复博弈、路径依赖等等知识点不胜枚举,但只要稍微了解博弈论,那看待社会现象的眼光将会完全不一样。到那时,再发现生活中存在的不合理现象,便可以理解它为什么能够存在。这也变向应验了黑格尔的那句名言:存在即合理。

这篇文章仅仅是推开了一扇门,只有当我们真正走进去才知道博弈论的博大精深。

你可能感兴趣的:(用博弈论的视角看“基层减负年”)