[你成坚持社群]38/50博弈论:纳什均衡

万维钢精英日课:19.0212博弈论:群鸦的盛宴

摘要:博弈论讨论的是理性决策。每次做决策要考虑对方的决策,不是说要对对方好,是考虑对方怎么做,自己再怎么做。

基本概念:帕累托最优、压倒性策略、纳什均衡

理解为什么扎堆在一个点卖东西:如果一方在中心点0,另一方在右方K或左方-K,后者辐射范围小,对他不利。故只有都在中心点,辐射范围一致受惠一致,因此产生扎堆。

图片发自App

帕累托最优:不伤害对手的利益情况下,至少一个人的境遇变得更好。如果一个局面已经没有帕累托改进的余地了,这个局面就叫“帕累托最优”(比如一方在-K、另一方在K点卖冰激凌,分别辐射各自范围且不冲突)。帕累托最优是一个理想状态,但是也不稳定,如果有一方做出对自己更有利的改变,其他方可能利益受损(比如一方改到中心点O)。只有稳定的局面才能长久,引出下一个概念:囚徒困境,压倒性策略&被压倒性策略。

压倒性策略:这个策略压倒其他一切策略,不管对手怎么做,你这么做对你都是最好的。(比如招供:被判3年或不判刑)。被压倒性策略:不管别人怎么做,你这么做对你都是不好的(比如不招供:被判5年或1年)。

图片发自App

所以囚徒都会选择招供,都被判3年。这个结果不是帕累托最优,但是是最稳定的,任何一方都绝对不会单方面改变策略。引出下一个概念:纳什均衡。

纳什均衡:任何一个局面,在这个策略组合里,没有任何一方愿意单方面改变自己的策略。

换句话说,不管我们喜不喜欢,这个局面我们都认了,关键词:单方面。是,不招供更好(都被判1年),但是要变必须一起变,我自己不可能先变。因为人人都不愿意先变,结果这个结局就改变不了。扎堆就是一个纳什均衡。如果一个现象能够在社会长期稳定存在,它对参与方来说就是一个纳什均衡。纳什均衡告诉我们,评价一个局面不能只看它是不是对整体最好,它必须让每个参与者都不愿意单方面改变。一个制度哪怕再好,如果不是纳什均衡就不会被遵守。一个制度哪怕再不好,如果是纳什均衡,就会长期存在。

帕累托最优常常不是纳什均衡,那怎么解决困境呢?就比如商家扎堆,以前主流媒体的内容同质化严重,但是后来有了互联网,我们就能看到各种满足细分需求的自媒体。有人愿意在海滩边缘摆摊。因为市场的门槛变低了,小成本也可以经营,就没必要抢占主流市场了。

有意思的应用

感情中的帕累托最优是双方都包容。但最终能达到纳什均衡却是一个人多包容、一个人少包容,双方多少都不平衡。男女双方结婚后,双方都面临感情上处理问题的压倒性策略,即不包容或少包容来试探对方的边界。这是人的本能,人都在试图进入舒适区,即被包容的状态。在试探的边缘中,双方犹如一个弹簧,某方压力大另一方就收缩,最终结果看双方的力量对比、耐心和进退。而该最终状态的成型和初始状态关系很大,一些一开始为了追求对方的人所表现的包容和大度在婚姻中会苦不堪言,最终采取压倒性策略,随之达到纳什均衡。

图片发自App

图片发自App

你可能感兴趣的:([你成坚持社群]38/50博弈论:纳什均衡)