生活当中的博弈论思考

整个文章的大纲视图奉上~


关于生活当中的博弈论思考.jpg

什么是博弈论?
博弈论是指在个人做决策的时候也要考虑对手可能的决策的影响的一种动态决策学问。

商业当中的博弈论

两种视角看待问题

  • 第一是用动态的眼光去看待各种视角,很多东西并不是一成不变的静态场景,比如在一个公司当中我们既是公司政策和战略的执行者,也是影响公司发展的参与者。传统经济学认为市场都是静态的,但现实情况是我们既参与了市场,也改变了市场
  • 第二是用博弈的眼光去看待与人合作,做决策之前,要去思考对手可能做出的反应并做出预测。我理解的是对手会有不同的概率做出不同的反应,我们就需要按照每种概率去做相应的备用计划和反应的方案。

第一部分 什么是合作竞争理论

真实的商业运作不只是有竞争,尔虞我诈以及抢夺资源,合作也是一个重要的因素。当共同建立一个市场的时候,两个公司可能是合作关系;而当分配利益的时候,这两个公司又是竞争关系。比如在快车业务建立并发展的时候,滴滴和快的就是合作的关系,它们共同对消费者的行为模式进行数据挖掘,优化服务,制定出原本不存在的行业基本规则;而在市场建立以后,进行市场份额的分配的时候,这两家公司又是竞争的关系,双方会为了市场份额大打出手。因此在商业的世界里面,那句老话“商业没有永远的敌人,也没有永远的朋友,只有永远的利益”并不是毫无根据的毒鸡汤,恰恰是商业世界的一个缩影。对于商业世界,并不是赛道或者是其他竞技比赛,并不是只有当上第一名才可以实现盈利,并不需要通过消灭其他对手来使得自己强大起来,相反很多时候合作反而能够使得双方共同达到利益最大化,达到协同效应,也就是1+1>2的结果。

第二部分 在商业活动中参与者所扮演的角色:价值链十字模型

价值链十字模型是分析商业活动中五个部分所处的位置,直观地看出彼此之间的相互作用和影响关系。这五个部分包括了公司、互补者、竞争者、顾客和供应商。如果我们把它画到图上,就是以下的结果。

十字链模型

这个图可以分成两个方向看,
纵向

纵向我们更加熟悉一些,原材料从供应商出发,经过公司的加工之后再出售给消费者,是一条简单但完整的商品流程。

横向

横向是从商业的视角上看公司与周围的商业参与者的关系。所谓互补者,是指从消费者的角度上看,消费者同时购买了贵公司所出售的产品以及其他公司的产品比单独购买贵公司的产品所得到的效益或者说价值更大,那么那个“其他公司”就是你的互补者。书中举的例子就是麦当劳当中的汉堡和可乐的协同效应就要比单独购买汉堡的体验和价值更好,那么在这里可口可乐就是麦当劳的互补者。相反,购买了你的产品和竞争者产品之后消费者所获得的价值会降低,比如消费者买了面包以后就已经吃饱了,再购买汉堡所获得的使用价值就会降低,因此面包商和汉堡店就是竞争者。

几点有趣

对称。

  • 供应商和顾客其实是相同地位的两个节点,我们作为雇员,其实是充当人力供应商的角色,因此当发生劳资纠纷的时候,实际上是公司没有把员工和顾客放在同样重要的地位上进行考虑。
  • 当你从不同的视角去看待问题的时候,角色会发生互换。
  • 多个十字模型以节点作为中心可以构建出一个大的关系网络,我们站在这个大的关系网络上面可以从宏观的视角去看待问题,人际关系以及及时进行角色转换。

生活当中的策略思维

第一部分:静态决策

下棋

其实熟悉强化学习的人都知道AlphaGo跟人类棋手下棋的时候,总是根据对手下的每一步,利用计算机强大的计算能力去计算自己下的每一步棋,以及对手针对自己的棋一直蔓延到终点所得到的奖励大小,每次都选取当前状态下奖励最大的那个走法,简单说,就是AlphaGo算准了你能下的所有可能性,并且知道自己要怎么下才能够最有可能赢你。这其中就涉及到两种方法“向前展望,向后推导”,“向前展望”就是思考自己如果做出某个决策之后,对手可能会有什么样的反应的可能性;而“向后推导”是指针对对手可能的反应以及自己想要取得的目标效果,往后推导,我应该采取什么样的策略才能达成我的目的。这种方式适用在静态决策当中,你和对手分别先出和后出招的情况。

第二部分:动态决策

刚刚说的是静态环境下你应该如何出招。如果是动态情况下,也就是你并不知道对手会做什么反应,你需要和对手同时做决策的情况下,那么就是一个动态决策的过程。这个过程总结下来说三点

  1. 找到自己的优势策略。
  2. 避免自己的弱势策略。
  3. 寻找博弈的均衡。

我对这三个步骤的理解是,其实就是有点像弹簧在拉伸之后的回复。也就是先看使自己利益最大化的策略是什么,也就是弹簧最长可以拉多长;接着,思考自己的弱势策略,也就是自己哪个策略会使得自己最为不利,可以看做是底线,也就是弹簧最小可以压缩到什么长度,直到你不可以忍受或者是结局最差;然后思考对方的可能对应你的决策的策略,取一个平衡点,也就是均衡点,叫做纳什均衡,也就是针对对方的决策你所做出的决策都是最优的,注意这里的前提条件“针对对方所做的决策”,在物理当中就是弹簧的自然长度,这个长度刚刚好。

第三部分:如何防止对手预测我们,如何影响对手

以上说的是决策的方法,但是如果我们的决策都可以被预料到的话,那么科学的决策过程也是没什么用的。所以我们需要防止对手能够预测到我们的决策,同时我们又希望通过我们施加影响可以让对手按照我们预设定地想法去做我们预料到的决策。

防止对手预测到我们的决策

可以用随机策略干扰对手。比如二战时候盟军在欧洲登陆有两个可以选择的地方:诺曼底和加来港,采取了故意泄露情报、混淆视听的方式让德军搞不清楚到底是诺曼底还是加来港登陆。

影响对手

威胁和承诺

威胁就是告诉对方,如果你怎么做我就可能会如何做。比如在冷战时期,面对苏联在一些领域军事性的挑衅,美国就放出狠话“不排除使用核武器的可能”,这句话一个是能够起到威慑作用,第二个是留有余地,万一苏联真的不按照美国的影响走,那么美国也留有余地。
承诺就是释放出明确的信息,让对方明确自己的决心。比如在《西虹市首富》当中当王多鱼不断购入夕阳产业的股票,其实是在资本市场的博弈当中发出一个明确的信号——“我看好它们的发展前景”,于是乎,很多人就会按照这个信号去购入这些股票,然后这些股票价格就会涨起来。这其实并非只是电影里面的情节,许多商业的操作就是有迹可循的。为了让自己的承诺看起来是会执行的,有时候还需要采取一定的行动去释放这种承诺的坚决。

第四部分:如何达成合作

囚徒困境

经典的囚徒困境是如下的表格。


囚徒困境,图片来自https://sites.google.com/site/gametheorybasics/contact

在这个表格当中两个囚徒其中一个坦白的话,坦白那个就会获得立即释放,而抵赖的要判20年(右对角线情况);如果都抵赖,那么就只判刑一年(右下角);如果都坦白的话,就各自判刑5年(左上角情况)。在这种情况下个人利益最大化的策略与群体利益最大化的策略是不同的,很明显,对于个人来说,肯定是不想被判刑的,于是应该选择右对角线的情况,而对于我们看到整个宏观局面的人来看,群体利益最大化是右下角大家都抵赖的情况。但其实囚徒困境每个人的决策会受到几个条件的影响。

  1. 博弈次数

整个影响因素可以用一个很熟悉的例子来阐述,比如在国内很多旅游景点商贩都有“宰外地游客”的现象,因为他们本着没有游客只会来一次,没有回头客的理念,不宰白不宰。其实在这里就是买东西就是顾客与商家博弈的过程,相对于旅游景点,在大城市或者是乡镇里面定点扎守的老店,更难去宰客,因为顾客可能会在你这边被骗一次,但是别忘了经营一家店是一个长期的过程,是一个多次博弈的过程,顾客顶多只会被骗一次。被骗一次之后,把名声传开以后就不会再有顾客来光顾了。

  1. 博弈的成本和利益

假设说,现在参与博弈的不是两个刚认识合伙打劫银行的囚犯,而是一对认识很久的夫妇,他们感情深厚,宁愿一起坐牢,也不愿意出卖对方,那么他们会选择共同抵赖而不愿意出卖对方。这也让我想起了《西虹市首富》王多鱼关于最后是否救夏竹,就是关于个人的生命危险,300亿遗产和夏竹的安危的博弈,其实在现实生活里,这个对人性的考验是很危险的。我的观点是,对于王多鱼来说,夏竹对他来说成本比钱更大,或者说他更不能接受失去夏竹。同样的,你可以看到电影《金钱帝国》当中为什么陈奕迅饰演的警员被抓了之后不愿意指认他背后的庞大幕后黑手而获得减刑?我相信指认之后要么是自身,要么是家人,可能会有生命危险,因此在这种情况下,不指认乖乖服刑反而是代价比较小的做法。

3.博弈的人数

在囚徒困境当中,假设说不是两个人的博弈,而是100个人的博弈,那么大家不太可能都抵赖,因为大家会明白,要一百个人都串供,那太难了,对自己的优势策略反而是直接供认。有意思的是,我听到我老大的一个例子,觉得也是在工作上有启发,特此分享。比如说产品经理对开发人员提出一个需求,询问需要完成的时限,那么这个开发人员肯定不想天天加班的呀,于是会要一个比实际开发时间所更宽裕的时长,但是对于产品经理和全局来说可并不是利益最大化,于是产品经理更好的做法其实是把多个程序员集中在一起,开个小会,询问需要开发的时间,这样由于多个程序员“串供”的可能性小,有的说一个星期,有的说4天,有的说5天……所以最终能够得到一个关于开发时间的较为合理的时间,这就是均衡点。

要想避免囚徒困境
增大惩罚力度。比如同样的,中国式过马路,实际上也是一群人的博弈,既有遵守交通秩序的人,也有闯红灯的人。那么实际上就是遵守秩序的你和其他闯红灯的人博弈的过程,其实是大家都不闯红灯才是对群体的利益最大化。但是总有人为了个人利益去闯红灯。看见了别人闯红灯而你还在太阳下曝晒,那你闯不闯?在这里需要加大惩罚力度,对闯红灯的个人开出高额罚单,并且严格执行,只要闯一个那么就执行罚单一个,那么就不会有人敢闯红灯导致其他人效仿的行为。
关于囚徒困境的一个仿真模拟,可以在《合作的进化》这本书当中找到,这本书说的一个核心观点就是,在多次博弈的过程中,只有不背叛的“好人策略”才会获得显著的生存优势,这并不是在灌输鸡汤,这确确实实在现实当中,只有充当靠谱的人,才会有让别人和你建立长期合作的关系,这点不管你是打工的还是领导层都是一个道理,面对上级交代的开发任务,你可以通过博弈的方式争取到有利的资源和比较宽裕的时间,但也要有靠谱的心态,在规定的时间内完成开发任务,最好是稍微完美些,这样下次上级才会把更加重要的任务交付给你,建立起值得信赖的长期合作。

总结

最后,如果你什么都没记住的话,至少要记得这两句话“思前想后,计划和做准备的要往前推几步,做好应对方案”“成为一个靠谱的人,才会有建立长期合作的可能”

文章系“得到”app《合作竞争》和《策略思维》的读书感悟。

你可能感兴趣的:(生活当中的博弈论思考)