博弈论

千呼万唤始出来,终于要写我心心念念的博弈论了。说到博弈论大家心里肯都有两个问题,

1、博弈论是什么?
2、学习博弈论有什么用?
博弈论是多个个体或群体在特定条件制约下,利用相关方的策略,而实施自身对应策略的学科。就好比下棋,敌我对弈,为获得胜利,如何见招拆招。
那有什么用呢?生活中充满着博弈,理解其中隐藏的规律,才能为我所用。通过对博弈论的学习,我得到一个结论,在现实生活中 多次重复博弈的前提下,“一报还一报”是最优策略!
善意为先,以直报怨,以德报德

博弈论_第1张图片
640.webp.jpg

好了,写到这我觉得自己已经把博弈论中学到的对自己有用的结论写来了,而且我将坚定的按照这个规则执行。

如果有兴趣进一步了解博弈论,例如 博弈论是怎么产生的?经历了哪些发展过程?现代的博弈论是什么?还有刚刚我说的“一报还一报”是如何被实验证实的?那就随我继续往下看。

博弈论的产生

(为什么要谈博弈论的产生呢,所有的知识或理论,总有它开始的地方,如果想抓住其本质,就要从这里开始)

说到博弈论的产生不得不提一位大神,冯诺依曼,他可能是一个比爱因斯坦还要聪明的人!很小就精通多国语言,可以同声传译,在数学、医学、经济学、计算机科学等多门学科都有所建树。他一生对很多领域都有强烈的探索的兴趣。博弈论就产生于他的一个偶然的兴趣,有一天他想打扑克有没有稳赢不输的方法?于是出了《博弈论与经济行为》一书,宣布了博弈论的诞生。

举个简单的栗子,梭哈(也就是比大小)
游戏规则:2-5个人围在一起比大小,支付赌本后,每人一张底牌,底牌在对决时才可翻开。从发第二张拍,每发一张牌,以牌面者为先,进行下注。 有人下注,想继续玩下去的人,选择跟,跟注后会下注到和上家相同的筹码,或可选择加注,各家如果觉得自己的牌况不妙,不想继续,可以选择放弃,认赔等待牌局结束,先前跟过的筹码,亦无法取回。

最后一轮下注是比赛的关键,在这一轮中,玩家可以进行梭哈,所谓梭哈是押上所有未放弃的玩家所能够跟的最大筹码。等到下注的人都对下注进行表态后,便掀开底牌一决胜负。这时,牌面最大的人可赢得桌面所有的筹码。

这个时候应该怎么玩?手里拿到了大,中,小 牌时应如何应对?
1、拿到大牌时,一定想办法赢得更多,诱敌深入,加注;
2、拿到中牌时, 直接翻牌,胜面不大的前提下,无论输赢,降低风险;
3、拿到小牌时, 必须加注!为什么呢?从两方面来看。一方面,不加注,必输,加注可能赢;另一方面,要让对方搞不清自我的套路,兵者诡道也,让对方猜不出我是大牌加注还小牌加注。
这是博弈论在比大小中迎面比较大的策略。

至此我才知道,原来声名赫赫的博弈论最初是从游戏中发展而来的,是在既定的规则下,双方心理和智力的比拼。

博弈论中有意思的模型

囚徒困境

故事内容是,两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

· 若对方沉默,坦白会让我获释,所以会选择坦白。
· 若对方坦白指控我,我也要指控对方才能得到较低的刑期,所以也是会选择坦白。

这就是著名的囚徒困境,这个故事反映个人最佳选择并非团体最佳选择。

知道囚徒困境有什么用呢?如何破解囚徒困境?
囚徒困境用数学语言描述就是两个条件:
1、背叛诱惑>合作报酬。在这里,合作报酬是判刑1年,而背叛诱惑却是立即释放。
2、受骗支付>背叛惩罚。在这里,背叛惩罚是判刑8年,而受骗支付却是判刑15年。

看到这里,破解之法就显而易见了,我们只要让“背叛诱惑<合作报酬,受骗支付<背叛惩罚”就可以了。

背叛诱惑<合作报酬。即你帮大哥顶罪,家里的妻儿老小大哥都会帮你照顾,而且等你出来还会给你一笔钱;
受骗支付<背叛惩罚。即如果你敢揭发大哥,小心你全家性命。
纳什平衡

是指在一个博弈过程中,无论对方采用什么策略,我都会选择某个确定的最优策略,在这个博弈中谁单方改变策略,谁就会损失,纳什平衡就是这种博弈的稳定结果。

囚徒困境就是一个很好的例证,它是一个坏的纳什均衡。

学习纳什平衡有什么用呢?如何破解坏的纳什平衡呢?

还是以囚徒困境为例,如果两个嫌疑犯事先有约定,都不坦白,如果有人背叛,则外面的其他兄弟会惩罚他。
即用制度去制约坏的纳什平衡,让其向好的方向发展。生活中的商业战争也是一样,要善用协议约束,避免坏的纳什平衡,实现共同利益最大化。
智猪博弈

两头猪,一头大猪,一头小猪,在一个狭长的猪圈中,踏板和食槽在两端,踩下踏板食槽供食,一只猪踩踏板另一只猪就能坐享其成先吃,而踩踏板需要消耗能量。

具体情况如下:
如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;
如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;
如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;
如果双方都懒得动,所得都是0。

这里的纳什平衡是:大猪踩踏板,小猪不动。明显是个小猪占优的策略。

了解智猪博弈有什么用呢?这个故事给了我们什么启示?

如果把大猪比作大企业,小猪比作小企业,小企业要懂得合理搭便车,实施“占优策略”分得市场。大企业要懂得利用专利保护等制度设计,制约小企业占便宜。
公地悲剧

什么是公地悲剧?
在公共草原上,每个理性的牧羊人都追求个人利益最大化。但多放牧会带来两个结果,一是增加单只羊的收益,二是增加草原的负担,可能导致过度放牧。但因为草原是公共的,每个牧羊人无法限制其他牧羊人的放牧,自己不放牧资源也会被其他人占用,每个人都追求个人利益最大化,导致过度放牧,草原退化,这就是公地悲剧。

了解公地悲剧有什么用?如何破解公地悲剧呢?

了解公地悲剧的根本原因是公共资源不占用就吃亏的感觉,每个人都想占便宜,这种捞一把的心态导致了公地悲剧。
用两个方法去破解,一是公地私有化,就像小岗村,分田到户。公地私有化后人们就失去了捞一把的心态;另一个是强监管,通过公共资源有偿使用、许可证使用来管制,避免公地悲剧。
重复博弈

是指同样结构的博弈重复许多次,它可以是对称信息的博弈,也可以是不对称信息的博弈;

了解重复博弈有什么用?

理解了重复博弈,才不会在意一城一池的得失,用时间的维度的丈量成败。诚信是一种与这个世界重复博弈的心态。
当双方是一锤子买卖时,很可能宰你没商量。但如果把一次博弈变成重复博弈,总体利益就能抵抗住短期诱惑,大家就会更讲诚信。
不完全信息博弈

区别于囚徒困境、纳什平衡、智猪博弈、公地悲剧这些完全信息博弈,现实生活中很多博弈是不清楚对手的信息和策略的,像这种不了解对象特征、规则、策略等信息的博弈称为不完全信息博弈。

了解不完全信息博弈有什么用?

在我们了解对方特性、游戏规则和常用策略的情况下,我们会如何博弈,当没有这些信息,或者彼此不清楚对方是否知道这些信息的时候,如何博弈?

了解不完全信息博弈,可以通过制造信息不对称,获得策略优势,例如“空城计”。也可以通过特定方法,刺探对方军情,打破信息不对称,为我方争取策略优势,如“木马计”
维护和打破信息不对称,是双方的重要策略。
拍卖博弈

一架满载飞机,有几位重要旅客急需搭乘,如何用最少的代价,让其他旅客让出座位呢?
用拍卖博弈的策略,由低到高叫价,先叫先得。由于旅客彼此不知愿意下飞机的代价是多少钱,害怕错失机会,都会抢先同意举手。于是这种策略付出的代价最小。

拍卖博弈有什么用?

善用这种“不完全信息博弈”,激发博弈者们“自相残杀”,让时间最不值钱的旅客下飞机,获得最高收益。
零和博弈

是指参与博弈的双方在严格竞争的环境下,一方获益必然导致另一方损失,获益和损失之和永远为零。双方不存在合作可能。

学习零和博弈有什么用?如何避免零和博弈?

零和博弈会导致你死我活的内部竞争,但往博弈中加入增量,零和博弈就会变成正和博弈。先确定“存量分配规则”、“利益分配机制”,不容博弈发生,打开封闭系统,注入新的元素,这样创业公司才不会只盯着已经赚得的钱如何分,而是在既定利益分配机制的前提下,想如何扩大盘子赚更多的钱。
一报还一报

美国密西根大学教授罗伯特·阿克塞尔罗德做了一个博弈实验,他写信给不同背景的学者,请他们把应对“囚徒困境”的策略写成程序,让这些程序捉对厮杀,经过十几万次的重复博弈,最终“一报还一报”的策略获得了胜利。

这个实验让我更加坚定,在生活中要秉持善行,用惩罚回报恶行,用善行回报善行;
在没有被欺骗之前永远不要主动欺骗他人。如果对手选择背叛,立刻反击。如果对手补偿,不计前嫌继续合作。这样的清晰规则会激发对手的合作动机。是长期博弈最有利的策略。

写在最后,最近写作的过程中我的观念又发生了些变化,是受我的 parter 黄sir 的影响(哈哈,我自己偷偷给她取的外号)。我一直喜欢写大而全的东西,但这种东西真的不好写,容易铺的太广而写不透,而且很烧脑。

她是每天坚持写作,而且最近看她的文章写的越来越好,我们都订阅了老师的专栏,而我可能听听就过了,她会听完记下来,而且结合到自己生活中的小事,写出感想。这点触动了我。所以我想试试,从一个个小灵感小启发开始写,积累一个个小故事,一次只说清楚一件事。

你可能感兴趣的:(博弈论)