博弈论:是两人(或者多人或者机构)在平等(或者不平等)的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

 

    按理说,学经济或者数学的同学,或多或少学习过,听说过博弈论,听说过纳什均衡,最优均衡,囚徒困境等等。根据百度百科描述:

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治、 军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一 个重要学科。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。

  博弈论按照翻译应该是“游戏 理论”,其实就在在一定的游戏规则下。通过策略或者推算对方的策略调整自己的选择,以获取利益。

就以小王与huiT30到某个游乐园遇到一个开心转盘为个例子:

开心转盘有抽奖与押宝2种,先设定游戏规则:

1、押宝可以获得“礼物”,但是如果多人同时押宝,礼物将不给任何人。

2、如果没有人押宝,“礼物”可以从抽奖中获得。不论先后时间。

3、2人单独进行,不得有交流。

规则如此:

现在就以 huiT30与小王 2人来做对局:

huiT30

押宝(押宝)
押宝(抽奖)
抽奖(押宝) 抽奖(抽奖)

                                             小王

huiT30为y(纵)轴,小王为x(横)轴

现在就有了4种情况:

huiT30在选择押宝的时候,小王选择了抽奖

huiT30在选择押宝的时候,小王也选择了押宝

小王在选择押宝的时候,huiT30选择了抽奖

小王在选择抽奖的时候,huiT30也选择了抽奖

  这里就出现2种均衡:同时选择抽奖或者同时选择押宝。

这里猜猜huiT30 小王 处于什么均衡状态?

 

最好的状态就是2人都选择抽奖,这样就可以有一人有收获。(谁能中看2人运气)

如果2人都选择押宝,都一无所获。

如果一人选择押宝而另外一人选择抽奖,抽奖的人将一无所获,太不划来了。所以2人不会出现一人抽奖,一人押宝的策略。

因为2人无法商量,当然2人不可能高风亮节,将礼物让给对方。如果对方选择押宝,而自己选择抽奖将一无所获。

来算算huiT30选择策略的结果:

1、如果选择押宝,huiT30得到礼物的几率为50%

2、如果选择抽奖,会出现3种情况

小王选择了押宝,礼物归小王

小王也选择了抽奖,礼物被小王抽到

小王也选择了抽奖,礼物被huiT30抽到

huiT30得到礼物的几率为33.3%

所以选择押宝对huiT30得到礼物的几率更大一些,小王也是如此,所以选择押宝对2人来说,更符合自己的利益---其实就也是损人不利己的一种,因为最终谁都没有得到礼物。就是著名的“囚徒困境”。

因为每一方在选择策略时都没有“共谋”(串供)其实在共谋的情况下,他们也会害怕对方会背叛自己,除非有更大的压力下(比如说谁选择押宝后将礼物让给对方)才会选择更优的策略。他们只是选择对自己最有利的策略,而不考虑对手的利益。也就是说,这种策略组合由所有参与者的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。

 

    在看另外一个例子:

一个公司因为经营不善,需要部分裁员,发出裁员信息后,员工该如何应对:

 

员工

     

找工作(被裁)   找工作(没有被裁)
等待  (被裁)     等待 (没有被裁)

 

 

                       

  公司

 

  公司为X(横)轴,员工为Y(纵)轴

 

   游戏规则:1、公司裁员名单为止,但是已经发出裁员信息。

             2、找工作视为已经找到工作

             3、工作不考虑好坏,不与现在的职位做比较。

这里员工与公司都会选择(这里策略的目的是员工有工作)

1、员工主动找工作,同时得到了被裁的通知

2、员工等待消息,得到了被裁的通知

3、公司没有通知员工被裁消息,员工主动找工作

4、公司通知员工被裁消息,员工等待消息

 

这里员工有个最差策略,就是被动等待公司的策略。这里的均衡就是:2与3.

员工选择策略的结果:

1、被动等待消息:裁或者不裁,50%

2、主动找工作:

              可能被裁

              可能没有被裁

              找到新工作(这里不讨论工作的条件或者是否找到)

 可能有工作的几率为:66.6%

从员工的角度来选择策略:主动寻找工作

从公司的角度来说:

1、公司想保留核心员工

2、公司都将一些非核心的员工辞退

当信息不对称时,公司或者会主动向某些员工下发不会辞退的信息,这样让等待(没有被裁)成立。当然这是游戏规则前提有的情况下。

 

有一个非常有趣的案例:海盗分金。

海盗,是一帮亡命之徒,在海上抢人钱财,夺人性命,干的是刀头上舔血的营生。在我们的印象中,他们一般都是独眼龙,用条黑布把瞎眼遮上。他们还有在地下埋宝的好习惯,而且总要画上一张藏宝图,以方便后人掘取。
然而很少有人知道,海盗是世界上最民主的团体。参加海盗的都是桀骜不驯的汉子,富有独立精神。
平时海盗们之间一切事都由投票解决。船长的唯一特权,就是拥有自己的一套餐具。可是在他不用时,其他海盗是可以借来用的。海盗船上的唯一惩罚,就是被丢到海里去喂鱼。
现在船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶残的海盗来提出分配方案,然后大家一人一票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,依此类推。
我们先要对海盗们作一些假设:
1.每个海盗的凶残性都不同,而且所有海盗都知道别人的凶残性,也就是说,每个海盗都知道自己和别人在这个方案中的位置。另外,每个海盗都是很聪明的人,都能非常理智地判断得失,从而作出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信;
2.一枚金币是不能被分割的,不可以你半枚我半枚;
3.每个海盗当然不愿意自己被丢到海里去喂鱼,这是最重要的;
4.每个海盗当然希望自己能得到尽可能多的金币;
5.每个海盗都是功利主义者,如果在一个方案中他得到了1枚金币,而下一个方案中,他有两种可能,一种得到许多金币,一种得不到金币,他会同意目前这个方案,而不会有侥幸心理。总而言之,他们相信二鸟在林,不如一鸟在手;
6.最后,每个海盗都很喜欢其他海盗被丢到海里去喂鱼。在不损害自己利益的前提下,他会尽可能投票让自己的同伴喂鱼。
现在,如果有10个海盗要分100枚金币,结果将会怎样呢?
这是来自于《科学美国人》中的一道智力题,原题叫作《凶猛海盗的逻辑》。一般大家都称之为“海盗分金”问题。
要解决“海盗分金”问题,我们总是从最后的情形向前推,这样我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果,得到倒数第二步应该作策略选择,依此类推。要是直接从第一步入手解决问题,我们就很容易因这样的问题而陷入思维僵局:“要是我作这样的决定,下面一个海盗会怎么做?”
以这个思路,先考虑只有2个海盗的情况(所有其他的海盗都已经被丢到海里去喂鱼了)。不妨记他们为P1和P2,其中P2比较凶残。P2的最佳方案当然是:他自己得100枚金币,P1得0枚。投票时他自己的一票就足够50%了。
往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。
P4的情况差不多。他只要得两票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。
依此类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。
结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。
在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
真地是难以置信。P10看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。
其实什么事情都是先手比较有优先决断权。历朝历代的农民起义、争斗不休的宫廷政变、企业内部成帮结派的明争暗斗、办公室脚下使绊的公司政治,哪一个得胜者不是用“强盗分金”的办法,他们都是以最小的代价获得最大的受益,拉拢“挑战者”分配方案中最不得意的人们,而打击“挑战者”。
当老大是不容易的,企业家就是要把各方面“摆平”。任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚 “挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
为什么革命者总是找穷苦人?因为他们是最失意的人。为什么恐怖分子拉登在沙特阿拉伯没有市场,在阿富汗却大受欢迎?因为阿富汗是全球的弃儿。为什么企业中的一把手,在搞内部人控制时,经常是抛开二号人物,而与会计和出纳们打得火热?这正是因为公司里的小人物好收买,而二号人物却总是野心勃勃地想着取而代之。
海盗P10就相当于公司老板。假如你作为老板,拥有最先分配权,就看你是否仁厚或是黑心,你有权独吞所有共同成果,也可以合理分配让大家满意,如果你过于贪婪,就要承担被伙伴推翻的风险,如果您不想冒险,就放弃部分利益以求共存。
当然“海盗分金”的隐含假设是所有海盗的价值取向都是一致的,理性的。而在现实生活背景下,海盗的价值取向并不都一样,有些人的脾性是宁可同归于尽都不让你独占便宜,有些人则只求安稳,不计较利益。
所以这10个海盗换成不同性格的人在不同的位置都有可能影响结果。作为海盗P10,还必须对伙伴们的性格了如指掌,根据其性格特点和价值观作深入研究和策略分析,才能因地制宜,设计出最合适的分配方案,这是没有什么公式套路的。
和老板领导管理团队一样,要赚取最大化的利润又不能使自己的平台不至于垮掉,就必须对自己的下级作深入研究,制订相应合理的分配方案,才能获得最大的成功。
在“海盗分金”博弈中,我们还能看到一个富有哲学意义的命题。那就是生命与金钱孰重孰轻?
这在博弈中是一目了然的。没命的话要钱还有何用?所以首先是考虑自身的安全,当你身上只要还有一枚金币,别的海盗们就会贪图你这一枚金币,怎么办?除非什么都不要,剩下100枚金币让其他9个人平分。如果其他海盗都愿意以最小的代价(即9人内部不愿意再发生争执)换来最大的利益的话,这个方案就没有问题,但遗憾的是自己的利益就彻底丧失。
命比钱重要是肯定的,但在现实生活中,没钱又怎能有命呢?