浅谈博弈论

不会博弈论的孩子是玩不好德州扑克的.

囚徒困境

在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。

囚徒困境博弈 [Prisoner's dilemma]

|A╲B        | 坦白  |  抵赖  |

| --------  | -----:  | :----:  |

|坦白    | 8,8 |  0,10    |

|抵赖      |  10,0  |  1,1  |

对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。

单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的决策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。

智猪博弈

一、经济学中的“智猪博弈”(Pigs’payoffs) 这个例子讲的是:

假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽(两猪均在食槽端),另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是在去往食槽的路上会有两个单位猪食的体能消耗,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

"智猪博弈"由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:

小猪

行动

等待

大猪

行动

5,1

4,4

等待

9,-1

0,0

从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!

高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。

在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗?

马车博弈

两勇士驾马车驶于两桥头。对撞就会同归于尽,让路就是认输。上面四种类型会有四种方式选择博弈。

弃战型会立于桥头。不做任何变化,不受对手影响。

谈判型会尽可能选择靠谈判说服等实力对方作和。如果对方能力差会让对手认输。如果对手相当并硬闯自己便让路。

勇猛型会选择蒙上眼睛往前冲。自己的结局或赢或同归于尽。

后发型策略相对复杂,针对勇猛型而言,如果勇猛型蒙眼往前冲。那后发者可以选择点燃马尾,让马车与对手同归于尽自己再走过去。如果对手点燃马尾。则可以放过对方马车。然后本人上马车去对撞对方个人胜利。但此计需要准确的信息和火把这种外部因素所以需要高额的成本。

谈判策略

问题回来,很多人会问谈判策略和后发策略哪个是胜者。这个首先看队友,谈判策略者如果有弃权策略战友。那么可以通过战友牵制获胜,当然这个战友要够大。如果后发型有勇猛型战友,同样可以借助战友牵制,但同样要够强大。所以,美国胜中国可能要借助印度,中国胜美国靠俄罗斯,当然是在不使用核武情况下。如果双方都有这个稳定的关系了,竞争将进入动态平衡,当然还有一种可能,勇猛型战友同时帮你克制你的两个敌人。如果都没,将进入僵持。

四方博弈

如果弃权型用手枪来代表。那么理智型就应该是火力更强的微型冲锋枪,勇猛型应该是机动性能更差,但火力更猛的重型机枪。而后发型应该是千米之外探囊取物的狙击步枪。

传统战争中微冲对手枪的优势是不言而喻的。便捷性差一点,火力提升几倍。在战场上重击枪对微冲优势有近似的效果。而狙击和重击对峙的场景往往是出现在狙击偷袭重击枪枪手。很少有机会重击枪手扫射到狙击手。手枪枪手对峙狙击的情况比较少见,往往是狙击枪手偷袭远距离手枪枪手,虽然有机会打倒对方。但是为打一个手枪枪手就暴露自己的存在和位置是得不偿失的,在另一种方面手枪枪手摸黑偷袭狙击手的话,狙击手没有随身携带小型枪,短兵相接往往也是输率更大。打击近距离移动物体往往是微冲的天下。在微冲和狙击比较中。微冲胜率相对低。但是狙击手如果位置过近为了不暴露也更该选择不开枪。这样就形成僵局。

多腿凳定律

多腿凳定律又称长板理论,指一个拥有多条长短不一凳腿的板凳如果想要尽可能的平稳,不是垫高最短的腿,而是消减最长的凳腿。在凳面范围内加大凳腿之间的距离也能起到增加稳定性的作用。

木桶效应

提出者:美国管理学家彼得 又称水桶原理或短板理论,水桶短板管理理论,所谓“水桶理论”也即“水桶定律”,其核心内容为:一只水桶盛水的多少,并不取决于桶壁上最高的那块木块,而恰恰取决于桶壁上最短的那块。根据这一核心内容,“水桶理论”还有两个推论:其一,只有桶壁上的所有木板都足够高,那水桶才能盛满水。其二,只要这个水桶里有一块不够高度,水桶里的水就不可能是满的。  木桶理论是由美国管理学家彼得提出的。组成木桶的木板如果长短不齐,那么木桶的盛水量不是取决于最长的那一块木板,而是取决于最短的那一块木板。这就是说构成组织的各个部分往往是优劣不齐的,而劣势部分往往决定整个组织的水平。

若仅仅作为一个形象化的比喻,“水桶定律”可谓是极为巧妙和别致的。但随着它被应用得越来越频繁,应用场合及范围也越来越广泛,已基本由一个单纯的比喻上升到了理论的高度。这由许多块木板组成的“水桶”不仅可象征一个企业、一个部门、一个班组,也可象征某一个员工,而“水桶”的最大容量则象征着整体的实力和竞争力。

这里总结一下,中国的思想策略都是板凳定律,美国的思想是木桶定律,相生相克,理解透了你会看的更远.

你可能感兴趣的:(浅谈博弈论)