博弈论

千呼万唤始出来，终于要写我心心念念的博弈论了。说到博弈论大家心里肯都有两个问题，

1、博弈论是什么？
2、学习博弈论有什么用？
博弈论是多个个体或群体在特定条件制约下，利用相关方的策略，而实施自身对应策略的学科。就好比下棋，敌我对弈，为获得胜利，如何见招拆招。
那有什么用呢？生活中充满着博弈，理解其中隐藏的规律，才能为我所用。通过对博弈论的学习，我得到一个结论，在现实生活中多次重复博弈的前提下，“一报还一报”是最优策略！
善意为先，以直报怨，以德报德。

640.webp.jpg

好了，写到这我觉得自己已经把博弈论中学到的对自己有用的结论写来了，而且我将坚定的按照这个规则执行。

如果有兴趣进一步了解博弈论，例如博弈论是怎么产生的？经历了哪些发展过程？现代的博弈论是什么？还有刚刚我说的“一报还一报”是如何被实验证实的？那就随我继续往下看。

博弈论的产生

（为什么要谈博弈论的产生呢，所有的知识或理论，总有它开始的地方，如果想抓住其本质，就要从这里开始）

说到博弈论的产生不得不提一位大神，冯诺依曼，他可能是一个比爱因斯坦还要聪明的人！很小就精通多国语言，可以同声传译，在数学、医学、经济学、计算机科学等多门学科都有所建树。他一生对很多领域都有强烈的探索的兴趣。博弈论就产生于他的一个偶然的兴趣，有一天他想打扑克有没有稳赢不输的方法？于是出了《博弈论与经济行为》一书，宣布了博弈论的诞生。

举个简单的栗子，梭哈（也就是比大小）
游戏规则：2-5个人围在一起比大小，支付赌本后，每人一张底牌，底牌在对决时才可翻开。从发第二张拍，每发一张牌，以牌面者为先，进行下注。有人下注，想继续玩下去的人，选择跟，跟注后会下注到和上家相同的筹码，或可选择加注，各家如果觉得自己的牌况不妙，不想继续，可以选择放弃，认赔等待牌局结束，先前跟过的筹码，亦无法取回。

最后一轮下注是比赛的关键，在这一轮中，玩家可以进行梭哈，所谓梭哈是押上所有未放弃的玩家所能够跟的最大筹码。等到下注的人都对下注进行表态后，便掀开底牌一决胜负。这时，牌面最大的人可赢得桌面所有的筹码。

这个时候应该怎么玩？手里拿到了大，中，小牌时应如何应对？
1、拿到大牌时，一定想办法赢得更多，诱敌深入，加注；
2、拿到中牌时，直接翻牌，胜面不大的前提下，无论输赢，降低风险；
3、拿到小牌时，必须加注！为什么呢？从两方面来看。一方面，不加注，必输，加注可能赢；另一方面，要让对方搞不清自我的套路，兵者诡道也，让对方猜不出我是大牌加注还小牌加注。
这是博弈论在比大小中迎面比较大的策略。

至此我才知道，原来声名赫赫的博弈论最初是从游戏中发展而来的，是在既定的规则下，双方心理和智力的比拼。

博弈论中有意思的模型

囚徒困境

故事内容是，两个嫌疑犯(A和B)作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白则各判8 年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年；如果都不坦白则因证据不足各判1年。

· 若对方沉默，坦白会让我获释，所以会选择坦白。
· 若对方坦白指控我，我也要指控对方才能得到较低的刑期，所以也是会选择坦白。

这就是著名的囚徒困境，这个故事反映个人最佳选择并非团体最佳选择。

知道囚徒困境有什么用呢？如何破解囚徒困境？
囚徒困境用数学语言描述就是两个条件：
1、背叛诱惑＞合作报酬。在这里，合作报酬是判刑1年，而背叛诱惑却是立即释放。
2、受骗支付＞背叛惩罚。在这里，背叛惩罚是判刑8年，而受骗支付却是判刑15年。

看到这里，破解之法就显而易见了，我们只要让“背叛诱惑＜合作报酬，受骗支付＜背叛惩罚”就可以了。

背叛诱惑＜合作报酬。即你帮大哥顶罪，家里的妻儿老小大哥都会帮你照顾，而且等你出来还会给你一笔钱；
受骗支付＜背叛惩罚。即如果你敢揭发大哥，小心你全家性命。
纳什平衡

是指在一个博弈过程中，无论对方采用什么策略，我都会选择某个确定的最优策略，在这个博弈中谁单方改变策略，谁就会损失，纳什平衡就是这种博弈的稳定结果。

囚徒困境就是一个很好的例证，它是一个坏的纳什均衡。

学习纳什平衡有什么用呢？如何破解坏的纳什平衡呢？

还是以囚徒困境为例，如果两个嫌疑犯事先有约定，都不坦白，如果有人背叛，则外面的其他兄弟会惩罚他。
即用制度去制约坏的纳什平衡，让其向好的方向发展。生活中的商业战争也是一样，要善用协议约束，避免坏的纳什平衡，实现共同利益最大化。
智猪博弈

两头猪，一头大猪，一头小猪，在一个狭长的猪圈中，踏板和食槽在两端，踩下踏板食槽供食，一只猪踩踏板另一只猪就能坐享其成先吃，而踩踏板需要消耗能量。

具体情况如下：
如果两只猪同时踩踏板，同时跑向食槽，大猪吃进7份，得益5份，小猪吃进3份，实得1份；
如果大猪踩踏板后跑向食槽，这时小猪抢先，吃进4份，实得4份，大猪吃进6份，付出2份，得益4份；
如果大猪等待，小猪踩踏板，大猪先吃，吃进9份，得益9份，小猪吃进1份，但是付出了2份，实得-1份；
如果双方都懒得动，所得都是0。

这里的纳什平衡是：大猪踩踏板，小猪不动。明显是个小猪占优的策略。

了解智猪博弈有什么用呢？这个故事给了我们什么启示？

如果把大猪比作大企业，小猪比作小企业，小企业要懂得合理搭便车，实施“占优策略”分得市场。大企业要懂得利用专利保护等制度设计，制约小企业占便宜。
公地悲剧

什么是公地悲剧？
在公共草原上，每个理性的牧羊人都追求个人利益最大化。但多放牧会带来两个结果，一是增加单只羊的收益，二是增加草原的负担，可能导致过度放牧。但因为草原是公共的，每个牧羊人无法限制其他牧羊人的放牧，自己不放牧资源也会被其他人占用，每个人都追求个人利益最大化，导致过度放牧，草原退化，这就是公地悲剧。

了解公地悲剧有什么用？如何破解公地悲剧呢？

了解公地悲剧的根本原因是公共资源不占用就吃亏的感觉，每个人都想占便宜，这种捞一把的心态导致了公地悲剧。
用两个方法去破解，一是公地私有化，就像小岗村，分田到户。公地私有化后人们就失去了捞一把的心态；另一个是强监管，通过公共资源有偿使用、许可证使用来管制，避免公地悲剧。
重复博弈

是指同样结构的博弈重复许多次，它可以是对称信息的博弈，也可以是不对称信息的博弈；

了解重复博弈有什么用？

理解了重复博弈，才不会在意一城一池的得失，用时间的维度的丈量成败。诚信是一种与这个世界重复博弈的心态。
当双方是一锤子买卖时，很可能宰你没商量。但如果把一次博弈变成重复博弈，总体利益就能抵抗住短期诱惑，大家就会更讲诚信。
不完全信息博弈

区别于囚徒困境、纳什平衡、智猪博弈、公地悲剧这些完全信息博弈，现实生活中很多博弈是不清楚对手的信息和策略的，像这种不了解对象特征、规则、策略等信息的博弈称为不完全信息博弈。

了解不完全信息博弈有什么用？

在我们了解对方特性、游戏规则和常用策略的情况下，我们会如何博弈，当没有这些信息，或者彼此不清楚对方是否知道这些信息的时候，如何博弈？

了解不完全信息博弈，可以通过制造信息不对称，获得策略优势，例如“空城计”。也可以通过特定方法，刺探对方军情，打破信息不对称，为我方争取策略优势，如“木马计”
维护和打破信息不对称，是双方的重要策略。
拍卖博弈

一架满载飞机，有几位重要旅客急需搭乘，如何用最少的代价，让其他旅客让出座位呢？
用拍卖博弈的策略，由低到高叫价，先叫先得。由于旅客彼此不知愿意下飞机的代价是多少钱，害怕错失机会，都会抢先同意举手。于是这种策略付出的代价最小。

拍卖博弈有什么用？

善用这种“不完全信息博弈”，激发博弈者们“自相残杀”，让时间最不值钱的旅客下飞机，获得最高收益。
零和博弈

是指参与博弈的双方在严格竞争的环境下，一方获益必然导致另一方损失，获益和损失之和永远为零。双方不存在合作可能。

学习零和博弈有什么用？如何避免零和博弈？

零和博弈会导致你死我活的内部竞争，但往博弈中加入增量，零和博弈就会变成正和博弈。先确定“存量分配规则”、“利益分配机制”，不容博弈发生，打开封闭系统，注入新的元素，这样创业公司才不会只盯着已经赚得的钱如何分，而是在既定利益分配机制的前提下，想如何扩大盘子赚更多的钱。
一报还一报

美国密西根大学教授罗伯特·阿克塞尔罗德做了一个博弈实验，他写信给不同背景的学者，请他们把应对“囚徒困境”的策略写成程序，让这些程序捉对厮杀，经过十几万次的重复博弈，最终“一报还一报”的策略获得了胜利。

这个实验让我更加坚定，在生活中要秉持善行，用惩罚回报恶行，用善行回报善行；
在没有被欺骗之前永远不要主动欺骗他人。如果对手选择背叛，立刻反击。如果对手补偿，不计前嫌继续合作。这样的清晰规则会激发对手的合作动机。是长期博弈最有利的策略。

写在最后，最近写作的过程中我的观念又发生了些变化，是受我的 parter 黄sir 的影响（哈哈，我自己偷偷给她取的外号）。我一直喜欢写大而全的东西，但这种东西真的不好写，容易铺的太广而写不透，而且很烧脑。

她是每天坚持写作，而且最近看她的文章写的越来越好，我们都订阅了老师的专栏，而我可能听听就过了，她会听完记下来，而且结合到自己生活中的小事，写出感想。这点触动了我。所以我想试试，从一个个小灵感小启发开始写，积累一个个小故事，一次只说清楚一件事。

博弈论

你可能感兴趣的:(博弈论)