信息对称下的博弈

博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。

博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学[1]、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。

这周主要介绍一下在信息对称条件下的博弈论，以及在生活中的应用。

在讲博弈论之前，就不得不先提一下帕累托最优（或者叫帕累托效率），人类社会的高度发展离不开人与人之间的高度协作，帕累托最优往往更适用在内部范围探讨，在双方建立充分的信任的基础之上的，这种“公平与效率的理想王国”，谈的是合作，但促进人类发展的不光只有协作，还有竞争。

亚当斯密是古典经济学的创立者之一，他主张自由贸易，在市场这只无形的手的调节下，个体追求私利的行为，是在促进社会的财富增长。

约翰·纳什是一位经济学家，同时还是博弈论的创始人，说这些可能大家还都有点儿陌生，《美丽心灵》的主人公的原型就是他。他的理论在后来被成为“纳什均衡”。

纳什均衡，简单来说，就是一种博弈的稳定结果，谁单方改变策略，谁就会损失。

生活中到处都是“纳什均衡”的例子：比如我国成立初期，大家一起吃大锅饭，于是所有人在没有有效监督的情况下，偷懒就成了农民的“最优策略”，这就形成了一个”坏的纳什均衡“。

解决这个的问题的方法，就是通过制度的改变，“包产到户”，让你偷懒分不到别人的劳动成果，农民的“最优策略“就是辛勤地劳动。

经济学课上讲到了，每个人都会追求个人利益的最大化，反过来也可以说每个人在追求个人损失最小化，而这个损失最小化的行为，往往就会形成“坏的纳什均衡”。

个人认为，当预期结果在我可控的情况下，人会追求个人利益的最大化，但是，在个人不可控的情况下，比如与不充分信任的人合作时，有时就会更倾向于追求个人损失最小化。

下面，我们通过一个例子了解一下纳什均衡的两方博弈：

在零售行业中，很多商家相互之间不断的竞争博弈，有时大打价格战，就好比是七伤拳，伤人又伤己，这个时候，一些巨头就会坐下来谈判，制定协议，建立信任，这个时候，托斯拉就应运而生。

托拉斯，英文trust的音译，垄断组织的一种高级形式，一些巨头通过建立一种对他们有利的纳什均衡，从而在市场没有出现可替代品之前，形成一种短期的利润最大化。

这个时候，政府可能就要出来干预了，说这种赤裸裸的垄断是不可以的，于是他出台《反垄断法》，打破这种价格联盟。

我们学过经济学的人都知道需求曲线，没有什么需求是刚需，当你通过垄断涨价，必需品就会成为奢侈品，薛老师在专栏中说过，即使是垄断，也会由市场最终作出调节，让最终的价格趋于正常化，但市场的反应时间并不总是那么迅速，又价格上涨出现的需求降低并不是瞬间的，替代品的出现也不是一朝一夕的，在这个过渡期，商家就可以赚的盆满钵满，而政府在观察到这个现象后，如果想改变这个纳什均衡的方向，就必须制定相应的策略，但我们知道，凡政策必遭遇对策，现实与预期往往有很大的差距，如何与利益集团进行博弈，也成了政府的必修课之一。

政府希望通过制定政策，形成对消费者有利的纳什均衡，而商家之间的联盟，就是跟竞争对手之间，形成一种有利于自身的纳什均衡。

看完纳什均衡，你有什么感受，有没有找到之间生活工作中对应的例子呢？

接着我们再来讲一下著名的囚徒困境

两个共犯被抓住，并进行审讯，在没有提前沟通的情况下，他们面临下面的选择。

如果我们光看这幅图，根据帕累托最优，他们的最佳方案就是两人都选择沉默，这样两人都只需要服役1年。

审讯者和囚徒之间，审讯者会刻意制造信息不对称，甲乙双方也没有做好沟通，并且没有绝对的信任，怕对方会出卖他，无法商量出这个合作解的帕累托最优。这个时候，这个纳什均衡就会倒向，两人同时服刑8年。

在这个博弈中，我们可以看到两点：

1、对于单个囚徒来说，背叛的诱惑（坦白）大于合作的报酬（判一年）

2、而受骗需要支付15年，大于背叛的惩罚8年

都背叛，是这个囚徒困境中唯一稳定的纳什均衡。

如果两个囚徒是隶属于一个黑社会组织—意大利黑手党，那么这个黑帮就要想办法破局，从制度上创造最利于自己的结果，也就是从上面两点出发。

一、提高合作报酬，比如：照顾好囚徒的家眷，创造其在监狱里更高的地位。

二、提高背叛惩罚，威胁他，背叛的话会在牢里被暗杀，妻儿不保。

囚徒困境为我们提供了一种改变纳什均衡的思路

智猪博弈

"智猪博弈"由约翰·纳什(JohnFNash)，1950年提出。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪选择等待的话，在大猪返回食槽之前，小猪可得到4个单位的纯收益，大猪到达之后只能得到剩下的6个单位，实得4个单位；而小猪和大猪同时行动的话，则它们同时到达食槽，分别得到1个单位和5个单位的纯收益；在大猪选择等待的前提下，小猪如果行动的话，小猪在返回到达食槽之前，大猪已吃了9个单位，小猪只能吃到剩下的1个单位，则小猪的收入将不抵成本，纯收益为-1单位，如果大猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

小猪的收益：小猪行动，大猪不行动<小猪大猪均不行动<小猪大猪一起行动<小猪不行动，大猪行动。

在这种博弈中，小猪明显占据优势，在商业世界中，有很多的小猪都等着搭大猪的这个便车，来获取自身的最大收益。

比如：新技术产品，大公司花巨资研发，并砸钱打广告，结果山寨产品几乎在一夜之间就出来，山寨公司的这种行为就是搭便车，严重损害了大公司的利益，虽然这是公司之间的市场行为，但是小公司的这种行为，是不利于创新和良性发展的，小公司仿制没有任何的风险，大公司的利益受损，会严重的打击大公司创新的积极性。

这种特殊的“纳什均衡”，是不利于创新和发展的，所有政府会制定一些专利保护等相应的制度，来掣肘这种“小猪心态”。

但即便有相应的政策，很多在创业初期的小公司，还是会利用一些漏洞来搭便车，这是很多公司采用的策略，商业世界，永远是在不停地博弈。

公地悲剧：由英国教授加勒特·哈丁在1968年率先提出

公地作为一项资源或财产有许多拥有者，他们中的每一个都有使用权，但没有权利阻止其他人使用，而每一个人都倾向于过度使用，从而造成资源的枯竭。过度砍伐的森林、过度捕捞的渔业资源及污染严重的河流和空气，都是“公地悲剧”的典型例子。之所以叫悲剧，是因为每个当事人都知道资源将由于过度使用而枯竭，但每个人对阻止事态的继续恶化都感到无能为力。而且都抱着“及时捞一把”的心态加剧事态的恶化。公共物品因产权难以界定而被竞争性地过度使用或侵占是必然的结果。这一个概念经常运用在区域经济学，跨边界资源管理等学术领域。

公地悲剧，是人们自私的避免损失最小的短期策略，导致公共资源走向耗尽，是一种典型的坏的“纳什均衡”。

来说一个身边的简单例子。

单位院子里绿化带种了很多果树，你每天上班都会路过，眼看着果子一天天成熟，最优的策略是等果子熟透了大家一起分了，但是每次果子还没熟透，就已经被人摘完了。

公地悲剧其实不光是对公共资源比如海洋、空气、草场造成危害。其实很多公司在不经意的制度设计中，也会产生一些“公地悲剧”政策。比如公共资金池，各个部门都会优先申请，出于“反正我不用，就被别人用了”的心态，造成一种资源的浪费，影响公司的收益。

所以，在对公共资源制定政策时，就要考虑如何避免公地悲剧的发生。

重复博弈

这个我就不引用度娘的定义了，重复博弈是相对一次博弈而言的，我举几个简单的例子。

前几年炒的沸沸扬扬的天价青岛大虾事件，对游客来说，强龙不压地头蛇，来过一次这辈子再来的可能性本身就微乎其微，而对商家来说，知道游客的心态，多一事不如少一事，一次博弈就是最优的博弈策略。

而当我们去菜市场买东西，就不会遇到这种情况，菜市场面对的是周边生活圈的人，当你跟老板讨价还价时，老板会告诉你，我又不是在这里第一天做生意，我肯定希望你还来买，不会卖你贵的，这就是典型的重复博弈。

我们再来看下微商和淘宝卖家的区别，很多微商其实采取的就是一次博弈，逮住一个往死里宰，而淘宝网的点评系统，其实就是让商家杜绝一次博弈，提供优质的产品和服务。

从某种角度来说：诚信就是在商业世界重复博弈的一种心态。

以上内容部分来自刘润《五分钟商学院》，同时加入了自己的案例和理解，下次再讨论信息不对称条件下的博弈。

信息对称下的博弈

你可能感兴趣的:(信息对称下的博弈)