博弈论——真香!

博弈论又被称为对策论(Game Theory),既是现代数学的一个新分支,也是运筹学的一个重要学科。学习博弈论,可以指导我们这个充满竞争的世界中,我们要怎么做才能让自己(或者自己的集体)利益最大化。(摘自:百度百科)

博弈时往往有三种结果:负和博弈、零和博弈与正和博弈,用通俗的话解释就是两败俱伤、一方获利一方亏损和双赢。正和博弈当然是最好的结果,但是往往无法达成。

博弈论有很多的种类,我们介绍其中的几种。

一. 囚徒博弈论——为何走向穷途末路?


有一个广为流传的故事:两个罪犯甲、乙入室盗窃并将屋子的主人杀害,被捕后分别审讯,他们都只承认盗窃罪,不承认故意杀人罪,这样他们都会被判处1年有期徒刑。这似乎对他们来说是最好的情况,但是后来他们却纷纷承认故意杀人罪,为什么呢?
博弈论——真香!_第1张图片

原因很简单:他们是分开审讯的。

假设盗窃罪判刑1年,故意杀人罪判刑8年,被别人揭穿会加刑1年,坦白减刑2年,那么就可以绘制一个简易的博弈论模型:

博弈论——真香!_第2张图片

图真是太不美了(●—●)

明明可以少坐6年牢,为什么要招供呢?不妨从甲和乙的角度来考虑:由于不知道对方的消息,甲会认为,我不知道能不能相信乙,万一他先招供了,我就会坐10年的牢,为了不引起最坏的后果,还能够释放,我必须先招认!同样的,乙的想法和甲类似,再加上警察煽风点火,于是便纷纷招供,最后的结果是两人一起坐7年的牢。

博弈论——真香!_第3张图片

这就呈现了所谓博弈论中的“纳什均衡”,简单来说是如果参加博弈的一方不改变策略,另一方就无法得到更好的结果,往往走向负和博弈,有兴趣的小伙伴可以了解一下 qwq

这就是最经典的囚徒博弈论。

二.枪手博弈论——弱者的生存法则


故事是这样的:三个枪手(大佬,蒟蒻,我)积怨已久,决定进行一场决斗。当然,他们不是机器人,枪法有一定的差别(即使是大白也不会百发百中的),大佬是个神枪手,命中率是80%,蒟蒻差一些,命中率是60%,我最菜了。。。༼༎ຶᴗ༎ຶ༽命中率只有40%(这是不是和我不常刷题有关(;д;))如果在每人一枪只打出1颗子弹,且击中必杀,大家都保持绝对理性的前提下,出现了两个问题:

1.如果我们三个人同时开枪,谁活下来的概率会最大?
2.如果我们轮流开枪,采用什么策略活下来的概率会大?

首先讨论第1个问题,如果我们同时开枪,大佬一定是会把枪口对准蒟蒻的(他都是大佬了,不可能出现低级失误233),因为蒟蒻的命中率要比我高,他一定要先杀死对自己威胁大的那一个人。而蒟蒻会向大佬开枪,道理和大佬相同,我呢,自然把枪对准了大佬。这时来看一下3人的存活率,大佬是24%,蒟蒻是20%,至于我呢,因为没有人瞄准我,所以我的存活率是100%。这时,最菜的我反而成了存活率最高的人呢。( • ̀ω•́ )✧

博弈论——真香!_第4张图片

好了,现在讨论第2个问题,如果我们轮流开枪呢?

  • 大佬先开枪
    依照“先杀死威胁大的目标的原则”,大佬自然要把枪口对准蒟蒻,如果杀死了……(此处省略血腥内容)如果没杀死呢,蒟蒻自然会向大佬开枪,全程我可以毫发无埙。这时,我再拿起枪,瞄准剩下的一个目标,(或者两个目标都活着的话就朝天)开一枪,娱乐一下,胜率我仍然是最大的。so easy!妈妈再也不用担心我打不准了
  • 蒟蒻先开枪
    蒟蒻会把枪口对准对他更具有威胁的大佬,我不会有危险,如果它命中了,我就向蒟蒻开枪,没打中就朝大佬开枪,最后我的存活率仍然是最大的。(  ´-ω ・)▄︻┻┳══━一
  • 我先开枪
    这是一个很让我纠结的问题,我该先向谁开枪呢?打大佬?没打中还好,会转化成大佬先开枪的情况(也难保他不记仇呀),万一RP不足手抖打中了呢,那就只剩下我和蒟蒻两人了,他一定会朝我开枪了,那我可就很危险了呀!不行不行,我可不能这么草率。那么如果朝蒟蒻开枪呢?那也是一样的,打中了反而会使自己置于更加危险的境地,因为大佬的命中率更高。打谁都不是,那么该怎么办呢?结论是:朝天开枪。Σ(゚д゚lll)这确实很滑稽,但也是最有效的方法,能够让情况变为大佬先开枪。所以博弈时往往要出奇策才能够取胜。
    不信的话大家可以试一下,三个砝码,一个骰子(虽然无法得到80%,60%和40%,但是可以先用一下),开枪时转动骰子,如果大佬转到1,2,3,4,5,那么他杀死了他的目标,蒟蒻转到1,2,3,那么他杀死了他的目标,如果我菜鸡转到1,那么我杀死了我的目标。

多试几次,看看谁的存活率大!

好了,我们继续狗血剧情,我们突然握手言和了,决定改日再战……(剧本太狗血,我编不下去了。。。)啊,反正就是这次我们没有决斗,然后呢,大家都想在下一次的决斗中把对方打趴下,回家苦练枪法,大佬的命中率提升到了100%(蒟蒻知道了吓得瑟瑟发抖),蒟蒻不甘落后命中率提高到80%,我太懒了也太菜了,命中率毫无提升,还是40%(我是一个比蒟蒻还弱的人)\( ´・∧・`)/ ,于是,按照领错了的剧本,我们又相遇了,又要决斗,那么按照刚才的情况推理,大佬向蒟蒻开枪,蒟蒻向大佬开枪,我向大佬开枪,大佬的存活率是12%,蒟蒻的存活率是0%(快给他准备一份便当!),我的存活率是100%,依然是最高的ヽ(≧∀≦)ノ,但是其余两人的存活率却发生了变化,这说明,只要任何数据发生变化,存活率都会发生巨大的变化。

本来故事要结束了,突然,导演(我怎么会告诉你那就是我?!)认为蒟蒻还应该有戏份,于是又让他们握手言和了(什么鬼?!)。这会大家(包括我啦)都意识到了枪法的重要性,开始苦砺枪法,命中率都提升到了100%,后来(你已经猜到了),我们又一次相遇了。这次每人只有一颗子弹,两个问题:

同时放枪,你会选择打人还是放空枪?
由我先开始放枪,我该打人还是放空枪?

博弈论——真香!_第5张图片

先讨论1,结束后无非4种情况:

(1) 自己活着,另外两个人去领盒饭了;

(2) 自己活着,另外一个人也活着;

(3) 自己和另一个人一起去领盒饭;

(4) 自己独自去领盒饭。

因为别人指向谁开枪是无法预测的,所以每个人的存活率是相等的,这时如果放弃开枪,就会让另外两人的存活率提高,所以这时应该朝任何一个人开一枪,至少不减小对他人的威胁,因为大家命中率都是100%,所以这时打谁就显得不那么重要了,朝一个人放一枪,听天由命吧。

再来讨论2,那就会有很大的不同,分情况讨论一下:

(1) 朝人开枪:必定杀死一人,然后场上变为两人,另外一人开枪,那么他必定会朝我开枪,然后就没有然后了。。。

不可取不可取,我还没演完呢,不能去领盒饭|。•ω•)っ

(2) 于是乎应该考虑另一种方法:放空枪。

一旦我打出了仅有的一颗子弹后,我对于另外两人便变得没有威胁了,这样轮到下一个人开枪时,他一定会朝另外一个人开枪,因为如果第二个人不打死他而是选择放空枪,下一回合他就会有50%的概率被干掉,这是不可取的。

这样就变成了一个另外两方自相残杀的局面,从而最后两个人活下来。

但是如果他识破了我的计谋要朝我放枪呢?那样他就一定会被第三个人打挂,还不如放空枪的存活率,他一定会打死第三个人。

综上所述,放空枪是最有利的选择。

博弈论——真香!_第6张图片

讲了这么多,大家心里应该有个疑问:

这讲的都是模型,有应用价值吗?

其实大家耳熟能详的历史中就有呀(~ ̄▽ ̄)~

三方对立,有强有弱,互相牵制,大家想到了什么?

对,是三国!

三国时期的赤壁之战,刘备最弱,孙权其次,曹操最强,曹操要和孙权干架,诸葛亮的想法是:二虎相争,必有一伤,如果曹操输了必定一蹶不振,孙权就会向刘备开刀,如果孙权被灭,曹操也必定会攻打刘备。这时刘备帮助较弱的孙权,将曹操打败,但是又“一不小心”让关羽把曹操在华容道放掉了,以达到制衡的目的。节省篇幅,这里战争细节就不扯了。这就是枪手博弈论的应用。

博弈论——真香!_第7张图片

那么为啥不帮曹操呢?

这是因为魏国实力更强,如果联曹攻吴,东吴很可能会被灭掉,蜀国为了避免不利情况出现,应该联吴抗曹,这样不足以将魏国消灭。

好了,导演要逃杀青了,下一集海盗分金见! qwqqwq

这一集TMD要剧终了

三.海盗分金博弈论——倒推取胜


这一讲跟海盗打仗无关!!!

故事是这样的:

5个海盗抢了100个金币(我说过跟打仗无关),准备分,但是他们分的方法非常奇特(为什么不平分?)他们准备了5个签,分别写上1,2,3,4,5,然后抽签,按抽签顺序(从小到大)轮流制定方案,从1号开始,他制定了分金方案后大家需要立即表决(该海盗也表决),如果有半数以上(含半数)的人支持,则方案通过,按此方案分金,否则(重口味的来了!)就会被扔到海里喂鲨鱼。

我们做如下假设:

每一个海盗都是绝对理性的,且思考周全,智商极高,不会做出错误判断。
不存在某些海盗私下结伙或有仇的情况。
海盗不会因为通过的提案对自己不利而大打出手。
所有海盗都不想去喂鲨鱼。
所有海盗都想获得更多的金币。
好了,现在如果你是1号海盗,你该如何使自己获得最大利益?

表面上看1号海盗是最不利的,因为他最有可能去喂鲨鱼,因为参与分金的海盗越少,越能获得更多利益,即使自己分文不取将金币全分给另外四个海盗,他们也仍然有可能会把他扔给鲨鱼。

怎么办?怎么办?怎么办?现在好慌呀!我不想喂鲨鱼!

博弈论——真香!_第8张图片

别急,咱冷静一下,再看一遍规则,你会发现一个突破点:

如果有半数以上(含半数)的人支持,则方案通过

咦,也就是说不需要获得所有人的支持呀?我只要笼络2个处于劣势的海盗就可以不喂鲨鱼了!不慌了!

可是,应该笼络谁呢?又该如何笼络呢?

这时往往会三等分,但是这对分到金币的另外两个海盗显然不是最佳方案,行不通呀。

这时大家可能会嫉妒5号,既安全又能分钱。

别急着嫉妒,请大家回去看一遍本小节的标题。

看完了吗?倒推取胜对不对?那我们就从简单的情况想起:

5号明显是最安全的,因为他没有喂鲨鱼的危险,但是他真的能分到钱吗?[・_・?]

倒推举例证明:

博弈论——真香!_第9张图片

假设只剩4号,5号两人,你、2号和3号都喂鲨鱼了(当然你不想这样),这时4号分金,他会怎么办呢,肯定会是100:0,表决时4号一定赞成,5号即使反对,支持人数也过了半数,表决结果是5号无法改变的,这样5号就会颗粒无收,这时他处于劣势,所以3号的提案里只要给他1枚金币,他就一定会赞成来避免自己的劣势情况,同样的,按照笼络劣势海盗原则,3号海盗指定的方案应该是99:0:1,放弃4号,笼络5号,这样3号,5号赞成,提议通过,5号获利1金币,不再处于劣势,处在劣势的变成了4号。

是不是有头绪了?我们再加上一个海盗,2号制定方案,应该笼络处于劣势的4号海盗,方案为:99:0:1:0(当然也可以笼络5号,方法不止一种),2号、4号海盗赞成,提议通过。劣势海盗为3号。

最后加上1号海盗,也就是我们,应该笼络谁呢,首先要笼络劣势的3号,放弃优势的2号,再在4号、5号之间任选一个,制定方案(一种例子,大家可以再想其他的)为:98:0:1:1:0,就可以通过。

没想到吧,看似最危险的1号可以化险为夷还能疯狂敛财,最安全的5号却可能颗粒无收,如果正思入手,很容易卡住,倒推却容易多了,大家要学会用。

当然,现实生活中大家或多或少都是非理性的,海盗往往宁可同归于尽也不会让1号拿走98枚金币的,所以这个模型仅供分析。

四.智猪博弈(佩奇和乔治的饲料之战)


↓智猪博弈↓

博弈论——真香!_第10张图片

故事是这样的:一大一小两只可爱的猪养在一个猪圈里,猪圈的一头有一个智能的猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有 10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9:1;同时到槽边,大小猪收益比是7:3;小猪先到槽边,大小猪收益比是6:4。这猪可是社会人呀,他们都想获得最大利益。

运用刚才讲到的囚徒博弈的模型构造法,再来搞一个可爱的模型:

博弈论——真香!_第11张图片

↓以下重点↓

不难发现对于小猪的最优策略是等待,如果这时大猪去按按钮,它能够获得最大的利益值4,这是他的最优策略。但是大猪没有最优策略,虽然他等待有可能获得9 的利益,但是小猪一定不会去按按钮(想一想,为什么?),所以为了不出现 (0,0)(0,0) 一起饿死的局面,只好去按按钮,小猪便乘坐“顺风车”,获得了最大值。

这个模型很好的反映了市场上的“搭便车”现象,请看下表:

博弈论——真香!_第12张图片

某大型企业为推广一款力推商品,花重金制作广告宣传,一个小型企业也推出了类似商品,上图为利润折线图。

不难发现小企业借大企业的宣传,也推广了自己的商品,这种不付出但是有回报的现象叫做“搭便车”。

而智猪博弈也对我们的做人有所启示:要做大猪,更要学会做小猪,才能长久发展

五.警匪博弈(入狱?or发财?全靠脸)

齐齐哈尔(我大齐帝国万岁)有两栋豪宅,分别是齐齐哈尔大土豪G大K和小土豪G小K,由于他们俩特别特别有钱,豪宅内的财产分别是200亿和100亿。同时有一个江洋大盗G大大大大K,会在这两栋豪宅间挑一栋下手,发一笔横财。当然,当地警察me早已得到了消息,将在当天在某个街区巡逻。我们在此假设一堆扯淡条件:

  • 小偷没有团伙
  • 警察只有一人
  • 齐齐哈尔市治安堪忧
  • 两人都不会分身【滑稽】
  • 两栋豪宅的主人都出门了,不会发现小偷;
  • 只要警察和小偷去了相同的街区,就一定会被警察抓住;
  • 两人中途不得变换街区盗窃/巡逻;
  • 小偷只要不被发现必定得手且会将盖房子内的价值全部偷走狮子大张口呀

问题:警察和小偷应该如何选择策略,始自己获得最大利益?

博弈论——真香!_第13张图片

看了这题,你的直觉是什么?应该是让警察永远巡逻洛咕首富的豪宅,这样至少可以保证200亿的资产不被偷,但是小偷只要去偷另一栋房子,就一定会得手,显然不是最优策略。所以怎么办呢?我们需要用一种聚天地之灵气百试不爽的杀手锏来解决这个问题了!它就是——

抽签!!!

对,抽签

就是抽签

手动滑稽
越说越没有底气的说

博弈论——真香!_第14张图片

挺直腰板继续扯淡
现在,我们来认(che)真(dan)的讲解一下这个过程:由于G大K家的财产是G小K的2倍,警察应该准备三个签,两个写上G大K(当然不是用来咒人),一个写上G小K,让后摇匀【滑稽】,抽签,抽到哪类签,就去那个房子巡逻。这样警察有2/3的概率去G大K家,1/3概率去G小K家

同样的小偷也可以采用同样策略。写的东西也一样,但是区别在于:小偷抽到了G大K的签,就要去G小K家偷东西,反之去G大K家,这样能够最大限度的保证自己不被捉。小偷有1/3的概率去G大K家,2/3去G小K家。

我们来算一下两人的收益:

警察: 2(2/3)(1/3)+1(1/3)(2/3)=2/3

原理:警察和小偷都去G大K家的概率是(2/3)(1/3)=2/9,都去G小K家的概率是(1/3)(2/3)=2/9,又因为G大K家的财产是G小K家的2倍,所以乘2,得到的是他的收益。

小偷: 2(1/3)(1/3)+1(2/3)(2/3)=2/3

原理和上方类似:小偷去G大K家,而警察没去的概率是(1/3)(1/3)=1/9,小偷去G小K家,而警察没去的概率是(2/3)(2/3)=4/9,洛咕首富家的收益再乘2,得到的是他的收益。

这显然是最大值了(别问我怎么看出来的)。

不知道大家看出来没有,这个模型的精华就是不按套路出牌,这也是唯一一个不存在策略均衡的博弈论分支。就像石头剪子布一样,瞎JB打就能赢(这类博弈论主要看脸QAQ非酋路过

大家学会了吗?鉴于大家都学的很认真【滑稽】,我来给大家额外讲一个博弈论故事:

博弈论——真香!_第15张图片
博弈论——真香!_第16张图片
博弈论——真香!_第17张图片

这个故事还是很有用的例子 qwq

博弈论的几个分支就讲到这里,希望对大家有所帮助!

拜拜咯!

你可能感兴趣的:(博弈论——真香!)