Yale开放课程博弈论16

16. 落后的感应------声誉与决斗

回顾上节课最后的例子,垄断者与欲进入市场者的博弈,经过我们的分析可以得到2个纳什均衡(in, NF)和(out, F),下面我们来做个游戏:

现在假设埃里同学有家连锁的匹萨店垄断着市场,另外10个同学都伺机进入该市场,老师依次问这10个同学选择是否进入市场,然后问埃里是否会对他们进行打击。结果是1选择进入,被打击;2、3、4、5、6选择不进入,7、8选择进入均被打击,9、10都选择不进入。

实际上如果10选择进入的话,埃里是不会打击的。


上节课中在单个市场上分析,每个公司都应该进入,但是第一个进入市场的埃里会选择攻击,这样之后的可能就不敢进入了。

但是这里有个问题,这是一个序贯博弈(信息完整的),我们可以采用逆向归纳法进行分析:对于最后一个进入者,埃里是不会攻击的,因为后面没有人了,他已经没有建立威胁的动机了;而对于倒数第二个进入者,他应该进入,埃里按道理是不会攻击的,因为第十位进入者无论如何埃里都不会打击,这里也没有建立威胁的动机了;……;这样依次往前推,我们发现这10个同学都应该选择进入。


假设埃里有百分之一的概率是好斗的人,只有一个市场,根据收益看他可能不会攻击,但是十个就不一样了。一旦前面有人进入市场后被攻击,后来者就会放大埃里好斗的概率。所有这一切都是小小的可能性导致的。

假设埃里有百分之一的概率是好斗的人,他就可以以疯狂的名义吓退进入者,即使他是一个冷静理性的人,他也会装疯。这种情况可以采用混合均衡来考虑。

这就是有名的连锁店博弈(理论来自诺贝尔获得者谢尔顿)。


结论:

1. 即使是一个很小的概率,小小的可能会彻底改变博弈的结果

2. 关于声望的问题。

人质解救谈判,你一定不要和绑架者谈判,因为一旦这个绑架者谈判成功,社会上会有更多的绑架者。

预测下次有人在博弈论方面获得诺贝尔奖应该是关于声望的。

 

接下来玩个游戏,游戏规则:两个参与者面对面在一定距离的位置站好,每人一个海绵块,每次可以选择向对手扔海绵或者向前走一步。每个人只有一个海绵,扔了之后就没了,若扔了之后击中对方,则赢得比赛,没中则游戏继续。

 

这个博弈叫决斗Duel

类似的还有环法自行车比赛中,超车的时机选择。两家公司研发同一产品,市场只能容纳一个,面世太早,可能不能正常运行,太晚,市场又会被占有,如何选择面世时机?

 

这里的决策不再是我该怎么做,而是何时去做。

 

Pi[d]表示选手i在距离d时击中对手的概率,假设距离为0时击中概率为1,距离越远,击中的概率越低。每位参与者不仅知道自己在每个点击中对方的概率,也知道对方在每个点击中自己的概率。假设选手1在每个距离击中的概率都比选手2高一点点。(概率曲线图略)

 

那么我们来猜测一下两个选手究竟谁会先出手?

两种观点

1: 选手1该先出手,因为距离相同时他击中的概率更高;

2: 选手2该先出手,因为他知道选手1击中的概率,所以会在1出手前先出手;

 

这里我们利用两个论点:优势策略和逆向归纳法,进行分析。

 

事实A:假设还没有人投出,如果选手i知道在d点j不会投出,下一轮他会更近,那么他不该投出海绵(下一轮游戏不会结束且自己会有更好的机会)。

如果选手i在d点知道j接下来会在d-1点投出海绵,那么如果他在d点的击中率(Pi[d])大于或等于j下一轮在d-1点的失误率(i选手wait的话赢得的概率1-Pj[d-1]),即Pi[d]+Pj[d-1]≥1,他该投出海绵。

 

我们可以在两个参与者投中的概率曲线图中,从距离d往0移动,找到第一个满足上式的d*。则在大于d*时两人都是不会投出,因为再等一轮对自己更有利(优势策略),而当距离小于d*时,两人的选择应该都是会投出。

但是在d*点的时候,我们并不清楚两个参与者是怎么想的。

接下来看看逆向归纳法,在零距离的时候,1号肯定会选择投出;

在距离1时,2号认为1号在0位置的时候会投中自己,所以2号会投出;

在距离2时,应该投出(前提是满足上面的公式);

以此类推,在d*点无论是谁都应该投出。

 

假设两个参与者中一个是理性的,一个不是,即在他可能在你认为他不可能投出海绵的时候投出。结果应该怎样?不应该在d*之前,因为对自己而言在d*之前失手的概率更大。

 

可是现实中很多次进行这个游戏,大家都因为投的太早而输掉比赛,为什么我们看到了这么多的失误?

其一是人们过于自信,其二美国人有先下手为强的思想。

这里老师讲了一句道理:The aim in life is not to go down swinging, it's not to go down. So one lesson to get from this lecture is sometimes waiting is a good strategy.

你可能感兴趣的:(Yale开放课程博弈论16)