五理性人

看到不少人对@曾加的答案表示没看懂,试试写出自己的推论过程。
对条件的解读:

  • 5名囚犯都是聪明理性的,并且彼此之间知道这一点;
  • 没有保命希望的情况下,尽量多杀人;
  • 在有被杀的可能时,选择必然能保命的策略;

从一个简单的点开始切入:在有充裕选择的情况下,没有人会主动选择最小值。
对前面四个人来说,考虑优先排除E的选择权,强制E成为最小值,可以降低自身被杀风险。
用Ye来表示轮到E选择时所有的豆子数目,则考虑前四人使得Ye=1的情况,我们将这看作A、B、C、D在没有交流的情况下达成了 共识一

对D来说,对共识一的坚持:
Yd = 2时,只能选1个,Yd=Ye=1,D和E为最小值,死亡。
Yd在[3,25]之间时,A、B、C选择之和最小为75,则至少有一人的选择大于等于25,D只需要留给E一个,取走其他所有豆子,即可保证自身生存。
Yd大于25时,D如果只留给E一个,自身有死亡的可能(比如A、B、C取 25、24、24,Yd=27,D取26个使Ye=1,自身由于最大值死亡),放弃共识一。

对C来说,共识一的基础在于满足自身存活的情况下满足D达成共识的基础:
Yc=3时,只能选1个,Yc=Yd=Ye=1,后三个都死。
Yc在[4,34]之间时,A、B之和最小为66,至少有一个比32大,根据“保证自身存活时多杀人”的原则,C只留下2个给D,确保D和E为最小值死亡。
Yc在[35,49]之间时,C只需要使得Yd落在[3,25]之间即可。如Yc=49时,A、B之和为51,C可取25使得Yd=24。
Yc大于等于50时,以50举例,C的最大安全值取24,Yd为26,D会放弃共识一。

我们依照这个推下去,发现共识一达成的基础是A成为最大值死去。A明显不同意,于是前4人再度提出 共识二:不要求Ye=1,只要求Ye最小。

很容易发现共识二的最极限情况是 21,20,20,20,19,即使得Ye=19时,E无论选多少个,还是以最小值的身份死去。A还是需要以最大值的身份死去。

共识一和共识二无法达成,但是我们发现,在A 选择区域[21,96]之间的数值时,每个人的选择策略是确定的,死亡人数是确定的,在A做出选择的时候,结果就已经产生了,即@曾加答案中的 推论一

当A选择20时,B、C、D选择不超过A的最大值19、19、19,Ye=23, 推论一中E不具有选择的权利,必然会以最小值身份死去的情况改变了,他可以选择以最大值身份去死或者以最小值身份去死(残酷的选择),根据“没有保命希望的情况下,尽量多杀人”这一原则,他会拉更多人下水,选择20或者19,杀掉所有人。

当所有人的生死掌握在E手中时,B、C、D为了避免上面的这种情况,需要做出“欺骗”,偏离A值的同时又避免自己成为最大或者最小值。
对E来说,最优策略永远是取前者平均值,以此可推D、C,使得B无论如何进行“欺骗”,都无法避免自己和A死去,即@曾加答案中的 引理3

有趣的是,A怎么选都没有存活的概率,根据“没有保命希望的情况下,尽量多杀人”的原则选96让所有人同归于尽的情况,同样也会被其他人知道。

五个人都知道理性的情况下A没法生存,而A没法生存的情况下大家都得死。是否可以延伸出来另一个问题,在允许五个人之间讨论联盟的情况下,谁可以找出一个必能让自己生存的策略,并能在这种策略下杀掉最多的人?

你可能感兴趣的:(五理性人)