五理性人

看到不少人对@曾加的答案表示没看懂，试试写出自己的推论过程。
对条件的解读：

5名囚犯都是聪明理性的，并且彼此之间知道这一点；
没有保命希望的情况下，尽量多杀人；
在有被杀的可能时，选择必然能保命的策略；

从一个简单的点开始切入：在有充裕选择的情况下，没有人会主动选择最小值。
对前面四个人来说，考虑优先排除E的选择权，强制E成为最小值，可以降低自身被杀风险。
用Y_e来表示轮到E选择时所有的豆子数目，则考虑前四人使得Y_e=1的情况，我们将这看作A、B、C、D在没有交流的情况下达成了 共识一。

对D来说,对共识一的坚持：
Y_d = 2时，只能选1个，Y_d=Y_e=1，D和E为最小值，死亡。
Y_d在[3,25]之间时，A、B、C选择之和最小为75，则至少有一人的选择大于等于25，D只需要留给E一个，取走其他所有豆子，即可保证自身生存。
Y_d大于25时，D如果只留给E一个，自身有死亡的可能（比如A、B、C取 25、24、24，Y_d=27，D取26个使Y_e=1,自身由于最大值死亡），放弃共识一。

对C来说，共识一的基础在于满足自身存活的情况下满足D达成共识的基础：
Y_c=3时，只能选1个，Y_c=Y_d=Y_e=1，后三个都死。
Y_c在[4,34]之间时，A、B之和最小为66,至少有一个比32大，根据“保证自身存活时多杀人”的原则，C只留下2个给D,确保D和E为最小值死亡。
Y_c在[35,49]之间时，C只需要使得Y_d落在[3,25]之间即可。如Y_c=49时，A、B之和为51，C可取25使得Y_d=24。
Y_c大于等于50时，以50举例，C的最大安全值取24,Y_d为26，D会放弃共识一。

我们依照这个推下去，发现共识一达成的基础是A成为最大值死去。A明显不同意，于是前4人再度提出 共识二：不要求Y_e=1，只要求Y_e最小。

很容易发现共识二的最极限情况是 21,20,20,20,19，即使得Y_e=19时，E无论选多少个，还是以最小值的身份死去。A还是需要以最大值的身份死去。

共识一和共识二无法达成，但是我们发现，在A 选择区域[21,96]之间的数值时，每个人的选择策略是确定的，死亡人数是确定的，在A做出选择的时候，结果就已经产生了，即@曾加答案中的 推论一。

当A选择20时，B、C、D选择不超过A的最大值19、19、19，Y_e=23, 推论一中E不具有选择的权利，必然会以最小值身份死去的情况改变了，他可以选择以最大值身份去死或者以最小值身份去死（残酷的选择），根据“没有保命希望的情况下，尽量多杀人”这一原则，他会拉更多人下水，选择20或者19，杀掉所有人。

当所有人的生死掌握在E手中时，B、C、D为了避免上面的这种情况，需要做出“欺骗”，偏离A值的同时又避免自己成为最大或者最小值。
对E来说，最优策略永远是取前者平均值，以此可推D、C，使得B无论如何进行“欺骗”，都无法避免自己和A死去，即@曾加答案中的 引理3。

有趣的是，A怎么选都没有存活的概率，根据“没有保命希望的情况下，尽量多杀人”的原则选96让所有人同归于尽的情况，同样也会被其他人知道。

五个人都知道理性的情况下A没法生存，而A没法生存的情况下大家都得死。是否可以延伸出来另一个问题，在允许五个人之间讨论联盟的情况下，谁可以找出一个必能让自己生存的策略，并能在这种策略下杀掉最多的人？

五理性人

你可能感兴趣的:(五理性人)