关于两孩悖论的一些思考

两孩悖论又称为男孩女孩悖论(Boy or Girl Paradox),这是一道关于概率的数学应用题,题目简单到只有一句话:

已知一个家庭有两个孩子,其中一个是女孩,求另一个也是女孩的概率。

但就是这样一道题却难倒了无数的人其中甚至包括一些数学家,而我之所以会接触到是因为最近读的两本书——加里·史密斯在他的《简单统计学》一书中对列纳德·蒙洛蒂诺在《醉汉的脚步》一书中对该题的解答进行了反驳。前者是耶鲁大学统计学课程的教授,而后者更是霍金的挚友与其合著过《时间简史》(普及版)和《大设计》,并且自身就是顶尖的物理学家及科普作家,我的书架上躺着他的《潜意识》一书,至今仍未完全读懂。

为什么他们会有如此大的分歧,这点令我十分好奇。让我们先来看看蒙洛蒂诺对该题的解读,他的解题过程中用到了统计学常用的样本空间,首先是两个孩子的性别构成可能为:(女孩,女孩)、(女孩、男孩)、(男孩、女孩)、(男孩、男孩)。该样本空间与扔硬币的正反面类似,数学家给其取了个名字叫做“同构性”。基于此我们得出的样本空间分布如下:

接下来题目里包含一个已知条件概率也就是其中一个是女孩,因此可以将两个男孩的情况排除,因此样本空间发生了变化:

此时样本空间减少为3,已知一个女孩求另一个也是女孩的概率,等同于两个都是女孩的概率,也就是1/3,这是蒙洛蒂诺的观点。

到这里似乎逻辑没有问题,那接下来让我们看一下史密斯是如何反驳的,他提出的观点是当以上逻辑成立时,那么它也适用于已知其中一个是男孩的情况。在这种情况下,我们可以排除(女孩,女孩)的可能性,认为拥有一个男孩和一个女孩的概率也是2/3,因此无论已知是男孩还是女孩,拥有一男一女的概率都是2/3。史密斯认为这种说法显然是错误的,因为根据常识来看这个概率应该是1/2:

史密斯将两种已知男孩或女孩的可能性绘制成了如下这张表:

根据该表得出如下结论:无论已知的是女孩还是男孩,他的另一个孩子是男孩或者女孩的概率都是相等的,也就是说,已知一个女孩(或男孩),另一个也是女孩(或男孩)的概率是1/2。

此外史密斯还补充了针对专家根据之前逻辑提出的,如果我们已知女孩比另一个孩子年长的话,那另一个孩子也是女孩的概率就会从1/3提升到1/2,因为顺序一旦固定,也就可以排除(男孩、男孩)和(男孩、女孩)的情况。如下图所示:

他认为这也是错误的,因为如果知道女儿年长可以将两个女儿的概率从1/3提升到1/2的话,那么同理知道女儿年幼也一样,但是这个女孩一定不是年长就是年幼,在这两种情况下,两个女儿的概率都会从1/3提升到1/2。因此他认为即使我们不知道这个女孩年长还是年幼,概率都是1/2。

此外蒙洛蒂诺还提出一个观点,如果这个已知女孩有一个自己拥有的独特名字,比如佛罗里达,那么这种做法也会将两个女孩的概率从1/3提升到1/2。我们用女孩F表示“名叫佛罗里达的女孩”,女孩NF表示“名字不是佛罗里达的女孩”,这样初始样本空间变的稍微复杂一些:

根据加入已知其中一个女孩名为佛罗里达这一条件精简后如下:

考虑到父母会给自己孩子取同名的概率极低,几乎可以忽略不计,因此可以排除掉:

最终得出的结论也是由原来的1/3提高到了1/2。不过史密斯仍旧对此进行了反驳,他认为如果该说法是正确的,那将适用于任意名字,那么这个名字是什么并不重要,我们是否知道这个名字也不重要,他认为这里没有悖论,只有歪曲的逻辑。

故事到这里暂告一段落。简单谈一下我的看法,由于我是先看的反驳意见也就是加里·史密斯的观点,当时看下来觉得并没有什么问题,但是他驳斥的这些专家的观点里除了蒙洛蒂诺外,还包括另两位数学家马丁·加德纳和约翰·艾伦·保罗士(John Allen Paulos),很好奇这些大神们难道都错了?于是我又拜读了蒙洛蒂诺关于这个问题的解释,逻辑上也毫无破绽,但是两者的分歧显而易见:一个认为是1/3,一个是1/2。难道这道题就是传说中的二律背反?

带着这些疑惑特地去请教了我的好友宝玉老师,他的解释瞬间启发了我:两者从某种意义上来说都没错,蒙洛蒂诺基于条件概率,而史密斯则是基于独立的概率。带着这个解释我再次审视了两本书中关于这个问题的描述,终于在史密斯的观点中抓住一些破绽:他认为已知的是女孩还是男孩并不重要,因此可以忽略不计。而事实上是男是女这个已知条件的设定确实不重要,但是有没有这个已知条件很重要。没有这个条件的样本空间为4,而有了这个条件,无论条件是什么,样本空间都会发生改变,即排除掉一个变为了3,因此会影响最终的答案。

显而易见我更偏向于蒙洛蒂诺的推导和解释,因为他运用了贝叶斯方法,这也正是该方法之所以在眼下的大数据分析和机器学习中占有极为重要的一席之地的原因所在:也许不同的可能结果具有不同的发生概率这一事实,会使得问题变得更加复杂,甚至还会与我们的常识相悖。不过我们可以通过细致的计算,为每个可能的结果赋予一个适当的概率,从而解决这一问题。

你可能感兴趣的:(关于两孩悖论的一些思考)