蒙特霍尔问题(选择三扇门后的车与羊)及其贝叶斯定理数学解释

1. 蒙特霍尔问题

有一个美国电视游戏节目叫做“Let’s Make a Deal”,游戏中参赛者将面对3扇关闭的门,其中一扇门背后有一辆汽车,另外两扇门后是山羊,参赛者如果能猜中哪一扇门后是汽车,就可以得到它。

通常,当参赛者选定了一扇门时,节目的主持人蒙特霍尔(Monty Hall)会打开剩余两扇门中的一扇(主持人知道门后是什么),让你看到门后的山羊,此时会询问参赛者是否换门,大部分参赛者认为这时关闭的两扇门中奖的概率是一样的,即都是1/2,通常他们不会改变他们第一次的选择。您是否觉得两个问题几乎一样呢?

蒙特霍尔问题(选择三扇门后的车与羊)及其贝叶斯定理数学解释_第1张图片
网上说法很多,我们以标准版:主持人事先知道答案,会打开一扇你没选择的门,且其背后一定是羊为条件,其他情况不在此过多的扩展。如下图所示剩下两个门供你选择。
蒙特霍尔问题(选择三扇门后的车与羊)及其贝叶斯定理数学解释_第2张图片

序号 参赛者初选 再选择换门 结果
1 有车门 有羊门 失败
2 有羊门A 有车门 获胜
3 有羊门B 有车门 获胜

参赛者最初选择时有1/3的相同概率选择汽车、羊A和羊B,再选择转换后的获胜概率为2/3。

2. 数学解释

蒙特霍尔问题的数学证明可以通过贝叶斯定理来完成。我们可以先了解一些定义。

2.1. 贝叶斯定理

2.1.1. 独立事件概率

我们设定事件 A A A的概率为 P ( A ) P(A) P(A),事件 B B B的概率是 P ( B ) P(B) P(B),且事件 A A A和事件 B B B是相互独立的。
则事件 A A A和事件 B B B同时发生的概率,满足如下公式:
P ( A B ) = P ( B A ) = P ( A ) P ( B ) P(AB)=P(BA)=P(A)P(B) P(AB)=P(BA)=P(A)P(B)

2.1.2. 条件概率

条件概率是在某种条件下,某个事件发生的概率,展示了事件之间的内在联系和影响。
我们来看两种条件概率的简单表述。

1.事件 A A A发生之后,事件 B B B发生的概率,可以记做 P ( B ∣ A ) P(B|A) P(BA),此时满足公式:
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)=\frac{P(AB)}{P(A)} P(BA)=P(A)P(AB),即 A A A B B B 同时发生的概率除以 A A A 发生的概率。
等价于 P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(BA)P(A)

2.事件 B B B发生之后,事件 A A A发生的概率,可以记做 P ( A ∣ B ) P(A|B) P(AB),此时满足公式:
P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\frac{P(AB)}{P(B)} P(AB)=P(B)P(AB)
等价于 P ( A B ) = P ( A ∣ B ) P ( B ) P(AB)=P(A|B)P(B) P(AB)=P(AB)P(B)

3.综合这两种条件事件,可以得到公式:
P ( A B ) = P ( A ∣ B ) P ( B ) = P ( B ∣ A ) P ( A ) P(AB)=P(A|B)P(B) = P(B|A)P(A) P(AB)=P(AB)P(B)=P(BA)P(A)

2.1.3. 贝叶斯公式

我们综合计算得到一个公式:
P ( A ∣ B ) P ( B ) = P ( B ∣ A ) P ( A ) P(A|B)P(B) = P(B|A)P(A) P(AB)P(B)=P(BA)P(A)

这个公式做一个变形可以得到贝叶斯公式:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)

2.1.4. 先验概率和后验概率

在贝叶斯公式中,还隐含着一些术语:

  • P ( A ) P(A) P(A) A A A的先验概率或边缘概率,它不考虑任何 B B B方面的因素。
  • P ( A ∣ B ) P(A|B) P(AB) B B B发生后 A A A的条件概率,由于得自 B B B的取值被称作 A A A的后验概率。

2.2. 贝叶斯定理解释蒙特霍尔问题

前面我们提到了,关键条件在于主持人选择B门后是无车的,这个事件对于已作出选择的参赛者来说是否有影响呢?后验概率是否产生了影响,我们来推导一下:

  • 设定A、B、C门后有汽车分别记为事件 A A A B B B C C C
    P ( A ) = P ( B ) = P ( C ) = 1 3 P(A)=P(B)=P(C)=\frac{1}{3} P(A)=P(B)=P(C)=31
  • 设定参赛者选择了A门,由于主持人默认需要选择没有汽车的门,因此参赛者的选择影响了主持人的选择。
  • 设定主持人选择了B门且没有汽车,记为事件 D D D
    P ( D ∣ A ) = 1 2 P(D|A)=\frac{1}{2} P(DA)=21(因为如果选手最初选择了A门,主持人可以选择打开B或C,而汽车在B或C的概率相等)
    P ( D ∣ B ) = 0 P(D|B)=0 P(DB)=0(因为主持人不会打开选择的门)
    P ( D ∣ C ) = 1 P(D|C)=1 P(DC)=1(因为如果选手最初选择了C门,主持人只能选择打开B门)。
  • 在主持人选择B门无汽车后,参赛者选择A门有车的概率为 P ( A ∣ D ) P(A|D) P(AD),即事件 D D D发生后事件 A A A的概率,由贝叶斯公式得:
    P ( A ∣ D ) = P ( D ∣ A ) P ( A ) P ( D ) P(A|D)=\frac{P(D|A)P(A)}{P(D)} P(AD)=P(D)P(DA)P(A)
  • 通过前面的分析,我们只需要求 P ( D ∣ A ) P(D|A) P(DA) P ( A ) P(A) P(A) P ( D ) P(D) P(D)三个元素即可。
    • P ( D ∣ A ) P(D|A) P(DA)表示A门有汽车的情况下,主持人选择B门的概率,其为 1 2 \frac{1}{2} 21;
    • P ( A ) P(A) P(A)表示A门有汽车的概率,其为 1 3 \frac{1}{3} 31;
    • P ( D ) P(D) P(D)可以从全概率公式求得,其为 1 2 \frac{1}{2} 21
      P ( D ) = P ( D ∣ A ) P ( A ) + P ( D ∣ B ) P ( B ) + P ( D ∣ C ) P ( C ) P(D)=P(D|A)P(A)+P(D|B)P(B)+P(D|C)P(C) P(D)=P(DA)P(A)+P(DB)P(B)+P(DC)P(C)
      P ( D ) = 1 2 × 1 3 + 0 × 1 3 + 1 × 1 3 = 1 2 P(D)=\frac{1}{2}\times\frac{1}{3}+0\times\frac{1}{3}+1\times\frac{1}{3}=\frac{1}{2} P(D)=21×31+0×31+1×31=21
  • 综上得到:
    P ( A ∣ D ) = P ( D ∣ A ) P ( A ) P ( D ) = 1 2 × 1 3 2 = 1 3 P(A|D)=\frac{P(D|A)P(A)}{P(D)}=\frac{\frac{1}{2}\times\frac{1}{3}}{2}=\frac{1}{3} P(AD)=P(D)P(DA)P(A)=221×31=31

在主持人选择B门开启后无汽车的情况下,参赛者选A门有汽车的概率 P ( A ∣ D ) = 1 3 P(A|D)=\frac{1}{3} P(AD)=31,因此后验概率并没有发生变化,并不是直观的 1 2 \frac{1}{2} 21,而仍然是 1 3 \frac{1}{3} 31

因此,如果做调换门,那么相当于参赛者选择了C门,计算过程类似,概率为 2 3 \frac{2}{3} 32
P ( C ∣ D ) = P ( D ∣ C ) P ( C ) P ( D ) P(C|D)=\frac{P(D|C)P(C)}{P(D)} P(CD)=P(D)P(DC)P(C)
P ( C ∣ D ) = 1 × 1 3 1 2 = 2 3 P(C|D)=\frac{1\times \frac{1}{3}}{\frac{1}{2}}=\frac{2}{3} P(CD)=211×31=32

3. 歧义的理解,扩展条件

3.1. 概述

蒙特霍尔问题之所以那么多年来争论不休,本质上是由于语义理解上的歧义;事实上,根据不同的理解方式,蒙特霍尔问题一共有 4 个本质不同的版本。如果不了解其他版本的话,那当你在现实中遇到其他蒙特霍尔问题的变体时,也会很容易想当然地给出错误的答案。

其实,这个问题一共有两个“歧义”点,缺一不可:

  • 主持人是否能确保避免打开正确答案?
  • 主持人是否一定会验证一个和你选择不同的门?

3.2. 歧义4个版本

根据这两个问题的答案,我们就得到了这个问题的 4 个版本:

  • 版本1(标准版):主持人事先知道答案,会打开一扇你没选择的门,且其背后一定是羊;(1-是;2-是)
  • 版本2(验证版):主持人事先并不知道答案,随机打开了一扇你没选择的门,其背后恰好是羊;(1-否;2-是)
  • 版本3(机选版):主持人让系统随机打开一扇背后是羊的门,它恰好打开了一扇你没选择的门;(1-是;2-否)
  • 版本4(随机版):主持人让系统随机打开一扇门,它恰好打开了一扇你没选择的门,且其背后是羊;(1-否;2-否)

注:1与2是指上面的歧义点。

那么,我们该怎么理解这 4 个版本的不同之处呢?它们的本质不同在于:主持人的行为是否需要承担泄露结果的「风险」,使得「条件概率」发生变动。易见,在最初的状态下,我们选中汽车的概率是 1/3。

  • 版本1(标准版) ,无论我们是否选中汽车,主持人总能找到 1 个背后是羊的门,这件事情是 100% 能达成的,所以概率分布完全没变,我们选中汽车的概率依然为 1/3;
  • 版本2(验证版),主持人显然冒了风险,如果你选中了羊,那他有 1/2 的概率会选中汽车,所以我们选中汽车的条件概率变成了 (1/3) /( 1/3+2/3×1/2)=1/2;
  • 版本3(机选版),主持人其实也冒了风险,虽然不可能打开背后是汽车的门,但是在你选中羊的时候,有 1/2 的概率会随机你选择的门,所以我们选中汽车的条件概率变成了 (1/3) /(1/3+2/3×1/2)=1/2;
  • 版本4(随机版),主持人显然冒了双重风险,一个风险是,打开了你选择的门;另一个风险是,它打开了你没选择的门,但其背后是汽车;在这种情况下,条件概率的分子分母都会变化;我们选中汽车的条件概率变成了(1/3×2/3)/(1/3×2/3+2/3×1/3)=1/2

除了「标准版」的答案是 1/3(应该换门)外,其他版本的答案均为 1/2 (换不换均可)。

由此可见,同一件事物对于不同人甚至掌握不同信息的同一个人概率可能不同。因此,概率并不能寄托在实际的物体上,而是存在于条件之下。

参考:

曾加. 蒙提霍尔问题(又称三门问题、山羊汽车问题)的正解是什么?. 知乎. 2022.04

你可能感兴趣的:(数据分析,人工智能及Python,概率论,蒙特霍尔,贝叶斯定理)