通俗易懂用一章图可视化解释贝叶斯公式求解后验概率计算过程

我们可以用以下一个例子通俗易懂地解释贝叶斯公式的意义和他的计算过程。
首先我们来给出场景,假设:
一个学校开设有两个专业:工科和商科;
学校内的学生性格分为两种:内向和外向;
我们用变量A来表示学生的专业,A=1表示专业是工科,A=0表示专业是商科;同样的,我们使用变量B来表示学生的性格,B=1表示内向,B=0表示外向。我们假设工科生的比例为P(A)=1/3,则商科生的比例P( A ‾ \overline{A} A)=1-P(A);假设内向的人的比例为P(B)=1/4,则外向人的比例为P( B ‾ \overline{B} B)=1-P(B)。我们把P(A)和P(B)称为先验概率,也就是图中用实心的黑框线标注的部分。
现在,我们发现工科生人群中,有一半的人是内向的,用条件概率可以记为P(B|A)=1/2,我们把这个概率成为是似然概率,在图中用虚线黑框表示。
现在,我们已经知道了P(A) P(B) P(B|A),如果现在我们在该校中随机找了一名幸运观众,发现他是内向型的人,请问他是工科生还是商科生的概率是多少?这个问题就是求解后验概率P(A|B)的问题,也就是图中黑色点框表示的部分。
我们可以使用贝叶斯公式求解,即: P ( A ∣ B ) = P ( A ) ⋅ P ( B ∣ A ) P ( B ) = 2 3 P(A|B)=\frac{P(A)\cdot P(B|A)}{P(B)}=\frac{2}{3} P(AB)=P(B)P(A)P(BA)=32
这个计算还是比较简单的,现在,我们再问一个问题,如果我们随机抽取的观众是外向的,那么他是工科生的概率是多少呢?这个时候,我们借助下面的图形计算似乎会比较直观了: P ( A ⋅ B ) = P ( A ) ⋅ P ( B ∣ A ) = 1 6 P(A \cdot B)=P(A)\cdot P(B|A)=\frac{1}{6} P(AB)=P(A)P(BA)=61 P ( A ⋅ B ‾ ) = P ( A ) − P ( A ⋅ B ) = 1 6 P(A\cdot \overline B)=P(A)-P(A\cdot B)=\frac{1}{6} P(AB)=P(A)P(AB)=61 P ( A ‾ ⋅ B ‾ ) = P ( A ‾ ) − P ( A ‾ ⋅ B ) = P ( A ‾ ) − ( P ( B ) − P ( A ⋅ B ) ) = 7 12 P(\overline A \cdot \overline B)=P(\overline A)-P(\overline A \cdot B)=P(\overline A )-(P(B)-P(A\cdot B))=\frac{7}{12} P(AB)=P(A)P(AB)=P(A)(P(B)P(AB))=127 P ( A ‾ ∣ B ‾ ) = P ( A ‾ ⋅ B ‾ ) P ( B ‾ ) = 7 9 P(\overline A|\overline B)=\frac{P(\overline A \cdot \overline B)}{P(\overline B)}=\frac{7}{9} P(AB)=P(B)P(AB)=97 P ( A ∣ B ‾ ) = 1 − P ( A ‾ ∣ B ‾ ) = 2 9 P(A| \overline B)=1-P(\overline A |\overline B)=\frac{2}{9} P(AB)=1P(AB)=92
我们可以看到,这题的难点其实在 P ( A ‾ ⋅ B ‾ ) P(\overline A \cdot \overline B) P(AB)的计算。
然而,如果我们画出以下图像的话,使用面积法就可以轻松的求得答案。
通俗易懂用一章图可视化解释贝叶斯公式求解后验概率计算过程_第1张图片

你可能感兴趣的:(#,机器学习初阶)