初探贝叶斯推断

1、问题

“人工智能头条”微信公众号在2018-3-2推送的一篇名为“‘睡觉’还能玩转贝叶斯推断?,没错,就连你开不开灯都猜得出来”,作者利用睡觉和房间的灯开关的关系来讲解简单的贝叶斯推断问题。读了这篇文章后觉得贝叶斯推断很有意思,于是又查了下关于如何理解贝叶斯公式的问题,主要参考了知乎上“你对贝叶斯统计有和理解”这一话题下徐炎琨的回答。首先引用知乎徐炎琨回答中的一个问题,你清楚地明白“明天降水概率为70%”吗?(问题稍作修改),下面来进行分析。

2、概括

关于贝叶斯公式的精妙之处的理解归为一句话就是:我想知道A发生的可能性,如果没有任何其他的信息(剔除你的所有先验知识)我只能做出发生和不发生各占一半也就是50%的概率,但是庆幸的是我知道有个事件B发生了,根据已有的关于B和A之间的关联性的经验,我可以更准确的判断A发生的可能性比较小如20%的概率,而不再是非零即一的50%。初次读这句话可能会仍然比较疑惑,没关系,整篇文章都是来阐释这个问题的。

3、分析

贝叶斯公式如下:

这里公式中有四个概率即P(A|B)、P(B|A)、P(A)和P(B),我们分别称之为后验概率(也就是有了一定先验知识的情况下得出的判断)、似然条件(因为B已经发生了,你判断A是否发生的逻辑一定要使得B发生)、先验概率(没有经过先验知识左右的纯的A发生的概率)和归一化常数(所有的判断都是建立在B已经发生了的基础上进行的,所以一切概率要以B发生为基准)。

3.1A和B之间的关联性

首先引用知乎用户史博同样在上述知乎问题中的一个回答并借用一张图示:

 

初探贝叶斯推断_第1张图片

图1

关于这张示意图,史博给出的解释是“你可以站在A的角度去看B,也可以站在B的角度去看A。 他们看到的事实应该是一致的。”没错,由于A和B二者之间是有关联性的,但这个关联性绝不仅仅指A和B相交的那一块公共区域,如果A和B没有任何交叉他们也一样是有关联性的,因为他们同样都占据了图中的红色矩形区域!!!这一点很容易被忽略或误解,记住,有关联性不一定是有交叉关系!!!这个在下面我还会再次强调!现在我们来看史博的这句解释,可能看了图中的“图形化的数学运算”之后你已经get到了确实可以利用A来看B,也可以用B来看A这么一个大致的模糊的概念,但是仍然有很多疑惑,你可能会问:确实我们可以不用P(A)就得出P(A*B)也可以不用P(B)就得出P(A*B),但是我们并没有通过P(B)得出P(A)呀?答案是:没错,你永远不可能通过其一件非同质性(我自己的定义,非学术用语,所谓同质性事件也就是说B是包含在A之内的情况。)的事件的发生得出另一件事是否发生(但是我们可以通过多个B来逼近推测出A,这个问题是更深层次的问题,以后的文章会讲到PCA分析等问题的时候会再进一步解释)。举个例子:你永远不能因为听了女朋友说她没事就以为她真的没事...反应太过激烈(确信是反话)就会被批判敏感,没有反应(确信是真的没事)会被批判xxx...你能做的仅仅是根据你以往被糟蹋和蹂躏的经验来做出相对合理的判断然后采取合适的行动...

 

3.2用B来推断A

如何用B你推断A,这大概就是贝叶斯推断的精髓了(目前理解到的,不过我相信贝叶斯还会送给我更值得惊讶的礼包,深入拜读后再做分享0.0)下面贴个原创图示:

初探贝叶斯推断_第2张图片

 

本节的标题为用B来推测A,当然也可以用A推测B因为所有事件都是对等的。上一小节硬是尬聊了个尴尬的例子可能不足以让所有读者对此有清晰的理解比如说女工程师们...这一小节是更加细化深入的讲解。加薪的例子应该是普适的了,老板放出话说今年要给一批同志(你才是同志)加薪,当然了不用说大家都知道参考的依据当然是业绩表现。我想老板这句话刚一撂出来大家都心里有点*数自己会不会加薪了,这里我力求清晰的阐述一下我们本能判断过程中的贝叶斯推断。

首先我们看图2,今年我的业绩超级烂,完全谈不上业绩这两个字,这个时候我推断自己加薪的可能性就完全不能和B:业绩好的加薪沾上边,然而B作为主要参考因素,就会把A我会加薪挤占的只剩一点点空间,那么相对于加薪这一整体事件而言的概率也就小;再看图3,我今年的表现马马虎虎,那么A就可以对B说“你个肥猪给我点位置!”,那么A可占面积就扩大了,也就是说加薪的概率增加;最后我们看图4,我今年业绩炒鸡好简直没sei了,那么A占有B的空间更大了,也就极大地提高了自己会加薪的推断概率。解释一下,这里B是客观的硬指标因此它的占有面积看作是固定的,而A应该是根据三种不同的情况是浮动的,B以外的其他因素所带来的A发生的概率是固定的也就是纯橘黄色的(A-B)部分是固定的,而A的浮动完全是由占有B的面积浮动带来的。现在我们回归贝叶斯公式,我们可以了解到假如老板最终会把加业绩好作为绝对依据(注意这仅仅是个概率较大的可能性事件B),那么A我加薪是否发生就会更大程度上有图中A、B交叉项的面积决定,这就体现出了用B推断A的作用。

这里我们回头看之前强调的一句话“关联性绝不是指A和B相交的那一块公共区域,如果A和B没有任何交叉他们也一样是有关联性的,因为他们同样都占据了图中的红色矩形区域”从上面的分析我们体会到,图2中A和B是完全没有交叉的,但他们二者是有关联的,这是因为B和A同出在一个整体空间,B占据了的空间A就不能再占据,这就相当于缩小了A的概率的整体空间,其实这一点本身就是A和B之间的紧密的关联性!!!二者之间没有关联性的体现应该是他们根本就不在一个整体空间内!从另一个角度来看,虽然A和B没有交叉,但是别忘了A可是包含在-B内的,而-B和B在概率研究上来讲又有什么区别呢?所以这是多大的关联性啊!

最后,关于文章开头提到的问题“明天降水概率为70%”的理解知乎徐炎琨在原文并没有给出明确的看法,翻了下评论也没有找到,在评论下博主提出了自己的看法现在再提一次。我认为这里的降水概率实际上是一个利用贝叶斯推断得出的一个后验概率,而似然条件是气象站观测到的各种数据和现象,而先验条件则也是根据多维的、大量的数据得出的概率。

4.总结

贝叶斯公式用几个数学符号可以把判断这一人类日常生活中极为重要的思维方式给概括的如此细致和精准,这是多么强大的数学之美啊!再了解了这个问题后我思考过,为什么日常生活中有些人在做判断的时候如此精准而自己却又经常出错(突然想到感觉自己经常出错也同样是一个很有意思的话题,以后找个时间也来分享一下关于这个问题的思考)呢?比如冬天不想起床,提前二十分钟起床洗漱能不能赶在上课前到教室?这个时候判断的结果的准确性的决定性因素就是你的脑海里建立的B的模型是否够全面(全面性的问题之前提到过,以后再做分析)、模型是否准确?也就是我们俗话讲的周全、细致。贝叶斯推断让我感到惊讶的主要原因就是我们能够把生活实践中的思维过程准确的映射到数学公式上,这真的是一件极其伟大的事!想想所谓的人工智能吧,我觉得人工智能比人类智能的高级之处绝不会在于思维的模式或者速度上,而是计算量上,人类的思维模式一定是指导机器的核心,那么把人类思维转化为数学公式,这难道不就是实现人类思维指导机器智能的最为艰难而伟大的一步吗?

 

5.附加语

本文主要分享的是关于贝叶斯推断在我们思维习惯中的体现的让人惊讶的乐趣,并没有对其本身进行理论上的精细推导,想要深入体会可以参考更多数学推导如前面提到的知乎徐炎琨的回答和其他出版物等。

 

 

 

 2018.3.17 衫阳 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(分享)