条件概率 全概率 贝叶斯公式

条件概率:

定义:

已知某个事件A发生的条件下,另一个事件B发生的概率称为条件概率。记为P(B|A)

计算方法:

P(B|A) = P(AB) / P(A)

全概率:

全概率公式为 概率论中的重要公式,它将对一复杂事件A的概率求解问题转化为了在不同情况下发生的简单事件的概率的求和问题。
内容:如果事件B1、B2、B3…Bn 构成一个完备事件组,即 它们两两互不相容,其和为全集;并且P(Bi)大于0 ,则对任一事件A有
P(A)=P(A|B1)*P(B1) + P(A|B2)*P(B2) + ... + P(A|Bn)*P(Bn).

贝叶斯公式

贝叶斯公式的应用:



如果某些字词经常出现在垃圾邮件中,但是它很少出现在非垃圾邮件中,当我们一个邮件,我们不知道它是垃圾邮件还是和发邮件的时候,
还有经常出现在垃圾邮件中的字词的话,那么他是垃圾邮件的可能行就很大。这就是理由贝叶斯公式组建垃圾邮件分类器的一个想法。
首先创建基于字词符号的贝叶斯数据库,也就是说你要给一堆的垃圾邮件和非垃圾邮件,将这些垃圾邮件和非垃圾邮件的字词都分好。然
后在计算某些字词在垃圾邮件中出现的概率,非垃圾邮件中的概率,比如说中奖这个词,一般很多就会在垃圾邮件中出现,所以可能它在垃圾
邮件中的出现的概率比价高,当我们得到一封新的邮件的时候,我们就检测一下新的邮件里面有没有一些经常出现在垃圾邮件里面的字词,比
如说你收到一封新的邮件里面含有“恭喜你中奖了”,那么根据贝叶斯分类器,可能就会把这封邮件分为垃圾邮件。
第三步会根据个人的个性化选择构建个性化的贝叶斯分类库,比如说有些垃圾邮件对于不同的人会有不同的分法。比如说你经常要买某样
东西,比如你经常网购,某些 公司会经常的发一些他们的商品,你会和乐意看这些信息,对于你来说这些就不是垃圾邮件,但是对于一个工作
邮箱,这些就是一些垃圾邮件。
比如我们在QQ邮箱里面,如果他被误判的垃圾邮件,我们可以把它从垃圾邮件中移除,变为合法邮件,比如你收到一个合法邮件,但是你
却认为他是一个垃圾邮件,你就可以把它标记为垃圾邮件,然后就改变了它的字词里面的垃圾概率,然后就可以构建属于你自己的贝叶斯分类
器。

总结:

  1. 全概率公式是求最终结果的概率
  2. 贝叶斯公式是已知最终结果,求某个事件的概率。





























你可能感兴趣的:(大数据的统计学基础笔记)