古典概率,先验概率,后验概率,贝叶斯分类器

古典概率:随机现象所能发生的事件是有限的、互不相容的,而且每个基本事件发生的可能性相等。

  两个特点:

         一是试验的样本空间有限,如掷硬币有正反两种结果,掷骰子有6种结果等;  

         二是试验中每个结果出现的可能性相同,如硬币和骰子是均匀的前提下,掷硬币出现正反的可能性各为1/2,掷骰子出出各种点数的可能性各为1/6。

 

先验概率:是指根据以往经验和分析得到的概率.。

       意思是说我们人有一个常识,比如骰子,我们都知道概率是1/6,而且无数次重复实验也表明是这个数,这是一种我们人的常识,也是我们在不知道任何情况下必然会说出的一个值.而所谓的先验概率是我们人在未知条件下对事件发生可能性猜测的数学表示!*

 

后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小。

 

先验概率,就是一般的概率;后验概率,是条件概率。

 

用P(h)表示在没有训练数据前假设h拥有的初始概率。

P(h)被称为h的先验概率。


先验概率反映了关于h是一正确假设的机会的背景知识如果没有这一先验知识,可以简单地将每一候选假设赋予相同的先验概率。类似地,P(D)表示训练数据D的先验概率,P(D|h)表示假设h成立时D的概率。


机器学习中,我们关心的是P(h|D),即给定D时h的成立的概率,称为h的后验概率。

 

贝叶斯公式:

古典概率,先验概率,后验概率,贝叶斯分类器_第1张图片

 

这里的 就是初始概率,作为先验概率。

就是后验概率,根据结果,来推出发生这件事的原因。

 

贝叶斯公式,考虑到了先验概率,即 作为已知条件。

 

:计算,给定B时Ak成立的概率,可以用作分类。比如:垃圾邮件的分类,通过给定邮件的特征,来预测这封邮件是

                      垃圾邮件,还是非垃圾邮件。

                      B是邮件的特征,A为分类种别。垃圾邮件,非垃圾邮件。

贝叶斯分类器是有监督的,需要标签进行学习。

贝叶斯分类器是生成模型,因为贝叶斯分类器在训练时,关注垃圾邮件是如何生成的,垃圾邮件有哪些特征,非垃圾邮件有哪些

   特征,计算 时,需要计算 ,这就是让模型知道,垃圾邮件应该具备哪些的特征,非垃圾邮件应该

  具备哪些的特征。

贝叶斯分类器是非线性,因为变量之间的关系不是一次函数,图像不是直线。

 

贝叶斯分类器:

    1.类型:有监督,生成模型,非线性。

    2.是否支持多分类:是

 

参考:

   https://www.cnblogs.com/yemanxiaozu/p/7680761.html

   https://wenku.baidu.com/view/fe84f83143323968011c9276.html

   https://blog.csdn.net/w_doudou/article/details/80596490

你可能感兴趣的:(机器学习)