朴素贝叶斯分类器及西瓜判定实例

 

        朴素贝叶斯分类器是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器。下面我们通过西瓜判定的实例,阐述利用贝叶斯算法进行简单模式识别分类的过程。

       鉴于概率论与数理统计基础,我们直接引入贝叶斯公式:

P(B|A)=P(B)P(A|B)/P(A)

       现在来假设场景,炎炎夏日购买西瓜解暑,市场上的西瓜从品相来看各有优点,通过西瓜特征来进行判别西瓜好坏,我们首先进行数据采集和特征分类,统计数据如下:

朴素贝叶斯分类器及西瓜判定实例_第1张图片

 

下面举例说明条件风险公式:

假设样本有五类,把样本j划分为2类时的条件风险如何计算?

通过公式带入,得到式子:公式中h(x)意为判定准则,因为能力难题也没有搜集到较好的资料论述,此概念略过不提。

日常生活中,人们倾向于将风险最小化,那么由此产生最小化总体风险的概念:

 

 

 

 

此时我们应注意到离散变量和连续变量是二者的最大似然估计算法是不一样的,此处再次使用西瓜实例说明:朴素贝叶斯分类器及西瓜判定实例_第2张图片

 

 

因为连续型分布计算较难,此处不做讨论,针对西瓜分类问题,只研究离散型的变量特征。

对每一个特征概率进行计算

 

 

 

 

 

 

 

 

 

 

 

 

 

 

我们以样本一为例进行判断:

 

   

 

 

所以把样本一判别为好瓜。

 

 

你可能感兴趣的:(模式识别)