贝叶斯分类方法学习二 朴素贝叶斯推导

      上一节已经介绍过贝斯公式,如果还没有学习过贝叶斯公式的请先看一下贝叶斯分类方法学习一 贝叶斯公式。贝叶斯公式在机器学习和文本分类中发挥着重要的作用,其中贝叶斯网络在过去的机器学习和数据挖掘中作为一个重要的研究方向;而朴素贝叶斯模型则在文本分类中有着不可替代的地位,下面我简单的介绍下朴素贝叶斯算法在文本分类中的推导过程(ps:下面文本分类是以新闻为载体的中文分类):

     1.我把贝叶斯模型现在最前面以提供分析:

     贝叶斯分类方法学习二 朴素贝叶斯推导_第1张图片    

 

     2朴素贝叶斯模型定义

       2.1.特征属性集U = U={X1,X2,X3,…..Xn},其中X1,X2,X3…..Xn为特征属性。在新闻内容中,可以通过大量新闻作为训练样本,从而获得新闻的特征分词(为了计算方便,这里假设分词之间的关系相互独立)。

       2.2 分类集合C={Y1,Y2,Y3…….Yn}, Y1,Y2,Y3…..Yn指训练样本中的新闻的类别,如:娱乐、体育、国际等分类 

       2.3 计算各个分类在训练样本中出现的先验概率P(Yi),P(Yi)= 1 / Yi的数量

       2.4 计算待分类的后验概率P(Yi | Xi),模型前提条件是特征属性之间相互独立,可得:

      2.5 由于文本分类为离散的特征数据,选择最大后验概率MAP决策准则,因此分类器模型公式定义为:

     3.模型建立过程:

                            贝叶斯分类方法学习二 朴素贝叶斯推导_第2张图片

你可能感兴趣的:(机器学习,朴素贝叶斯,文本分类,朴素贝叶斯分类)