朴素贝叶斯分类算法原理

目录

  • 概述
  • 原理
  • 要点

1、概述

朴素贝叶斯分类算法是贝叶斯分类算法中最简单的一种,贝叶斯分类算法以样本可能属于某类的概率来作为分类依据。贝叶斯分类算法是一大类分类算法的总称。

2、原理

如果一个事物在一些属性条件发生的情况下,事物属于A的概率大于属于B的概率,则判定事物属于A。

朴素贝叶斯分类器

  朴素贝叶斯分类器的表示形式:

  当特征为为x时,计算所有类别的条件概率,选取条件概率最大的类别作为待分类的类别。由于上公式的分母对每个类别都是一样的,因此计算时可以不考虑分母,即

  朴素贝叶斯的朴素体现在其对各个条件的独立性假设上,加上独立假设后,大大减少了参数假设空间。

3、要点

  • 分解各类先验样本数据中的特征;
  • 计算各类数据中,各特征的条件概率,比如:特征1出现的情况下,属于A类的概率 p(A|特征1),属于B类的概率 p(B|特征1),属于C类的概率p(C|特征1)......
  • 分解待分类数据中的特征(特征1、特征2、特征3、特征4......)
  • 计算各特征的各条件概率的乘积,如下所示:判断为A类的概率:p(A|特征1)*p(A|特征2)*p(A|特征3)*p(A|特征4).....,判断为B类的概率:p(B|特征1)*p(B|特征2)*p(B|特征3)*p(B|特征4).....,判断为C类的概率:p(C|特征1)*p(C|特征2)*p(C|特征3)*p(C|特征4).....
  • 结果中的最大值就是该样本所属的类别。

你可能感兴趣的:(machine,learning)