统计学习方法—4.朴素贝叶斯法

概要:朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法 ,属于生成模型。学习过程:对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布,然后基于此模型对于给定的输入X,利用贝叶斯定理求出后验概率最大的输出类别。

朴素贝叶斯法实现简单,学习和预测的效率都很高。

1.计算步骤:

(1)类概率

(2)类条件概率

(3)求后验概率最大的类别作为最终预测结果。

2.贝叶斯估计(拉普拉斯平滑)

————————————补充:

3.优缺点:

(1)优点:

—朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。
—对小规模的数据表现很好,能个处理多分类任务,适合增量式训练;

—对缺失数据不太敏感,算法也比较简单,常用于文本分类。

(2)缺点:

需要计算先验概率;
分类决策存在错误率;

对输入数据的表达形式很敏感;

不能学习特征之间的相关性。

你可能感兴趣的:(统计学习方法—4.朴素贝叶斯法)