朴素贝叶斯推导和常见问题

1、讲讲朴素贝叶斯

朴素贝叶斯是基于贝叶斯定理和特征条件独立假设的分类方法。

2、朴素贝叶斯算法流程

  1. 获取训练样本,确定特征属性;
  2. 对每个类别计算类各个类的类先验概率;
  3. 对每个特征计算分属于各个类别的类条件概率
  4. 对于一个样本,计算每个类别的类条件概率和各特征的类先验概率乘积
  5. 以第4步值最大的类别作为样本的所属类别;

其中,第2、3步时模型的训练阶段,第4、5步是应用阶段。

3、NB应用举例

朴素贝叶斯推导和常见问题_第1张图片

朴素贝叶斯推导和常见问题_第2张图片

常见问题(来源):

1.简述朴素贝叶斯算法原理和工作流程

2.什么是先验概率和后验概率?

先验概率是指根据以往经验和分析得到的概率。后验概率是基于新的信息,修正原来的先验概率后所获得的更接近实际情况的概率估计。

3.什么是条件概率?

条件概率是指事件A在另外一个事件B已经发生下发生的概率。

4.为什么朴素贝叶斯如此“朴素”?

因为假设所有特征在数据集中的作用是同等重要和独立的。

5.什么是贝叶斯决策理论?

6.朴素贝叶斯算法的前提假设是什么?

7.为什么属性独立性假设在实际情况中很难成立,但朴素贝叶斯仍能取得较好的效果?

8.朴素贝叶斯可以做多分类吗?

9.什么是朴素贝叶斯中的零概率问题?如何解决?

10.朴素贝叶斯中概率计算的下溢问题如何解决?

11.朴素贝叶斯分类器对异常值敏感吗?

12.当数据的属性是连续型变量时,朴素贝叶斯算法如何处理?

13.朴素贝叶斯算法对缺失值敏感吗?

14.朴素贝叶斯有哪几种常用的分类模型?

15.朴素贝叶斯算法中使用拉普拉斯平滑,拉普拉斯因子的大小如何确定?

16.为什么说朴素贝叶斯是高偏差低方差?

17.朴素贝叶斯为什么时候增量计算?

18.高度相关的特征对朴素贝叶斯有什么影响?

19.朴素贝叶斯的应用场景有哪些?

20.朴素贝叶斯有什么优缺点?

你可能感兴趣的:(自然语言处理)