朴素贝叶斯算法

回顾概率知识:

朴素贝叶斯算法_第1张图片
image.png

image.png

sklearn朴素贝叶斯实现API
sklearn.naive_bayes.MultinomialNB
sklearn.naive_bayes.MultinomialNB(alpha = 1.0)
alpha:拉普拉斯平滑系数

•优点:
 朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
 对缺失数据不太敏感,算法也比较简单,常用于文本分类
 分类准确度高,速度快
•缺点:
 需要知道先验概率P(F1,F2,…|C),因此在某些时候会由于假设的先验
 模型的原因导致预测效果不佳

混淆矩阵

在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类)


朴素贝叶斯算法_第2张图片
image.png

精确率(Precision)与召回率(Recall)

精确率:预测结果为正例样本中真实为正例的比例(查得准)

朴素贝叶斯算法_第3张图片
image.png

召回率:真实为正例的样本中预测结果为正例的比例(查的全,对正样本的区分能力)

朴素贝叶斯算法_第4张图片
image.png

分类模型评估API

sklearn.metrics.classification_report
sklearn.metrics.classification_report(y_true, y_pred, target_names=None)
•y_true:真实目标值
•y_pred:估计器预测目标值
•target_names:目标类别名称
•return:每个类别精确率与召回率

你可能感兴趣的:(朴素贝叶斯算法)