文本分类:MultinomialNB

MultinomialNB

  • 一级目录
    • 二级目录
      • 三级目录

一级目录

二级目录

三级目录

输入量处理

from sklearn.feature_extraction.text import CountVectorizer   
#特征抽取,将文本特征向量化
vec=CountVectorizer()
X_train=vec.fit_transform(X_train)#词频矩阵
X_test=vec.transform(X_test)

数据训练

from sklearn.naive_bayes import MultinomialNB
mnb=MultinomialNB()
mnb.fit(X_train,y_train)
y_predict=mnb.predict(X_test)

分类评估

from sklearn.metrics import classification_report
print('The accuracy of Navie Bayes Classifier is',mnb.score(X_test,y_test))
print(classification_report(y_test,y_predict,target_names=news.target_names))

classification_report
文本分类:MultinomialNB_第1张图片
链接:https://blog.csdn.net/houyanhua1/article/details/87968953

sklearn中的classification_report函数用于显示主要分类指标的文本报告。在报告中显示每个类的精确度,召回率,F1值等信息。
文本分类:MultinomialNB_第2张图片
分类模型的评估标准一般最常见使用的是准确率(estimator.score()),即预测结果正确的百分比。
precision(精度):关注于所有被预测为正(负)的样本中究竟有多少是正(负)。(分母是预测出的数据)
recall(召回率): 关注于所有真实为正(负)的样本有多少被准确预测出来了。(分母是原数据)
f1-score:二者均值。
supprot:每个标签的出现次数。
avg / total行为各列的均值(support列为总和)。

你可能感兴趣的:(文本处理,数据分析)