8、python多项式贝叶斯文本分类(完整)

1、贝叶斯定理(Bayes Theorem)

朴素贝叶斯分类(Naive Bayes Classifier)
    贝叶斯分类算法,是统计学的一种分类方法,它是利用贝叶斯定理的概率统计知识,对离散型的数据进行分类的算法
 
2、贝叶斯算法的类型

sklearn包naive_bayes模块

GaussianNB  高斯贝叶斯

BernoulliNB  伯努利贝叶斯

MultionmialNB   多项式贝叶斯 (需要知道具体每个特征的数值大小)

一般应用于文本分类


3、实践案例

import codecs

import os.path

# 根据文件建立字典

classDict={
       'C000007': '汽车',
    'C000008': '财经',
    'C000010': 'IT',
    'C000013': '健康',
    'C000014': '体育',
    'C000016': '旅游',
    'C000020': '教育',
    'C000022': '招聘&#

你可能感兴趣的:(数据挖掘实战,多项式贝叶斯,文章分类)