python机器学习应用mooc_(2)Naive bayes

Naive Bayes

  • 定义
    朴素贝叶斯分类器是一个以贝叶斯定理为基础的多分类分类器。对于给定数据,首先基于特征的条件独立性假设,学习输入输出的联合概率分布,然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y

  • sklearn 参数说明

    sklearn中实现了三个贝叶斯分类器:naive_bayes.GussianNB (高斯朴素贝叶斯) ,naive_bayes.MultinomialNB(针对多项式模型的朴素贝叶斯分类器),naive_bayes.BernoulliNB(针对多元伯努利模型的朴素贝叶斯分类器)
    priors:给定各个类别的先验概率。若为空,则按训练数据的实际情况进行统计。若给定先验概率,则训练过程中不能更改。

  • 使用实例

import numpy as np
from sklearn.naive_bayes import GaussianNB

X=np.array([[-1,-1],[-2,-1],[-3,-2],[1,1],[2,1],[3,2]])
Y=np.array([1,1,1,2,2,2])
clf=GaussianNB(priors=None)
clf.fit(X,Y)
print(clf.predict([[-0.8,-1]]))
  • 其它说明
    朴素贝叶斯是生成式学习方法,由训练数据学习联合概率分布,并求得后验概率分布。
    朴素贝叶斯在小规模数据上表现很好,适合多分类任务。

你可能感兴趣的:(4.1,python机器学习实战)