基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯

基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯_第1张图片

1.贝叶斯原理

朴素贝叶斯分类(Naive Bayesian,NB)源于贝叶斯理论,是一类基于概率的分类器,其基本思想:假设样本属性之间相互独立,对于给定的待分类项,求解在此项出现的情况下其他各个类别出现的概率。

基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯_第2张图片

朴素贝叶斯分类实现的三阶段

第一阶段,准备工作。

根据具体情况确定特征属性,并对每一特征属性进行划分,然后人工对一些待分类项进行分类,形成训练样本集合。

这一阶段的输入是所有待分类数据,输出是特征属性和训练样本。唯一需要人工处理的阶段,质量要求较高。

第二阶段,分类器训练阶段(生成分类器)。

计算每个类别在训练样本中出现频率及每个特征属性划分对每个类别的条件概率估计,并将结果记录。

其输入是特征属性和训练样本,输出是分类器。

第三阶段,应用阶段。

使用分类器对待分类项进行分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。

2.R语言贝叶斯网络实现

  • caret中train函数
  • e1071包中的naiveBayes函数
  • klaR包中的NavieBayes函数

2.1数据准备

我们将在Rstudio中使用这三种朴素贝叶斯函数对威斯康星州乳腺癌数据集进行分类。

#设置路径

setwd("F:360MoveData甥敳獲Administrator.PC-201704251340Desktop机器学习课程决策树")

#读入数据

breast

#设置class为分类变量

df 

你可能感兴趣的:(2.0,预测分类,贝叶斯分类器的matlab实现)