NEFU数据科学导论(七)分类问题

一、概念

包括学习分类两个过程
监督学习从数据中学习一一个分类模型或决策函数称为分类器( classifier )分类器对新的输入进行输出的预测,称为分类,输出变量Y取有限个离散值
NEFU数据科学导论(七)分类问题_第1张图片

 二、常用分类算法

NEFU数据科学导论(七)分类问题_第2张图片

提升方法

NEFU数据科学导论(七)分类问题_第3张图片

2.1评价指标

准确率

NEFU数据科学导论(七)分类问题_第4张图片

精确率与召回率

NEFU数据科学导论(七)分类问题_第5张图片

NEFU数据科学导论(七)分类问题_第6张图片

三、KNN算法

 3.1基本思想

NEFU数据科学导论(七)分类问题_第7张图片

3.2 算法流程‘

3.3基本要素

3.3.1距离度量

NEFU数据科学导论(七)分类问题_第8张图片

NEFU数据科学导论(七)分类问题_第9张图片

NEFU数据科学导论(七)分类问题_第10张图片

由不同的距离度量所确定的最近邻点是不一样的
 3.3.2K值的选择

3.3.3分类决策规则

NEFU数据科学导论(七)分类问题_第11张图片

四、贝叶斯定理 

4.1概念

NEFU数据科学导论(七)分类问题_第12张图片

NEFU数据科学导论(七)分类问题_第13张图片

先验概率         后验概率 

4.2朴素贝叶斯定理

NEFU数据科学导论(七)分类问题_第14张图片

4.3朴素贝叶斯步骤

NEFU数据科学导论(七)分类问题_第15张图片

五、决策树

5.1概念

NEFU数据科学导论(七)分类问题_第16张图片

5.1.1基本组成

NEFU数据科学导论(七)分类问题_第17张图片

5.2决策树学习

5.2.1思想

NEFU数据科学导论(七)分类问题_第18张图片

5.2.2流程

NEFU数据科学导论(七)分类问题_第19张图片

NEFU数据科学导论(七)分类问题_第20张图片 

NEFU数据科学导论(七)分类问题_第21张图片 

5.2.3决策树特征选择

NEFU数据科学导论(七)分类问题_第22张图片 

信息增益

NEFU数据科学导论(七)分类问题_第23张图片

 

信息熵 

NEFU数据科学导论(七)分类问题_第24张图片

 NEFU数据科学导论(七)分类问题_第25张图片

六、决策树-剪枝算法

6.1概念

NEFU数据科学导论(七)分类问题_第26张图片 

6.2损失函数

NEFU数据科学导论(七)分类问题_第27张图片 

NEFU数据科学导论(七)分类问题_第28张图片 

6.3流程

 

 

你可能感兴趣的:(分类,算法)