机器学习之决策树

http://t.csdn.cn/2sWSP决策树

http://t.csdn.cn/NdlCs next()and iter()函数

http://t.csdn.cn/tRN4I sort_values and value_counts()函数

http://t.csdn.cn/Uqmtt pandas库

决策树

机器学习之决策树_第1张图片

根节点: 没有进只有出

中间节点:有进有出,进边只有一条,出边可以很多条

叶节点:只有进,每个叶节点都是一个类别标签

父节点和子节点:相对而言

每一个实例都被有且只有一条路径或者规则所覆盖。

特征选择选取:选择纯度高的节点(分支节点所包含的样本尽可能属于同一类别)

常常衡量不纯度的指标有:熵(香农熵),增益率,基尼指数

机器学习之决策树_第2张图片

 机器学习之决策树_第3张图片

创造数据:

关于鱼类的分类表 {水生 有无脚蹼}

机器学习之决策树_第4张图片

计算信息熵

代码实现:

机器学习之决策树_第5张图片

信息增益

机器学习之决策树_第6张图片

机器学习之决策树_第7张图片

代码实现:

计算信息增益即寻找最佳切分列代码实现如下

机器学习之决策树_第8张图片

按照给定序列切分数据集

代码实现:

机器学习之决策树_第9张图片

主体代码:递归构建决策树

机器学习之决策树_第10张图片

对已给数据集进行分类

机器学习之决策树_第11张图片

切分已经给定数据集为训练集和测试集

机器学习之决策树_第12张图片

计算生成的决策树的准确度

机器学习之决策树_第13张图片

你可能感兴趣的:(python)