深度学习理论——决策树划分属性的选择

大家好,继续理论学习日记,开始学习决策树了,今天先总结一下划分属性的选择,本博客主要参考了周志华的西瓜书和其他博客加上自己的理解。

决策树就是把一个问题分成很多小问题不断进行子决策最终得出结论的过程,每个测试的结果或是导出最终结论或是导出进一步的判定过程,且其考虑范围是在上一次决策结果的限定范围之内的。

决策树一般包含一个根节点,若干内部节点和叶节点,根节点对应总的数据集,每个内部节点对应一个属性测试,叶节点对应决策结果。其基本流程如下:

深度学习理论——决策树划分属性的选择_第1张图片

而本篇博客要说的就是第8步。

一般来说,随着决策树的不断划分,我们希望其分支节点所包含的样本越来越属于同一类别,即节点的纯度越来越高。因此有以下几种划分方法。

深度学习理论——决策树划分属性的选择_第2张图片

深度学习理论——决策树划分属性的选择_第3张图片

划分属性的选择就是这样,我们下期见!

你可能感兴趣的:(深度学习)