机器学习算法系列————决策树(二)

1.什么是决策树

用于解决分类问题的一种算法。
机器学习算法系列————决策树(二)_第1张图片
左边是属性,右边是标签。
机器学习算法系列————决策树(二)_第2张图片
属性选择时用什么度量,分别是信息熵和基尼系数。
这里能够做出来特征的区分。

机器学习算法系列————决策树(二)_第3张图片

下图为基尼系数为例进行计算。
机器学习算法系列————决策树(二)_第4张图片

机器学习算法系列————决策树(二)_第5张图片
下面两张图是对婚姻和年收入的详细计算过程(为GINI系数为例。)决策树连接一是以信息熵为例进行计算的。
机器学习算法系列————决策树(二)_第6张图片
这里需要声明一下,可能作者计算的分类方式为(0-60k)(60k-80k)(80k-300k)
机器学习算法系列————决策树(二)_第7张图片

最终建立好的决策树模型如下。
机器学习算法系列————决策树(二)_第8张图片

你可能感兴趣的:(机器学习,机器学习,算法,决策树)