机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)

决策树2

决策树很容易出现过拟合问题,针对过拟合问题,我们采用以下几种方法

1.划分选择 vs 剪枝

剪枝 (pruning) 是决策树对付“过拟合”的 主要手段!

基本策略:

  • 预剪枝 (pre-pruning): 提前终止某些分支的生长
  • 后剪枝 (post-pruning): 生成一棵完全树,再“回头”剪枝

剪枝过程中需评估剪枝前后决策树的优劣
我们还是以西瓜书的例子:
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第1张图片

我们通过训练集得到未剪枝决策树:
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第2张图片
验证数据
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第3张图片

2.预剪枝

机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第4张图片
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第5张图片
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第6张图片

3. 后剪枝

机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第7张图片
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第8张图片

机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第9张图片
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第10张图片
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第11张图片

4. 两种策略比较

  • 时间开销:

     预剪枝:训练时间开销降低,测试时间开销降低
     后剪枝:训练时间开销增加,测试时间开销降低
    
  • 过/欠拟合风险:

     预剪枝:过拟合风险降低,欠拟合风险增加
     后剪枝:过拟合风险降低,欠拟合风险基本不变
    
  • 泛化性能:后剪枝 通常优于 预剪枝

5. 连续值处理

基本思路:连续属性离散化
常见做法:二分法 (bi-partition)

  • n 个属性值可形成 n-1 个候选划分
  • 然后即可将它们当做 n-1 个离散属性值处理
    机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第12张图片

6. 缺失值处理

仅使用无缺失的样例? 对数据的极大浪费

使用带缺失值的样例,需解决:
Q1:如何进行划分属性选择?
Q2:给定划分属性,若样本在该属性上的值缺失,如何进行划分?

	基本思路:样本赋权,权重划分 (半监督学习)

机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第13张图片
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第14张图片

7. 从“树”到“规则”

  • 一棵决策树对应于一个“规则集”
  • 每个从根结点到叶结点的分支路径对应于一条规则
    机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第15张图片

8. 轴平行划分

单变量决策树:在每个非叶结点仅考虑一个划分属性产生“轴平行”分类面
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第16张图片

当学习任务所对应的分类边界很复杂时,需要非常多段划分才能获得较好的近似
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第17张图片

9. 多变量(multivariate)决策树

多变量(multivariate)决策树
多变量决策树:每个非叶结点不仅考虑一个属性
例如“斜决策树” (oblique decision tree) 不是为每个非叶结点寻找 最优划分属性,而是建立一个线性分类器
机器学习与深度学习系列连载: 第一部分 机器学习(十一)决策树2(Decision Tree)_第18张图片

更复杂的“混合决策树”甚至可以在结点嵌入神经网络或其他非线性模型

9. 决策树常用软件包

ID3, C4.5, C5.0
http://www.rulequest.com/Personal/

J4.8
http://www.cs.waikato.ac.nz/ml/weka/

本专栏图片、公式很多来自台湾大学李弘毅老师、斯坦福大学cs229,斯坦福大学cs231n 、斯坦福大学cs224n课程。在这里,感谢这些经典课程,向他们致敬!

你可能感兴趣的:(机器学习,机器学习)