笔记d008 决策树与集成学习

决策树是二分树 信息论 单位为bit   5bit 决定世界冠军 5 = 1/32log1/32 信息熵越大 把减少不确定性的东西放在更头部的node 划分依据 信息增益 初始信息熵大小 -条件伤大小

 不确定性减少最多 to_dict(orient)= record 通过调参增强精确度 sklearn可以可视化决策树 dot格式可以通过graphviz格式安装 转均jpg

决策树非常简单且可以可视化不需要数据处理 但是太容易出现过拟合 cart?随机森林 多个树 部分feature ensemble method = 集成学习

你可能感兴趣的:(决策树,集成学习)