因年龄增长所带来的理解力,与努力无关。
前面介绍了决策树算法应用之一的GBDT模型,本节讲讲决策树另一个比较火的应用模型,随机森林。与GBDT模型相比,同样属于集成学习,随机森林模型的原理更为直观简洁,性能也同样十分强悍。那么,随机森林算法模型的原理与思想是怎样的?
所谓多树成林,Random forests(或者Random decision forests)随机森林,顾名思义由多棵决策树构成,这些决策树都是CART(Classification And Regression Tree)分类或回归树。
对于行采样,模型从M条数据集中随机采样m条数据,一般情况下m取M的平方根大小,分别作为每一棵决策树的训练集。行采样保证了每棵决策树使用的训练集各不相同,这在一定程度上抑制了over-fitting问题。
感谢各位的耐心阅读,后续文章于每周日奉上,敬请期待。欢迎大家关注小斗公众号 对半独白!