随机森林分类和adaboost分类方法的异同之处

随机森林和adaboost算法都可以用来分类,它们都是优秀的基于决策树的组合算法。相对于经典线性判别分析,其分类效果一般要好很多。

下说明这两种分类方法的相同和不同之处

1,相同:二者都是bootsrap自助法选取样本。
2,相同:二者都是要训练很多棵决策树。
3,不同:adaboost后面树的训练,其在变量抽样选取的时候,对于上一棵树分错的样本,抽中的概率会加大。
4,不同:随机森林在训练每一棵树的时候,随机挑选了部分变量作为拆分变量,而不是所有的变量都去作为拆分变量。
5,不同:在预测新数据时,adaboost中所有的树加权投票来决定因变量的预测值,每棵树的权重和错误率有关;随机森林按照所有树中少数服从多数树的分类值来决定因变量的预测值。

你可能感兴趣的:(数据挖掘&机器学习)