基于R语言的随机森林算法

随机森林基本原理

随机森林,从字面理解就是随机生成的树构成的森林,树与树之间是独立的。每一颗树就是决策树,所以说随机森林就是多颗决策树构成的增强分类(回归)器,

当有数据进入模型是,每棵决策树都会产生预测结果,随机森林产生的结果就是这些结果的众数或者平均值。

随机森林( random forest) 是一种基于分类树( classification tree) 的算法,它可以用于分类和回归,本文在这里以广西地区1990-2014共25年的GDP数据作为因变量,以INV投资、CON消费、NEX净出口为三个自变量,运用R语言软件做随机森林回归,最终得到三个自变量的相对重要程度。

1 数据

从广西统计年鉴中取得1990-2014年的因变量与自变量数据,放入excel表格中。


QQ截图20160407190804.jpg

你可能感兴趣的:(基于R语言的随机森林算法)