MATLAB-随机森林实现数据回归分析预测

       随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。随机森林的核心就是将多个分类器结合起来形成强分类器,是一种集合的思想。随机森林是既可以做分类任务也可以做回归任务的。

原理分析 

MATLAB-随机森林实现数据回归分析预测_第1张图片

        回归树基本结构如上图,实质上对原来的特征空间不断进行二分叉,在满足不同的特征分叉情况下,会得到多个空间,最后所属空间样本均值作为该空间的预测值。划分的过程都是根据划分后的误差的。大体公式描述如下: 

        设X为输入变量可以是多维的,Y是输出变量。对应的数据集形式如下,X_{i}^{(j)}为第 i 个对象的第 j 个输入变量,y_{i} 为第 i 个输出变量,输入输出数据形式为:

你可能感兴趣的:(matlab,随机森林,回归分析,机器学习,算法)