详细讲解R包randomForestSRC实现筛选变量(随机森林)

随机森林是一种基于决策树(decision tree)的集成学习方法,通过随机选择特征和样本来构建多个决策树,并通过投票或平均等方式综合这些决策树的结果来进行分类或回归。

(1)生存、回归和分类的快速统一随机森林(RF-SRC)。用于训练随机森林模型。森林类型包括:连续变量的回归森林,分类变量的分类森林、分类变量和连续变量的多元森林以及生存森林、竞争风险森林等。节点分列:由选项splitrule指定,通过设置splitrule="random"来使用纯随机拆分。rfsrchttp://127.0.0.1:10345/library/randomForestSRC/help/rfsrc

(2)使用子抽样的快速近似随机森林。rfsrc.fasthttp://127.0.0.1:10345/library/randomForestSRC/help/rfsrc.fast

(3)用于训练和测试的单变量和多变量分位数回归森林。

quantreg.rfsrchttp://127.0.0.1:10345/library/randomForestSRC/help/quantreg.rfsrcquantreghttp://127.0.0.1:10345/library/randomForestSRC/help/quantreg

(4)使用训练后的森林获取预测值。predict.rfsrchttp://127.0.0.1:10345/library/randomForestSRC/help/predict.rfsrc(5)使用 SID(交错交互数据)对无监督数据进行聚类sidClustering.rfsrchttp://127.0.0.1:10345/library/randomForestSRC/help/sidClustering.rfsrc(6)用于变量选择:

vimp通过增加变量噪声(例如通过排列)从 RF-SRC 增长/预测对象计算变量重要性(VIMP)。

vimp

你可能感兴趣的:(机器学习,r语言,随机森林,决策树,机器学习)