【机器学习-参数篇】随机森林RandomForest参数调节

RF框架参数

名称 解释 默认值 经验值
n_estimators 森林中决策树的个数 100
criterion 度量分裂标准 (可选值)mse,mae
oobscore 采用袋外样本来评估模型的好坏 False 推荐True
反应模型拟合后的泛化能力

RF决策树参数(和GBDT基本是相同的)

名称 解释 默认值 经验值
max_features RF划分时考虑的最大特征数 auto(defult): 划分时最多考虑 N \sqrt{N} N 个特征
log ⁡ 2 N \log_2{N} log2N: 划分时最多考虑 log ⁡ 2 N \log_2{N} log2N个特征
int(具体值),float(占总数的百分比)
max_depth 决策树最大深度 可以不输入 10 ~ 100
min_samples_split 内部节点再划分所需最小样本数
如果某节点的样本数少于该值,则不会继续再尝试选择最优特征来划分
2
min_samples_leaf 叶子节点最少样本数 1 如果样本量不大,可以不管这个值
n_jobs 设定fit和predict阶段并列执行得任务个数

你可能感兴趣的:(机器学习实战)