数据挖掘--模型融合

理论来说,如果不同的模型在评分上类似但是结果上差异较大,那么这些不同的模型融合效果会比较理想.

内容简介

1. 简单加权融合:

  • 回归(分类概率):算术平均融合,集合平均融合(权重的差异不宜过大)
  • 分类:投票(Voting)
  • 综合: 综合排序(Rank averaging),log融合  (分线性)

2. stacking/blending

  • 构建多层模型,并利用预测结果再拟合预测

3. boosting/bagging(xgboost,Adaboost,GBDT已经用到)

  • 多树的提升方法

 

Stacking

  简单来说stacking是使用初始训练集数据学习出若干个基学习器之后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器.

  数据挖掘--模型融合_第1张图片

 

 # 记得看一下预测结果的统计信息,根据实际的情况做一些结果的后处理

 数据挖掘--模型融合_第3张图片

 

你可能感兴趣的:(数据挖掘--模型融合)