小白数据挖掘进阶之路4----(房租预测)模型选择

上一节当中我们学习了如何对特征进行选择,在我看来,特征是各种运算和组合,真正合适的特征是反复筛选的结果,还需要多动手做一下。因此这一部分特征示例才格外重要。特征工程做完了,数据挖掘的工作其实已经完成了80%,接下来就是对模型的选择了。
模型选择
在模型选择的时候,应该根据具体情况选择合适的模型。常用的一般有GBDT,XGBoost,lightGBM,下面给出讲解这几个模型的链接,个人觉得还是不错的:
xgboost入门与实战(原理篇):https://blog.csdn.net/sb19931201/article/details/52557382
xgboost入门与实战(实战调参篇):
https://blog.csdn.net/sb19931201/article/details/52577592
lightGBM原理、改进简述:
https://blog.csdn.net/niaolianjiulin/article/details/76584785
或者参考XGBoost,lightGBM的中文文档
XGBoost 中文文档:https://xgboost.apachecn.org/#/
LightGBM 中文文档:https://lightgbm.apachecn.org/#/

在此次的赛题中,我们以lightGBM为例
小白数据挖掘进阶之路4----(房租预测)模型选择_第1张图片
小白数据挖掘进阶之路4----(房租预测)模型选择_第2张图片
小白数据挖掘进阶之路4----(房租预测)模型选择_第3张图片
小白数据挖掘进阶之路4----(房租预测)模型选择_第4张图片
小白数据挖掘进阶之路4----(房租预测)模型选择_第5张图片
特征决定了模型的上限,当线下的分数上不去的时候,应该回过头来再分析数据,构造新的特征。数据–特征–模型的流程也要循环着来。

你可能感兴趣的:(数据挖掘)