比赛解决方案

乘用车细分市场销量预测

【赛题】给出2016.1~2017.12的省份,车型,车身,销量,搜索量,评论量,评价量等,要求预测2018.1~2018.4的销量。

【评价指标】归一化均方根误差的均值

【模型】lgb+统计规则

【特征工程】
比赛解决方案_第1张图片

【特征选择】

1.特征重要性排序:根据树模型输出的特征重要性进行筛选,去掉重要性低的特征。

2.均值判断:由于本道赛题中,1234月具有相对固定的均值比例与均值大小,因此可以通过添加/删除特征后1234月的平均均值来大概判断特征的好坏。

3.SHAP:利用了组合博弈论的知识,防止因为信息重叠而导致的特征重要度不公平的情况

【统计规则】

比赛解决方案_第2张图片

【模型融合】

比赛解决方案_第3张图片

你可能感兴趣的:(比赛解决方案)