2023“SEED”第四届江苏大数据--新能源赛道 复赛Btop2总结

          2023“SEED”第四届江苏大数据--新能源赛道 复赛Btop2总结_第1张图片

      第一名是真的强!基本都是第一,难以撼动。

      昨天新能源赛道终于落下了帷幕,真的不是一般的卷。最后的排名都到了0.0几分的差距。跟队友很辛运复赛B榜单目前进入top3的行列,下面简单总结一下赛事过程。

初赛按照天级别预测未来一周各个充电站的电量,榜单最高分达到215,我们队伍只是停留在220分左右。交流群里面有人喊话:单模220,如果真的是这样,也很想学习下特征工程的思路以及使用模型。这个比赛让我感觉很诧异的点在于使用历史特征构造根本得不到效果的提升,初赛一值是队友按照他的思路建模。

初赛

  1. 初赛要求最多使用三个模型进行预测。
  2. 划分数据集合的时候: 最后七天留做测试集合,最后14天~最后七天留作验证集合。

初赛A

该阶段数据切换,并且任务也由七天单日变成七天小时粒度的预测。最后官方不限制模型数量,大家开始放飞自我。

该阶段我们的分数仍然很低,很好奇前排选手的思路与特征构造方法,我们主要采用时序模型+树模型融合的思路,最后13名。

初赛B

该阶段最后我们取得了top2 的成绩,群里面有人喊话,存在作弊选手。这个不知道真假,如果前面选手作弊最后还能上升一点名次,哈哈。

比赛有个很有意思的是:初赛A在前排的选手,第一次提交基本都在后面,我猜想初赛A能看到数据集,然后初赛B基本看不到,在A阶段的特征工程很复杂,但是复赛B的数据分布存在偏移问题。

该阶段不能看到原始的训练数据集,所以对此我们的思路也比较简单(等到最后排名会分享一下思路)

总结:

       学习的东西很多,未来还要继续努力,不到最后不要放弃。

        NLP的知识点还要继续更新下去!

待续。。。

你可能感兴趣的:(比赛专栏,大数据,数据挖掘)