水电站入库流量预测_第四届工业大数据竞赛题目发布

文章目录

  • 1 题目描述
  • 2 比赛任务
  • 3 数据描述
  • 4 评分规则
  • 5 答案提交

REF: 官网

1 题目描述

对于水电站来说,发电是主要经济效益来源,而水就是生产的原料。对进入水电站水库的入库流量进行精准预测,能够帮助水电站对防洪、发电计划调度工作进行合理安排,实现避免洪涝灾害和提升发电经济效益的目的。

水电站入库流量预测_第四届工业大数据竞赛题目发布_第1张图片

入库流量受到降水、蒸发、土壤(直接影响地表径流、地下径流)、上游来水等诸多因素的综合影响(如下图所示),但这些因素作用关系复杂,不少因素很难直接精准观测。如果能通过数据分析方法,基于大量的历史数据和可获取的监测数据,实现水电站入库流量的精准预测,将对水电站生产带来显著的安全和经济价值。

2 比赛任务

基于历史数据和当前观测信息,对电站未来7日入库流量进行预测(每3小时一个预测值,共56个待预测值)。初赛预测3个时段,决赛预测5个时段。

3 数据描述

竞赛中有4类数据,包括入库流量数据(每3个小时)、39个遥测站降雨数据(小时)、日降雨预报数据(未来5天)、环境观测数据(天)。

水电站入库流量预测_第四届工业大数据竞赛题目发布_第2张图片

赛事方提供2013年1月1日0时~2016年12月31日24时的相关数据作为开放数据集,供参赛选手做数据探索和模型训练。

竞赛过程中,赛事方提供若干段历史数据(初赛3段,决赛5段),均与训练数据无交集;每段数据时长30天连续的历史数据(段和段之间没有重叠,且间隔大于14天,可以认为它们是独立的),参赛选手对每段历史数据进行未来7天(每3小时1个预测值,共56个预测值)的入库流量预测。

水电站入库流量预测_第四届工业大数据竞赛题目发布_第3张图片

4 评分规则

针对每段预测(56个点),采用加权平均的纳什效率系数(NSE)作为评价指标,如下式所示
水电站入库流量预测_第四届工业大数据竞赛题目发布_第4张图片
NSE的取值范围为 。(ps.网站原本就没给)NSE越接近1,表示模型质量好,可信度高;NSE接近0,表示模拟结果接近观测值的平均水平,即总体结果可信,但过程模拟误差大;NSE远小于0,表示模型不可信。

初赛和决赛成绩是多个数据段预测性能的平均,Score(可能为负分)的公式描述为:
水电站入库流量预测_第四届工业大数据竞赛题目发布_第5张图片

5 答案提交

参赛选手需要提交CSV格式预测结果文件,包含57列,包括数据段编号(SeqNum),以及56个时间点的入库流量预测值(Prediction1到Prediction56);

参赛选手将文件名称命名为“submission.csv”进行提交。结果文件模板可在数据集中获得。
水电站入库流量预测_第四届工业大数据竞赛题目发布_第6张图片

结果文件示例如下(以3段为例):

提醒:初赛为3段,决赛为5段。

  1. 初赛阶段,选手每周日全天(0时至24时)可提交3次答案。提交后,即时返回结果。

  2. 决赛阶段,选手在决赛的每个比赛日均可以提交2次答案。提交后,不会返回即时结果。成绩以最后一次提交的答案为准。成绩待决赛结束,经审核后给出。

你可能感兴趣的:(水电站入库流量预测_第四届工业大数据竞赛题目发布)