【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据

020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据

  • 一、比赛地址:
  • 二、比赛简介:
    • 竞赛背景:
    • 任务描述:
    • 数据集:

一、比赛地址:

2020第六届百度&西安交大大数据竞赛暨IKCEST第二届“一带一路”国际大数据竞赛

二、比赛简介:

竞赛背景:

本届大数据竞赛在中国工程院、教育部高等学校大学计算机课程教学指导委员会及丝绸之路大学联盟的指导下,由联合国教科文组织国际工程科技知识中心(IKCEST)、中国工程科技知识中心(CKCEST)、百度公司及西安交通大学共同主办,旨在放眼“一带一路”倡议沿线国家,通过竞赛方式挖掘全球大数据人工智能尖端人才,实现政府—产业—高校合力推动大数据产业研究、应用、发展的目标,进一步夯实赛事的理论基础与实践基础,加快拔尖AI创新人才培养。

传染病(Contagious Diseases)的有效防治是全人类面临的共同挑战,如何通过大数据,特别是数据的时空关联特性,来精准预测传染病的传播趋势和速度,将极大有助于人类社会控制传染病,保障社会公共卫生安全。希望借助此次竞赛,充分发挥全球选手的聪明才智,运用大数据技术助力传染病的传播预测和控制,增强人类社会合作抗风险的意识和能力。

任务描述:

针对赛题所构造的若干虚拟城市,构造传染病群体传播预测模型,根据该地区传染病的历史每日新增感染人数、城市间迁徙指数、网格人流量指数、网格联系强度和天气等数据,预测群体未来一段时间每日新增感染人数。

赛题共涉及11个虚拟城市90天的感染情况,每个城市有若干重点区域。初赛要求针对所提供的5个城市,利用每个城市各区域前45天的样本数据进行训练,预测每个城市各区域后30天每天的新增感染人数。复赛要求针对包含初赛城市在内的11个城市,利用每个城市各区域前60天的样本数据进行训练,预测每个城市各区域后30天每天的新增感染人数。

数据集:

训练集共包括5个城市,每个城市目录下的数据集总体说明:

  1. 各区域每天新增感染人数。文件名:infection.csv。提供前45天每天数据,文件格式为城市ID,区域ID,日期,新增感染人数;
    【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第1张图片
    【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第2张图片
  1. 城市间迁徙指数。文件名:migration.csv。提供45天每天数据。文件格式为迁徙日期,迁徙出发城市,迁徙到达城市,迁徙指数;
    【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第3张图片【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第4张图片
  1. 网格人流量指数。文件名:density.csv。提供45天内每周两天抽样数据,文件格式为日期,小时,网格中心点经度,网格中心点纬度,人流量指数;
    【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第5张图片【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第6张图片
  1. 网格关联强度。文件名:transfer.csv。城市内网格间关联强度数据,文件格式为小时,出发网格中心点经度,出发网格中心点纬度,到达网格中心点经度,到达网格中心点纬度,迁移强度;
    【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第7张图片【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第8张图片
  1. 网格归属区域。文件名:grid_attr.csv。城市内网格对应的归属区域ID,文件格式为网格中心点经度,网格中心点纬度,归属区域ID;
    【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第9张图片【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第10张图片
  1. 天气数据。文件名:weather.csv。提供45天每天数据,文件格式为日期,小时,气温,湿度,风向,风速,风力,天气;
    【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第11张图片【比赛记录】2020国际大数据竞赛:高传染性传染病的传播趋势预测(一)初读数据_第12张图片

你可能感兴趣的:(大数据,Paddle项目,人工智能,大数据,机器学习,数据分析,csv)