新冠疫情自爆发以来,在全世界已经累计确诊了1000多万人,何时能得到有效遏制依然难以预估。
作为全球最重要的公共卫生事件,新冠疫情对全世界的经济产业、城市运行等都将产生深远影响。对于新冠疫情本身发展及其对各行各业影响的研究也是各个学科的重要议题,而这些研究都基于准确的疫情数据。
疫情爆发以来,各国政府及组织通过多种渠道发布了形式各样的疫情数据,但是大多数据并不能直接用于科研,主要表现在:
①多为零散数据
②数据颗粒度较粗
③缺少历史维度的数据
④形式多为图文,缺少结构化数据
数据下载链接:百度云下载链接
今天我们整理了一些比较优质的数据来源分享给大家,包括:
一. 政府数据开放平台公布的疫情数据
二. GitHub上分享的疫情数据
三. 其它来源的疫情数据
另外,我们也收集了疫情数据相关论文供大家参考。
随着政府对数据开放的重视,越来越多的各级政府建立了数据开放平台,我们对国内发布有疫情数据的政府数据开发平台进行了整理。
本文主要以山东省和北京市政府数据开放平台上发布的疫情数据为例进行介绍。其它可以查到的包括四川、广东、深圳、济南、青岛和贵阳政府的数据开放平台放在了链接里,大家可以自己去研究:
https://share.mubu.com/doc/AsXBCDXCqG
1.山东公共数据开放网
山东公共数据开放网(http://data.sd.gov.cn/)上公布了由省卫健委、济南市、淄博市、青岛市卫健委等发布的九个疫情数据集。
对于每一个开放数据集,平台都提供了基本信息、数据项、数据预览、数据分析、关联信息、文件下载、API服务等信息内容和服务功能。
数据预览:
我们以“山东省新型冠状病毒感染的肺炎疫情情况“数据集为例来预览下数据。
注:
该平台还提供数据分析功能,可根据自己的需要筛选条件直接查看可视化图表。其中,山东省新型冠状病毒感染的肺炎疫情情况”将省内各地级市每天发布的数据都整合在了同一个数据集中。
2.北京市政务数据资源网
北京市政务数据资源网(https://data.beijing.gov.cn/)公布了北京市卫健委提供的“某日北京市新型冠状病毒感染的肺炎信息文件”、“北京某日新冠肺炎新发病例活动过的小区或场所”两个数据集。
平台提供了两个数据集的文件下载、API接口信息,并提供了新发病例活动过的小区或场所的可视化地图和累计按区分布图。
数据预览:
我们以“某一天北京市新型冠状病毒感染的肺炎信息文件“数据集为例来预览下数据。
注:
点开“下载”后,可获得一个数据包,北京市每天发布的病例信息都整合罗列在一起,并每日更新。点开其中的一个数据集就能得到一个EXCEL的表格,该数据集包括了年龄、性别、发病时间和初次就诊时间等数据项。
还有些省市自治区可能没有数据平台或平台里没有疫情数据,那么就需要小伙伴们自行去各级卫健委的通告里去寻找了,或用下面的第三方收集卫健委数据整理的数据集。
这里也附上部分省市、自治区卫健委的网址:
https://share.mubu.com/doc/2ssFAvG1e-G
GitHub作为一个开源的托管平台,上面也分享有一些比较好的疫情数据集,下面将提供三个国内团队(或个人)分享的数据集和国外公认比较好的由霍普斯金大学提供的全球疫情数据集。
其中,国内团队提供的数据集,相比霍普斯金大学提供的数据集来说,国内数据的整理更为精细。
1.国内团队(或个人)分享在GitHub上的疫情数据
【1】Wuhan-2019-nCoV(2019-nCoV全量每日统计数据)
数据网址:
https://github.com/canghailan/Wuhan-2019-nCoV
数据来源:
世界卫生组织、中国国家卫健委级部分下属卫健委、Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China、Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus–Infected Pneumonia
数据说明:
本项目记录了2019-12-01日至今,每日精确到国家、省、市的确诊、疑似、治愈、死亡人数。也包含全球数据。
2019-12-01至2020-01-02数据来自asycns提供的实验室确诊数据(实验室论文原文)。
2020-01-02至2020-01-10数据无变化。
2020-01-10至2020-02-06数据来自国家、各省、武汉市卫健委疫情通告。
2020-02-07后数据从今日头条接口采集,每小时57分自动更新。国家、省级历史数据会根据卫健委数据更新,市级历史数据与卫健委数据有差异(略小于)。
数据各字段已标准化,国家、国家代码遵循ISO-3166标准,省、市遵循中华人民共和国民政部2019年中华人民共和国行政区划代码。
数据格式:
csv、json、xslx
注:
提供俩个API数据接口,并提供省市区、国家代码,数据仍在更新。
【2】DXY-COVID-19-Data(2019新型冠状病毒疫情时间序列数据仓库)
数据网址:
https://github.com/BlankerL/DXY-COVID-19-Data
【3】COVID-19-Epidemic-Dataset
数据网址:
https://github.com/Estelle0217/COVID-19-Epidemic-Dataset
这俩个数据集的数据详情也详细写在了这个链接的文档里,我们就不详细介绍了,需要的小伙伴可以点开查看或者直接点击相应的GitHub网页查看:
https://share.mubu.com/doc/3x70-dR1mqG
2.COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University
(约翰·霍普金斯大学系统科学与工程中心(CSSE)新冠肺炎数据仓库)
数据网址:
https://github.com/CSSEGISandData/COVID-19
数据来源:
见GitHub页面
数据说明:
自1月23日发布COVID-19 全球仪表板以来,此项目已成为全球范围最为公认的疫情可视化平台。这个数据集是2019年由约翰·霍普金斯大学系统科学和工程中心(JHU CSSE)运营的新型冠状病毒视觉仪表板的数据存储库。此外,由ESRI生活地图集小组和约翰霍普金斯大学应用物理实验室(JHU APL)提供支持。
数据格式:
csv
注:
全球范围最为公认的数据,且仍在更新。
除了国内官方和GitHub上提供的数据,想继续寻找其它数据集的小伙伴们可以点开这个链接查看:
https://share.mubu.com/doc/3gZeLzTgoaG
通过上述方式获得疫情数据之后,我们又可以做哪些研究呢?
下面是我们搜集的一些利用疫情数据或以疫情数据辅助其它数据进行数据分析与回顾的研究论文,希望可以为你提供一些新的思路:
疫情参考论文索引:
https://share.mubu.com/doc/1oOkl2PQViG
更多GIS教程学习与数据获取,可以关注地理科学生态网
地理科学数据网 www.csdn.store中富含各种地理科学数据,比如道路网数据、NPP净初级生产力数据、土地利用数据(二级分类)、乡镇边界、NDVI数据、地铁站点、气象数据(降雨量、气温、蒸散量、辐射、湿度、日照时数、风速)、径流量数据、30米土地利用二级分类数据、12.5米高精度DEM高程、2020年行政区划、10、30米NDVI数据、30m精度NPP净初级生产力、夜间灯光数据、统计年鉴、道路网、水系、景区医院等poi、三级流域矢量边界、地质灾害分布数据、30m土壤理化性质数据集、30mGDP柵格数据、30m人口柵格数据、30m精度植被类型数据、30m精度连续年份土地利用数据、GPP初级生产力数据、农田作物类型分布数据、自然保护区分布数据、高精度遥感影像数据、1:10万沙漠沙地分布矢量数据、蒸散发数据、降雨量气温蒸发数据、地表径流量、水汽压、土壤侵蚀数据等,有兴趣的去访问下。