本次实验的数据采用多种第三方网站的数据源,分别来自百度疫情实时大数据报告、腾讯新闻网,通过 Python 的 Request 库进行网络爬取,这样可以使得实验的数据为最新且实时动态更新,更有利于进行疫情数据的分析。通过爬取到的数据,利用 Pyecharts 库进行可视化数据分析,将繁琐的数据转换为于理解的图表形式,并发布在基于 Flask 架构下的前端网页上,方便用户浏览和观察。
(1)网络爬取下载并处理疫情数据(使用 request,numpy,pandas ,josn,openpyxl 等第三方库);
(2)绘制我锅疫情地图(使用 pyecharts 库),显示确诊地图即可,地图上疫情数据具体到省一级,能实现交互式展现:拖动图表滑块,可根据时间实现数据更新;
(3)可视化给定国家,给定时间段的疫情发展曲线(实现普通坐标和对数坐标两种方式,包括确诊、sw和治愈的数据曲线,使用 pyecharts 库等);在我锅、意大利、伊朗、西班牙、美国、德国、英国、法国、日本、加拿大、韩国等共计 11 国及我锅各省、美国各州、世界七大洲等进行疫情数据可视化;
(4)结合疫情数据中确诊、治愈和sw数据的情况,对比分析我锅和美国的疫情特点(重点:自行设计图表等形式给出数据支撑,具体的省/州一级,并分析原因,给出自己的观点并采用不同的图表支撑自己的观点,例如折线图、柱状图);
(5)设计前端页面(使用 Flask 架构),展示上述功能和结果。
码云下载地址:点击跳转