新冠病毒数据分析报告

新冠病毒数据分析报告

数据链接:https://www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset/kernels

1.概述:数据开始日期2020/1/22,数据截止日期2020/3/22。首先对整体做出大概分析和展现,再分别对中国和其他国家做出描述性分析

2.基本特征
新冠病毒数据分析报告_第1张图片

                    图(1)

2.1表1是此次数据的基本特征,经过检查发现国内省份并无缺失(调查发现西藏原有1例,但已经治愈。获取数据中并没有出现西藏),对于其他国家主要针对国家,不关心省份,数据基本完整。

新冠病毒数据分析报告_第2张图片

                                                   图(2)

新冠病毒数据分析报告_第3张图片

                                                  图(3)

2.2图(2)(3)是对于国内外的一个整体展示分析,可知,截止3月22日,意大利确诊人数已经达到69176反超中国。

2.3由图(3)可知,随着时间的推移,在2月12日上升坡度较大,在3月12日确诊人数数量急剧上升,反观治愈人数数量稳步上升,死亡人数,也是在3月12开始出现逐渐上升,可知3月12日病毒肆虐最为严重,达到了爆发点。
新冠病毒数据分析报告_第4张图片

                                                   图(4)

新冠病毒数据分析报告_第5张图片

                                                    图(5)

新冠病毒数据分析报告_第6张图片

                                                   图(6)

新冠病毒数据分析报告_第7张图片

                                                     图(7)

新冠病毒数据分析报告_第8张图片

                                                     图(8)

新冠病毒数据分析报告_第9张图片

                                                      图(9)

3 国内:

3.1.
据图5可知,国内在2月12-13之间斜率近乎垂直,可知病毒传染人数极度增加,且前面提到世界也在12-13日病毒传染人数急剧增加,由此可推断,在12-13日世界感染人数的增加量主要来与中国。

验证推断:

country=df[df['Country/Region']=='Mainland China']        
country1=country[country['ObservationDate']=='02/12/2020']['Confirmed'].sum()        
country2=country[country['ObservationDate']=='02/13/2020']['Confirmed'].sum()       
print(country2-country1)
       
other_country1=df[df['ObservationDate']=='02/12/2020']['Confirmed'].sum()        
other_country2=df[df['ObservationDate']=='02/13/2020']['Confirmed'].sum()
print(other_country2-other_country1)

在这里插入图片描述

根据计算,国内12-13日感染人数为15133人,世界感染人数为15148人,可以证明图3世界感染人数突然小幅上升的主要原因是,在这一天国内感染人数增加幅度大,从侧面反映出至少在2.12-2.13之间病毒主要在国内传播。

3.2.确诊人数在三月初斜率基本水平,即感染新增人数逐渐的减少,在2月20日到23日之间,康复人数基本成阶梯式上升,随后
康复人数逐渐上升。死亡人数一直处于一个偏低的状态。

3.3如图(5)(6)(7)(8)可知,确诊/死亡/康复在湖北省的人数都远高于其他省,众所周知,此次病毒首次发现也是在湖北,在图(9)中可知,省份康复率都高达75%以上, 死亡率也在10%左右。
新冠病毒数据分析报告_第10张图片

                                                    图(10)

新冠病毒数据分析报告_第11张图片

                                                     图(11)

新冠病毒数据分析报告_第12张图片

                                                      图(12)

新冠病毒数据分析报告_第13张图片

			                              图(13)

4.国外:

4.1 如图(10) (11) (12) 分别取确诊/死亡/康复前20的国家,显然截止3/22日,意大利的确诊人数已经达到了69176人,死亡人数也是远高于其他国家,在康复人数的数量伊朗排名第一。

4.2
根据图(13)所示,虽然伊朗和韩国的康复率是远高于其他国家,但最多只有40%,而国内的康复率基本达到75%以上。在死亡率上国外最高为10%,与国内湖北省基本持平。

5.总结:

时间2020/1/22-2020/3/22。分别进行三方面描述;1是世界整体病毒传播情况,2是对于国内病毒的传播情况,3是对于一部分其他国家,都对其进行了展示与分析,根据目前情况来看,在病毒发展初期,中国传播较快,确诊人数也快速增加,从三月初开始,国内疫情得到控制,康复人数稳步上升,确诊人数几乎不再增加,相反国外传播势头迅猛,以意大利为首确诊人数反超国内,并且,观察数据可知,美国截止3/22日共有25681人,可康复率仅有2%左右,预测美国将在未来与意大利的确诊人数会大幅上涨。

你可能感兴趣的:(奔奔的项目1)