夏天终于到了!
一年一度的五一劳动节,标志着夏季的到来,这几日的炎炎烈日正是太阳亲切的问候。在经历了艰辛和坚持后,社会生活秩序渐渐恢复。正如肖恩也回到了学校,准备毕业,然后步入社会。在社会重回正轨之际,看着海外严峻的疫情形势,我们不禁要问,这新冠疫情何时是个头?我们面前的口罩几时能脱下?
2003年,SARS席卷我国时,在夏季突然销声匿迹。于是我们期待着,COVID-19也能像SARS一样,被炎热逼退。但是
- SARS的离开真的是因为炎热吗?
- 如果SARS不耐热,那么COVID-19也不耐热吗?
新冠肺炎是否耐热,是否会在夏季消失或者减弱,这里面有许多的问题需要回答。而目前我们知道的还是太少了。我们可以给出概率统计, 但所有的概率统计,都是基于已知信息的最可能估计,不代表事件实际发生的可能性大小。
时至今日,疫情已在全球范围内肆虐了近3个月,纵观世界疫情整体情况,战斗没有停止,且在某些地方愈战愈烈。在中国,疫情并没有离开过,现在的它,只是去了别的地方,并试图返回中国。 今天我们再来做一些分析,看看疫情影响疫情的关键因素。本人能力有限,欢迎看客前来指正和建议。
数据获取
- 最最原始的数据是丁香园的
- 我这里使用的是github上别人爬取的数据,BlankerL/DXY-COVID-19-Data(2020-05-02,我发现丁香园和腾讯的数据某些国家上有较大的出入)
病死率的走势
一个国家的确诊人数,是由许许多多因素共同作用的结果,比如国家的政策,民众意识,民族文化,防护措施,病毒在该地的适应性(气温等);这里面我认为国家的防疫措施最为关键,比如严格的隔离政策和经济稳定措施。而一个国家的病死率,可能更多的体现在医疗水平上和医疗物资水平。然而,许多发达国家,医疗水平近似,死亡率却相差很大,有些国家病死率约为5%,而有些国家病死率接近15%。
我们先来看一下几个疫情重灾区的病死率走势:
确诊人数与病死率
上图中,几乎所有的国家的病死率都是日益增加的,这可能和不断新增的确诊人数有关。当确诊人数达到当地医疗系统的上限时,医疗系统必定会陷入几近瘫痪的状态,物资告急,医务人员短缺,病床不够等等,不仅会大大降低院内病人的治愈率,更可悲的是大多数人可能一诊难求,病死家中。病人的病死率随着确诊人数的增加而增大。
那么病死率和确诊人数又有怎么样的关系?
为了让数据更有统计意义,我这里只统计目前累计确诊人数达到1000的国家或地区。这里我们不统计具体人数和病死率,只统计排行RANK。下图,是确诊人数排行和死亡率排行的连线图,左侧为确诊人数排行,右侧为死亡率排行。我们来看看哪些国家较好的控制了病死率,而哪些国家失控了。
这是确诊人数排行和死亡率排行之差的频数统计
我们可以看到:
- 整体上看,高确诊人数的国家对应着较高的死亡率,低确诊人数的国家对应着较低的死亡率(大多数的线接近水平,斜率不大,频数大多数在0附近)
- 我们也可以在第一张图明显地观察到一个类似于“X”的图形
- X的中斜向下的国家,这些国家有着较高的总确诊病例数,但是其死亡率排行却不高,说明了他们有较好的治疗效果,控制住了病死率。我们将这些国家称为低病死率国家
- X的中斜向上的国家,他们总确诊人数不高,但是死亡率却较高,看来是医治不利。我们将这些国家称为高病死率国家。
这里的低病死率和高病死率,不是病死率的绝对值高或低,而是相对于确诊人数排行来确定的。
高/低病死率国家有什么规律吗?
如果我们可以找到高低病死率国家的一些通性,就可以预测一些高危地区,可能会对疫情的防控有所帮助。比如高低病死率是否和温度有关,是否和医疗条件有关等等。
我们先看看高低病死率国家分别有哪些?
低病死率 : ['德国', '俄罗斯', '土耳其', '秘鲁', '印度', '葡萄牙', '沙特阿拉伯', '新加坡', '巴基斯坦', '智利','以色列', '白俄罗斯', '卡塔尔', '阿联酋', '乌克兰', '韩国', '塞尔维亚', '孟加拉国', '澳大利亚', '科威特', '哈萨克斯坦', '巴林', '阿曼']
高病死率 :['印度尼西亚', '菲律宾', '埃及', '芬兰', '阿根廷', '阿尔及利亚', '匈牙利', '希腊', '尼日利亚', '伊拉克', '克罗地亚', '喀麦隆', '波黑', '爱沙尼亚', '保加利亚', '波多黎各', '古巴', '北马其顿', '立陶宛', '斯洛文尼亚', '斯洛伐克', '新西兰', '玻利维亚']
把他们画在地图上 是这样的:
蓝色:低病死率国家, 橙色:高病死率国家,绿色为目前无感染的国家(绿色部分由于国家名称不匹配问题,可能并不完全正确)
高温能抑制疫情吗
从这张图,我们其实也能看到一些信息,高低病死率和温度是没有关系的。我们能看到,高病死率或者低病死率都在低/中/高纬度有所分布。无感染国家也无明显纬度分布特点。
为了更直接验证温度是否影响病毒的传播,我又统计了最近一周各国出现的新增确诊病例数,看近一周的新增病例分布与纬度是否有关联。
但像美国和俄罗斯这样的大国,因为国家大,人数多,所以总确诊人数多,所以为了去除国家面积这个bias,我尝试使用确诊人数除以总国土面积(其实貌似除以总人口也可以),在一定程度上补偿国家大小带来的偏差,但在国土面积较小时,很不稳定,所以改用周确诊人数除以log2(国土面积),结果再取log作图:
呈现在地图上:
从上图,也能看到周新增较多的国家,大多数是人口大国和欧洲国家,在维度上,并没有什么明显趋势。反而像新加坡,多米尼加这样的低纬度国家疫情发展迅速。
经济水平对疫情防治的帮助
最后,我们来看一下,不同国家经济水平是否对疫情的治疗有影响。这里统计了高/低病死率国家的人均GDP(GDP per capita),通过可视化和T-test假设检验来统计高/低病死率国家在经济水平上是否有显著差异。
可视化为SwarmPlot + Boxplot,可见低病死率的国家整体上拥有较高的人均GDP。
使用T-test检验显著性,t=-2.27, p = 0.028,具有统计学意义。较好的经济水平确实与控制病死率相关。
结语
疫情的传播的防控需要国家的严格措施,而疫情的病死率需要足够的经济和科技力量去控制,然而如果确诊人数居高不下,无论多强大的经济和医疗水平都可能显得无力。在疫情面前,防控 >> 治疗。如今,我们能开学,能开心地和父母通话,都需要感谢国家的力量。
而我们需要谨记的是,疫情仍未离去,既然高温杀不死它,那么什么可以呢?可能明年的疫苗,也可能是全球人民众志成城隔离的决心,抑或某种药物。无论如何,我们都知道这将是漫长的战斗,我们不知道何时能战胜它,一年两年三年四年,前路艰辛,但我们坚信胜利。全球有无数的医护人员在努力和牺牲,无数的科研人员在追赶时间,无数的警察、安保在严格排查,更是有数不清的你我他在疫情期间自我隔离。我相信团结的力量,不会让大家的努力付之一炬。
最后,地球是个村,村子越来越小,鸡犬相闻,老死不相往来的日子已经过去。在面对这类全球的公共卫生危机时,没有人可以置身事外。新冠纵然非我们所愿,也是一次警钟。如何面对全球灾难,是所有村民需要思考的问题。
2020-05-03