picture from Internet
专栏介绍
长按二维码直接进入专栏
本文为唧唧堂《新冠病毒主题论文导读专栏》,内一篇论文解析,唧唧堂将在本专栏收录发布所有新冠病毒主题的经济金融社会心理等社科类论文解析导读,同时也或将收录部分医学论文。
本专栏论文收录无截止时限,现已有超40篇NBER工作论文解析中,未来唧唧堂将源源不断把发现的新冠病毒主题论文放入本专栏,期待各位研究人的关注与订阅。点击了解专栏!
唧唧堂现招募更多经济金融研究人加入写作小组,以更快完成本专栏内容的解析产出,解析作者在获得固定稿费同时,还将获得付费阅读收入的部分提成。点击加入写作小组!
本文是针对《新冠病毒有多致命?了解预测死亡率的困难(How Deadly Is COVID-19? Understanding The Difficulties With Estimation Of Its Fatality Rate)》的论文解析,文章为美国国家经济研究局(NBER)4月的工作论文。作者是Andrew Atkeson。
研究背景和问题
关于新冠病毒有多致命的问题在流行病学杂志上引起广泛争论。死亡率是1%?0.01%?还是在两者之间?如果我们预测在缺少持续的缓解措施的情况下,最终会有三分之二的美国人感染新冠病毒。那么根据预测的死亡率区间,最多会有220万美国人死于新冠,最少也会有22万人死于新冠。
这场争论的核心是什么?由于缺少可靠的数据(如:现存确诊数,感染后康复并产生抗体的人数),我们无法直接根据观测的死亡数据计算新冠病毒的死亡率,只能基于不完整的统计利用模型来推断新冠病毒的死亡率。然而,简单的传染病模型在流行病的早期阶段并没有多大帮助。由于缺少对疾病发病率的准确观测,直到出现死亡病例,人们才可能了解真正的死亡率。
作者利用简单的SIR模型告诉我们为什么这一疾病的死亡率难以预测,并告诉我们在缺少大规模随机检测的情况下,需要等待多久才能解决预测死亡率的难题。作者关注于流行病开始阶段(大约2020年1月15日)死亡率和初始确诊数联合分布的不稳定性,展示低死亡率、高早期确诊数的模型设定如何在流行病早期阶段给出与高死亡率、低早期确诊数的模型设定相同的死亡人数预测。作者还发现,在采取有效地控制措施后,区分模型的这两种参数设定会变得更困难。
SIR模型
(一)模型设定
假定总人口数N。在任意时刻,总人口N被划分为三类:易感者(无抗体)S;感染者I;移出者R(体内有抗体,已恢复或死亡的患者)。对应群体的人口数随时间的变化如下所示:
参数γ表示感染者康复或死亡,因而停止疾病传播的比率。
参数β_t表示感染者将病毒传染给他们接触的人的比率,该参数受生物疾病传播机制、与他人接触的比率、在社交时使用何种防御措施的影响。因此,参数β可以被一些干预措施如保持一定的社交距离、佩戴口罩等影响。
参数R_t为标准化的传染率。
上述表达式改写如下:
v 表示疾病的死亡率,即死亡人数占移出者的比例,因此,累计死亡人数为D=v *R。单位时间死亡率为dD/dt=vdR/dt。
假定模型的初始状态(t=0)为:R=0,I=I_0,S=N-I_0。
(二)模型性质
1. 模型在稳定状态下,感染者(I)为0,易感者与移出者的总和恒等于总人口数。
2. 如果感染者人数大于0 ,那么当且仅当R_t*(S/N)<1时,感染者人数随时间递减,最终实现感染人数为0的稳态。
3. 现存确诊数对数的增长率如等式(4)所示。
4. 总确诊数对数的增长率如等式(5)所示。
5. 假设死亡率为常数,累计死亡病例对数的增长率等于累计移出者对数的增长率,如等式(6)所示。
测量
(1)假设死亡数据(D)可得,即累计死亡人数和增长率可以测量。(作者做该假定是为了更明显地说明预测死亡率的问题。)
(2)假设从疾病的临床数据可以获得参数γ合理的估计区间,作者设定γ=1/7。
(3)考虑移出者数量(R)的统计。如果可以准确测得R和死于新冠病毒的人数D,则可直接估计死亡率。因此,给定死亡数据准确,大规模的(抗体)检测可以确定谁曾经感染过新冠病毒,然后利用准确的死亡数据直接估计死亡率(例如,德国计划随机对10万人进行新冠病毒的抗体检测)。作者假设数据R不可直接获得,需要通过追踪确诊病例获得。
(4)考虑现存确诊数(I)的测量。如果可以准确地给出I的数据,那么可以根据等式(6)推出R。作者假定现存感染者数量无法准确获得,该数据与恒定的测量误差(η_t)成正比,但测量误差未知。
(5)考虑传染率(R_t)的测量。根据上述假定,现存感染者数量取决于测量误差,则可计算感染者对数的增长。依据等式(4),在流行病早期阶段,S/N接近1,如果可以通过临床数据估计参数γ,继而可以预测早期的标准化传染率。作者假定在流行病早期阶段,如果没有任何预防措施,R_t等于2.5。
作者将模型的初始日期设为1月15日,设定以下两种参数组合:(1)高死亡率情形:初始感染者I_0=330,V=1%;(2)低死亡率情形:初始感染者I_0=3300,V=0.1%。然后考虑在有无预防措施的情况下两种模型的死亡人数和现存感染数的情况。
picture from Internet
实验模型1:R_t恒定
设定在任何时间内,传染率R_t为2.5。
图1给出了高死亡率情形和低死亡率情形在该传染率水平下累计死亡人数的变动轨迹。从长期来看,死亡人数在这两种参数设定下出现了显著差异,在一种设定下累计死亡人数接近三百万,而在另一种设定下累计死亡人数为三十万。