picture from Internet
专栏介绍
长按二维码直接进入专栏
本文为唧唧堂《新冠病毒主题论文导读专栏》内一篇论文解析,唧唧堂将在本专栏收录发布所有新冠病毒主题的经济金融社会心理等社科类论文解析导读,同时也或将收录部分医学论文。
本专栏论文收录无截止时限,现已有超40篇NBER工作论文解析中,未来唧唧堂将源源不断把发现的新冠病毒主题论文放入本专栏,期待各位研究人的关注与订阅。点击了解专栏!
唧唧堂现招募更多经济金融研究人加入写作小组,以更快完成本专栏内容的解析产出,解析作者在获得固定稿费同时,还将获得付费阅读收入的部分提成。点击加入写作小组!
本文是针对论文《新冠肺炎传播模型的政策启示:经济学家们的视角和机遇 (Policy Implications of Models of the Spread of Coronavirus: Perspectives and Opportunities for Economists)》的一篇论文解析,该论文为2020年4月份发表于美国经济研究局(NBER)的一篇工作论文。该研究作者包括Christopher Avery, William Bossert, Adam Clark, Glenn Ellison 和 Sara Fisher Ellison。
研究背景
有关COVID-19的报告、预测以及政策变化自今年3月份开始层出不穷,说明了对于疾病的实时预测既具有政策关联性,同时又具有极大的不确定性。各个国家政府机构对于疾病发展的预测在量级上大不相同,例如特朗普称英国将会有50万人死于新冠肺炎疾病,美国在不控制流行病传播的情况下将会有220万人死亡;英国政府首席科学顾问Patrick Vallance则提出英国如果在疫苗研制之前采取实质性的活动限制措施将会导致2万人死亡;3月31日,美国白宫新馆病毒应对协调员Deborah Brix报告指出白宫在综合考虑5至6位国际和国内专家模型预测后结论为采取完全缓疫(Full mitigation)策略会减少美国10万至20万的死亡人数;美国国家过敏和传染病研究所主管Anthony Fauci则对这些预测持怀疑态度,他认为如果能够获取更多数据模型预测的结果可能会改变。
自实行了数周的“保持社交距离”(social distancing)措施之后,英国与美国官方通报的与SARS-CoV-2关联的死亡人数虽然少于帝国理工大学模型中最悲观预测情况,但也已经高于其他广泛公布的预测数据。由于目前尚处于疫情的早期阶段,仍需要有理有据的模型为建设性的政策决定提供信息。因此本文将对几个领域的相关文献进行综述,目的在于为经济学家和其他社会科学家们提供原创研究的基础。
代表模型及特点
对于疾病的传播通常有2类基本方法进行建模:(1)机理方法(Mechanistic)和(2)现象逻辑方法(Phenomenological)。这两种建模方法的区别类似于经济学中的结构模型(Structural-form)和简约式模型(Reduced-form)。正如结构模型能够拓展模型进行反事实检验一样,疾病传播中的机理模型也强调样本外预测的重要性,关注疾病潜在的驱动模式。相比于个体变量的状态,疾病传播模型中更关注变化比率,所以模型中通常包括新个体感染比率,已经感染的个体痊愈或死亡的比率等等。在流行病学中现象逻辑模型和机理模型的一个根本区别就是模型是如何参数化的,而不是方程形式本身。机理模型是基于先验生物学假设,或者实际去检验出感染个体并追踪他们的接触者和导致的感染者进而拟合模型,所以机理模型正像宏观经济模型中确定参数拟合数据一样,通过校正其他参数去匹配外部情况。而现象逻辑模型则是基于已报告的病例和死亡数据进行曲线拟合,从而进行参数化。
在研究SARS-CoV-2传播中最常用的建模方法就是SIR模型(疑似/感染/痊愈,Susceptible/ Infectious/ Recovered)。本质上SIR模型可以看作是有限几个状态转换的持续时间马尔科夫链模型,基本形式如下:
其中S,I,R是模型中的三类人群状态,分别代表易感人群、发病人群和治愈人群,β代表有效接触率,γ代表疾病导致的痊愈率或死亡率的参数。在SIR模型中,疾病扩散会发展到
为止,即新增感染者的增长速率不能赶上治愈率(这个点最终都会达到,因为在模型中痊愈人数是线性相关于发病人群I的,而感染率是非线性相关于I和S,因此新增感染者最终会开始下降,疾病不再扩散)。这个门槛点(通常被称为群体免疫点)决定了疾病在人群中传播所需要的最小易感染人群的多少。更重要的是,达到群体免疫门槛点之后,即使个体还在被感染(特别是当感染人群基数比较大的时候),平均意义上每个时间点的新增感染者会开始减少。
SIR模型中的个体被假设为是无限可分的,并且所有状态的转化都可以建模为指数形式,可以用其半衰期的特征来表现。另外可以在模型中加入时间滞后性,例如,因为SARS-CoV-2的潜伏期为5-6天,将SIR模型拓展为SEIR模型就可以将第4种状态(暴露状态,Exposed)纳入分析。此外,还有许多可以加入模型中的变量,例如SAIR模型中纳入了无症状感染的状态(Asymptomatic infected state)。整体上来说,这些模型在传染病学当中统称为隔室模型(Compartmental models)。不同的隔室模型设定的状态、转化率以及最后的测结果会有很大不同,影响建模的结果的因素通常包括传播类型(频率依赖性传播/密度依赖性传播),β和γ参数进入模型的位置,地理、人口结构等因素的加入,人口箱中生殖和死亡率的应用,免疫力丧失等等。不同的隔室模型的基本区别包括:(1)隔室数量和特征的不同;(2)时间维度是连续的还是离散的;(3)动态是完全一成不变的还是随机的;(4)随机性是如何进入模型的;(5)是否有量化/减少观测误差的措施;(6)人口/空间因素的加入;(7)其他情境因素,包括医院容量、ICU病床数、保持社交距离策略等因素。
基础SIR模型的一个显著缺点是很难考虑状态频率和比率常数的异质性。建模中最重要也最具有挑战性的异质性是随着时间变化的个体行为,因为疾病的发展可能会使个体减少与他人的接触,因此那些未经验证的指数型疾病传播模型与人们现实中的行为变化并不吻合。本文第三部分提到了可能存在5大方面的异质性:(1)面对疾病的异质性暴露:例如城市的社会交际行为通常多于乡村、护士房和需要长期护理的病房通常面临更高的感染风险、聚会和球赛等人群密集聚集型社会活动更容易导致疾病传播;(2)人群特征的异质性差别:年龄、性别、现有健康状况都会影响感染的可能性。例如,现有数据表明在12-14个国家男性感染疾病的死亡率高于女性50%;患有高血压、糖尿病和肥胖等并发症的人群风险更高。作者建议在建模时应该考虑到不同国家城市和人群的异质性,但是这样的分层对健康状况和死亡率的数据有更高的要求,目前的数据还不能够满足;(3)不同地区医疗条件的异质性:例如美国每千人拥有少于3个医院床位,位居世界第32位,而韩国、日本和德国则每千人至少拥有8个医院床位。医疗资源在疾病感染率达到顶点时至关重要。(4)暴露程度和性质的异质性:在病毒携带量更高的情况下会导致更严重的病情;(5)病毒多重菌株的异质性:目前已经发现了8种SARS-Cov-2病毒菌株,但尚不清楚有多少种菌株存在。尽管抗体可能长期存在,但是尚不确定对一种病毒菌株免疫的个体是否也对其他种菌株免疫,以及是否会有较少致死的病毒菌株变异出来也不能判断。
除了异质性的问题,SIR模型还面临着3个其他的挑战,使得模型的动态性难以预测。首先,因为模型使非线性的,参数值微小的变化对于动态的影响都会非常显著。例如,给定SARS-CoV-2在流行初期的倍增时间,两个地区分别有1个和100个感染者,即使其他方面完全相同,也将会导致超过3周时间差的病例数,当模型中各个变量的数值都存在高度不确定性时这个问题尤其突出。第二,由于模型中的动态性既复杂又不具有单调性,传统模型诊断和拟合工具可能并不是判断模型好坏的良好指标。例如许多模型对于前疫情初期阶段的预测非常准确,因为感染病例的增长几乎是指数型的,但是较少有模型能够预测新增感染数开始下降的饱和点,更少有模型能够预测疫情峰值时期的感染者数量。第三,疾病的传播具有显著的时间差,不仅使得模型很难正确地把这个因素纳入进去,而且也很难识别疾病传播干预措施的效果,因为已经观测到的病例数量的变化会落后于感染时状态数天。
遗憾的是,上述问题对于SARS-Cov-2疫情的预测都十分重要。因为预测必须实时进行,现在疫情各方面指标比率和状态的不确定性非常高,全球负责收集和报告数据的机构面临着前所未有的压力。由于极高的无症状感染率,想要识别真正感染者数量也是十分困难的。并且从感染到发病之间有着相当长时间的滞后期,政策干预和其产生的效果之间也存在着一周或以上的时间差。
picture from Internet