我手机的阅读app里有五个收藏夹:买过、翻过、看过、读过、学过。目前“买过”里还躺着上百本电子书。每年大概会增加几十本“翻过”。而能入选“学过”目录的,一个赛季下来超不过五本。今年的第一本已经出现了:《模型思维》,作者是密歇根大学复杂性研究中心前主任斯科特·佩奇。
这本书讨论了“为了应对世界的复杂性而发展出的各种工具和思想,以提高读者的推理、解释、设计、沟通、行动、预测和探索的能力。”而其中有一个主题就是:广播、扩散和传染模型。
一、数据→信息→知识→智慧
一个人身体不舒服,去医院做检查就会产生一些数据。
对数据的归类产生信息。比如某地区近期内发热病人的数量。
知识将信息组织成模型的形式。这些模型能够解释现象并预测趋势。比如流行病学模型。
智慧是识别和应用相关知识的能力。有时需要挑选出最优模型,更多的时候则需要运用多模型思维。
开展抗疫工作需要大智慧,而在为其提供支撑的多模型中,大众传播模型无疑是不可或缺的一个。
二、广播模型
大众传播模型有两个基本款,广播模型和传染模型。其中比较简单的是广播模型。
贵公司准备在微博上投放开屏广告。假设微博的总用户数为M,其中产品的潜在用户为N,这些人只要看到了广告就会点击购买,微博每天的用户打开率为P%。所以第一天,会有N×P%人被广告俘获,还剩S=N-N×P%没有被触达。第二天,这剩下的S个潜在用户里,又会有S×P%人被感染…
很明显,广告投放人群中的潜在用户N越多,广告被展示的概率P%越大,广告的效果就越好。下图模拟了四种情况下,被广告“感染”的人数随时间变化的趋势:
在连续投放50天后,四条曲线都达到了饱和,这反映了广播模型的特征:只要时间足够长,所有易感人群最终都会被感染。
累积到第十天,四种方案分别触达了3万、4.4万、6万和8.8万人。既然N和P%越大,效果就越好,收费自然也就越贵。《新闻联播》之后的“标王时段”,依仗的就是其卓越的收视率P%。微博时不时会“帮”你关注一些人,也是为了做高活跃用户率P%。央视的价码比地方台高,因为前者有更大的覆盖用户数N。
捷径在于渠道一般按总用户数M收费,但厂商真正关心的是其中的潜在用户数N。因此找到N/M更大的渠道,就能花小钱办大事。汽车用品投虎扑的性价比很可能要比微博更高,尽管前者的用户要小很多。所以在平台型的渠道商之外,像KEEP、雪球这样的垂直领域应用也能闯出自己的一片天地。
总结起来,广播模型更像是一种“洗脑式”的传播,只要持续不断地广播,最终所有的易感者都会“中招”。好在真实世界的病毒并没有这么大的能量,传染病遵循的是另外一类模型。
三、传染模型
病毒以及病毒式营销的传播并不依靠持续的广播,而是经由人与人之间的“接触”和“分享”。传播的受众被称为易感人群N,这是模型的基本盘。把一段鬼畜视频扔到广场舞微信群里估计没法引发传播,这个人群对二次元不易感。但是新冠病毒对各个年龄段普遍易感,抗疫的战线因此不得不被拉得很长。
除了易感人群数量N,第二组影响疫情蔓延的因素是扩散概率Pd,它等于接触概率×分享概率。新冠病毒另一个很棘手的特点是主要通过空气传播,相比乙肝、艾滋这种只通过唾液、性传播的病毒,它的接触概率要高得多。全民居家隔离能够降低接触概率,也就是张文宏医生说的“闷死病毒”。外出带口罩、勤洗手也可以帮助降低这个指标。
在易感人群数量N和扩散概率Pd之外,第三个影响传播的因素是已感染者占整个易感人群的比例I/N。显然,这个密度越大局势就越严峻。比如“钻石公主号”,比如武汉同全国其他地区的抗疫难度不可同日而语。
最后是一个积极因素:治愈率Pr。当然是越高越好。
把以上因素综合到一起,就得到了流行病学研究中很重要的SIR(易感者、感染者、痊愈者)模型:
I(t+1)=I(t)+Pd·(I(t)/N(t))·(N(t)-I(t))-Pr·I(t)
《模型思维》书中给出的这个公式是对“教科书”里微分方程组形式的SIR模型的简化。通过对感染周期归一化处理,将微分方程转化为了差分形式。
在SIR模型涉及到的所有参数中,扩散概率与治愈率的比值Pd/Pr是一个重要指标。这个比值其实就是前段时间被刷屏的基本再生数R0。我查了一些其他资料,发现对R0的理解和计算都是很复杂和专业的事。在斯坦福大学人类学院一份署名为James Holland Jones的讲义“Notes On R0”里写到:R0≈Pd/Pr是一种mathematical trickery的近似。
R0的临界值是1,当R0>1时,疫情很可能会爆发,当R0<1时,则可能会自己逐渐消失。R0越大代表病毒的传染性越强。而根据R0≈Pd/Pr也很好理解:R0越大说明扩散率高而治愈率低,当然情况就越严峻。相反,如果痊愈的速度Pr>感染的速度Pd,那么R0<1,疫情就很可能不会蔓延。
R0指标很重要,但它也没有那么决定性的意义。这次疫情爆发的初期,哈佛大学一名教授借用圣女之名,形容新冠病毒3.8的R0是核弹级别的数据。
现在看来他这个表态似乎激情有余而稳重不足。《模型思维》里列举了好几种传染病的R0都高于新冠。
R0高,传染性强,但并不意味一定会猛烈蔓延。R0更恰当的定位是作为一个警惕性指标,提醒卫生部门对特定传染病该给予何等程度的重视。更为重要的是,R0并不是一个常数,而是可以被隔离等手段大幅降低的。
四、各司其职、三箭齐发
我根据书中的传染病模型做了一个仿真,假设易感人群数为一百万,病死率为1%,疫情初期的R0为1.25,在疫情爆发100天后,用三十天的时间将R0从1.25压制到0.97。仿真显示,这一举措可以极大地抑制疫情规模,将感染人数的每日峰值从十八万降低到两万。死亡总数也会减小近两个量级。
上图似乎还表明,即使任由疫情自由发展(红色曲线),感染人数也会自动出现拐点。这从某个方面解释了即使在没有任何现代卫生系统和医疗手段的古代,遭遇到更为烈性的传染病,人类也没有被团灭。但这个“拐点”背后隐藏的残酷事实是:巨大的死亡人数以及感染人数导致模型的第二项中(N-I)/N变得很小。也就是说等病毒席卷了整个易感人群,所谓的“拐点”也就来到了。
这样“虚假的胜利”当然是不能接受的,我们的目标是绿色曲线中人为制造的拐点。对照曲线背后的公式,能做的有三件事。
第一、研发疫苗,降低易感人群总数N。历史上不可一世的天花病毒就是在人类发明了种痘术之后绝迹的。这是一项长线工作,取得成功的时间可能需要以年来计算。这是科技界的主战场。目前已经有临床实验在进行中。
疫苗接种的阈值可以通过公式(R0-1)/R0求出,如果新冠病毒的天然R0值为3.8,那么疫苗接种率达到74%就能阻断病毒的传播。
第二、通过提高治愈率来降低R0。这是医疗界的主战场。从仓促应对到掌控大势至少需要数以月计的时间。再次向一批又一批奔赴前线的医护人员致敬。
第三、通过降低扩散率来降低R0。这是普通人的主战场。我们每个人的日常行为都在影响战局。
而人类终将取得胜利。
五、所有模型都是错的,但其中有些是有用的。
前面着重讨论的SIR模型并没有考虑潜伏期以及痊愈者是否带抗体等因素。所以它肯定是错的,但是对抗疫工作而言,它无疑也是有用的。分析这样的复杂问题还应该考察更多的模型,也就是本文开篇芒格提倡的多模型思维方式。至于多少个模型才足够?这些不同的模型之间要满足怎样的关系?《模型思维》这本书里也有涉及,我们下次再讨论。比如在麦肯锡近日发布的报告中有一张定位图,也为看待新冠疫情提供了一个视角。
模型思维可以为分析复杂系统提供一种思考框架,希望通过本书的阅读、学习和分享能给你我增添一些解决真实世界中棘手难题的智慧。
参考文献:
1、斯科特·佩奇《模型思维》
更多内容关注公众号《周工讲理》:用理工思维生活育儿。