高手对2020年疫情趋势做一下数学模型分析

本文应用了传统时间序列模型、LSTM模型、多项式模型等来对武汉新型冠状病毒的传播人数做了模型拟合和预测,并且结合其它相关研究对未来的防疫策略提出了建议。

一、研究背景

2019年12月中国武汉出现一种新型的冠状病毒,在极短的时间爆发出很强的传染性,虽然目前的致死率并不高,但是如果不对其进行抑制,会给整个社会造成很大的影响。本次病毒传染速度快,又正逢是中国传统春节、春运等增加人流量的时间点,所以基本没有过去经验可以作为参考。本文作者二人决定采用多种模型对此次病毒传播进行拟合分析,并对未来的传播抑制作出预测和建议。本文的研究数据量因公布数据量少的原因并不是很大,且研究过程也比较短,研究成果更多的是给其他学者提供一些思路上的建议,并且乐于向其它学者分享已拥有的数据。

本文结构如下:第二章将首先采用传统的时间序列模型来进行拟合并预测,再使用LSTM模型对确诊数量进行进一步的预测;第三章将使用线性和多项式拟合来预测接下来的感染人数趋势;第四章将更多相关研究作介绍,并针对本次武汉新型冠状病毒传播做一些相关的预测和免疫策略建议。

二、时间序列分析

2.1 传统时间序列模型

2.1.1 模型建立的准备工作

鉴于以前有学者应用过传统时间序列模型来拟合SARS病毒的传播过程,我们也决定采用传统时间序列模型来进行拟合。首先将全国的感染人数时间序列导入,并做一个初步的可视化:

(所有数据来源于丁香园实时公布的数据)
高手对2020年疫情趋势做一下数学模型分析_第1张图片
我们明白这个序列是有一个向上趋势的,而ARIMA模型建立的条件为平稳序列,所以我们必须对此序列进行差分处理。而总感染人数的一阶差分即为每个时间点新增感染人数,时间序列图如下:
高手对2020年疫情趋势做一下数学模型分析_第2张图片
我们清楚每个时间点新增感染人数一定是非负数,所以一定也不是平稳序列,我们进行白噪声检验来验证这个猜想:

for(i in 1:4)print(Box.test(dif,type = “Ljung-Box”,lag = 6*i)) ## 白噪声检验
Box-Ljung test
data: dif
X-squared = 1.6747, df = 6, p-value = 0.9471
X-squared = 3.366, df = 12, p-value = 0.9924
X-squared = 7.738, df = 18, p-value = 0.9823
X-squared = 10.818, df = 24, p-value = 0.9902
不管延迟多少阶,p值都远大于显著性水平0.05,所以不能拒绝此时间序列为白噪声的假设,此序列没有信息可以挖掘,所以必须还要进行二次差分。二次差分后图像如下:
高手对2020年疫情趋势做一下数学模型分析_第3张图片
如果没有过硬的数学实力,那么我们怎么能通过已知数据在进行数据分析呢?

点击查看我的下一篇文章。

你可能感兴趣的:(数据分析)