前言:前一篇介绍了对平稳时间序列的分析方法和流程,在没有考虑季节效应的情况下,模型建立的并不成功。本篇以美国1980年-2015年月度失业率为对象,进行一个更为完善的、有季节效应的非平稳时间序列分析流程。
理论支持:
拿到非平稳时间序列,首先进行的就是差分法消除趋势性,然后根据情况判断拟合季节加法模型或乘法模型,最后进行模型检验。常用的模型有两种:ARIMA和因素分解模型。
步骤:
一. 数据录入,做出时序图
data unem;
input rate@@;
time=intnx('month','01jan1980'd, _n_ -1);
format time monyy.;
cards;
…………
;
run;
proc gplot data=unem;
plot rate*time/ vaxis=2 to 13 by 0.5;
symbol v=none c=red i=join;
run;
初步观察发现,序列有明显的趋势性和周期性。
二. 对原序列进行1阶12步差分,做出差分后时序图并进行ADF、白噪声检验
data unem;
input rate@@;
difrate=dif12(dif(rate));
time=intnx('month','01jan1980'd, _n_ -1);
format time monyy.;
cards;
………
proc gplot;
plot rate*time difrate*time;
symbol v=none c=red i=join;
proc arima data=unem;
identify var=difrate stationarity=(adf);
run;
由ADF和白噪声检验得知,差分后的序列为平稳非白噪声序列。
三. 模型定阶,选择加法还是乘法模型
通常来说,加法模型适用于序列的季节效应,趋势效应和随机波动彼此之间很容易分开。但实践中更常见的情况是,序列的季节效应、长期趋势效应和随机波动之间存在复杂的交互影响关系,简单的加法模型不足以充分提取相关关系,此时应当使用乘法模型。
此例中,自相关图显示延迟12阶自相关系数显著大于二倍标准差,说明差分后的序列具有显著的季节效应,此外延迟2、3、5阶也大于二倍标准差,意味着差分后序列还具有短期相关性。在通过加法模型无法充分提取的情况下,我们尝试使用乘法模型,构造原理如下:
定阶分析过程:
首先观察1阶12步差分后系列12阶以内的自相关系数和偏自相关系数的特征,以确定短期相关模型。自相关图和偏自相关图显示12阶以内均不截尾,考虑使用ARMA(1,1)模型提取短期自相关信息。
再考虑季节相关性,检查延迟12阶、24阶等以周期长度(12)为单位的自相关系数和偏自相关系数的特征。自相关图12阶自相关系数显著,但是24阶系数在二倍标准差范围之内。而偏自相关图显示12阶和24阶都显著,且12阶到24阶之间没有超出二倍标准差范围。因而可以认为季节自相关特征是自相关系数截尾、偏自相关系数拖尾。此时用以12步为周期的ARMA(0,1)12模型提取季节自相关信息。
综上,最终要拟合的乘法模型为ARIMA(1,1,1)*(0,1,1)12。
四. 参数估计
模型定阶之后,参数估计就简单很多了。
/*注释:乘法模型常见格式为ARIMA(p,1,q)*(m,1,n)s, sas拟合命令为:
identify var=x(1,s);
estimate p=(p)(ms)q=(q)(ns)
第一句命令要求系统进行一阶s步差分,这里我们前面差分过了因此不用写。
第二局命令要求系统对差分后序列拟合非季节效应模型ARMA(p,q)与季节效应模型ARMA(m,n)s。合并起来就完成了乘法模型的拟合。*/
estimate p=(1) q=(1)(12) noint;
run;
五. 模型检验
六、问题原因及处理:
传统的纯随机性检验都是借助LB检验统计量进行的,而LB检验统计量是在序列满足方差齐性的假定下构造的。当序列存在异方差属性时,LB统计量不在近似服从卡方分布。所以在条件异方差存在的场合,白噪声检验结果不再准确。通常现象就是残差序列的相关系数很小,近似白噪声序列,但是LB检验结果P值很小。因此,在异方差可能存在的场合,如果自相关系数很小(<0.2),则可以认为残差序列近似为白噪声序列。
残差自回归性检验和异方差性检验:
使用model语句,让系统建立序列关于时间的线性回归模型,检验残差序列5阶延迟的自相关性并输出DW检验的p值,同时对残差序列进行异方差检验:
proc autoreg data=unem;
model difrate=time/nlag=5 dwprob archtest;
run;
DW检验结果,R方很小,模型不显著,证明残差序列不具有显著的自相关性,这与我们之前分析的结果相同(相关系数<0.2,残差序列可以认为是白噪声)。
参数估计也表明回归模型不显著,因而总结为残差序列不具有自相关性
异方差性(ARCH)检验:
图中Q统计量和LM统计量的P值均小于0.05显著性水平,因而可以认定该序列方差非齐。
剩下的步骤为构建GARCH或ARCH模型以及检验,最后预测,内容较多,放在下一篇讨论。