零售门店营业额预测分析(时间序列建模)

一、 观察数据
某公司门店营业额数据报表(虚拟数据,非真实数据)如下:
零售门店营业额预测分析(时间序列建模)_第1张图片
零售门店营业额预测分析(时间序列建模)_第2张图片
可以看到表格有7个变量的数据,而且均以时间先后为顺序来记录的一组月度数据,从计量经济学的角度来分类就是一组时间序列数据,对于这类数据的预测分析,我们一般的做法是建立一个自回归移动平均模型ARMA(p,q)来预测下一期或近几期(不宜预测多期数据)的经济数据。进一步观察数据发现,这几个变量之间似乎存在某种相关(Correlations)关系,为了验证这一想法,我运用SPSS软件对这几个变量进行相关度检验,得到相关系数表如图1所示:
零售门店营业额预测分析(时间序列建模)_第3张图片
图1
从图1可以看到这7个变量两两之间的相关系数值均大于0,说明7个变量两两之间存在不同程度的正相关,而我们的目的是预测下一期营业额的值,因此只需要查看第二列的值,可以看到营业额与其他变量的正相关度比较高(相关系数值均大于0.8),从而我们也可以建立一个多元时间序列模型来预测下一期营业额的值,对于这个方法,我在后面进行补充说明。
下面我们运用Eviews软件(即Econometrics Views 计量经济学软件包)以及采用第一种做法来进行建模和预测分析,理由是根据现有的条件我们无法确定是否还存在别的因素会影响营业额的变化,因此选择第一种做法是比较合适的。接下来的预测分析分几个步骤进行:第一,对序列进行平稳性检验和随机性检验,如果序列不平稳,则需要对序列进行平稳性变换,变换后对序列再次进行平稳性检验,确认序列已达到平稳;第二,观察平稳序列的自相关和偏自相关系数图,对自回归移动平均模型ARMA(p,q)的滞后阶数p和q进行初步判定,同时选择几个备选模型;第三,对第二步的几个备选模型进行数据拟合及参数估计;第四,模型比较及最终模型的确定;第五,使用最终模型进行预测以及对结果进行说明。最后,对整体进行补充说明。
二、 建模与预测分析过程
(1) 平稳性检验和随机性检验
已知从2015年2月到2019年10月,一共57期数据,设营业额序列为TURt,t=1,2,…,57,利用Eviews软件查看序列TURt的折线图,如图2所示:
零售门店营业额预测分析(时间序列建模)_第4张图片
图2
零售门店营业额预测分析(时间序列建模)_第5张图片
一个时间序列是否有分析价值,要看序列观测值之间是否有一定的相关性,若序列各项之间不存在相关,即相应滞后阶数的自相关系数与0没有显著性差异,则序列为白噪声序列即纯随机序列,一个纯随机序列是没有分析价值的,所以我们希望序列是平稳且非随机的,因此建立原假设H0为原序列为白噪声序列,即对于任意m≥1,其相应滞后阶数的自相关系数ρm=0;备择假设H1为至少存在某个ρi≠0,i属于1到m之间,进而可以构造相应的统计量进行统计检验。下面对序列TURt进行随机性检验,结果如图4所示:
零售门店营业额预测分析(时间序列建模)_第6张图片
图4
在图4中,由每个Q统计量的伴随概率可以看出,均小于显著性水平α=0.05,即均拒绝原假设,说明序列TURt为非随机序列。
随机性检验已经通过,我们继续对不平稳的序列TURt进行平稳性变换,以此来达到平稳,以及消除序列趋势、季节变动等因素的影响,由于序列TURt的数值比较大,因此我们先进行以10为底的对数变换,令LTURt=log10(TURt),然后对LTURt进行一阶差分运算,令DLTURt=LTURt – LTURt(-1)。对经平稳性变换的序列DLTURt再次进行带常数项的平稳性检验,结果如图5所示:
零售门店营业额预测分析(时间序列建模)_第7张图片
图5
从图5的结果我们可以看到t统计量的伴随概率为0,小于显著性水平α=0.05,说明序列DLTURt已经达到平稳状态,下面对序列DLTURt进行模型识别。
(2)模型识别
对于如果利用数据去识别和建立模型,一个比较直观的方法就是观察自相关系数(AutoCorrelation)和偏自相关系数(Partial Correlation)的截尾及拖尾情况,这是因为从理论上来说,平稳AR、MA和ARMA模型的ACF和PACF有以下特征:
在这里插入图片描述
但是,在实际中总体的ACF和PACF是未知的,对于给定的时间序列观测值x1,x2,…,Xt,.,我们需要使用样本的自相关系数和偏自相关系数对总体的ACF和PACF进行估计。然而由于样本的自相关系数和偏自相关系数均是随机变量,对于相应的模型不可能具有严格的“截尾性”,只能呈现出在某步之后围绕零值上、下波动,所以我们可以借助样本的自相关系数和偏自相关系数的“截尾性”来判断总体的ACF和PACF的截尾性,给出模型的初步识别。
查看序列DLTURt滞后24阶的自相关系数和偏自相关系数,如图6所示:
零售门店营业额预测分析(时间序列建模)_第8张图片
图6
从图6可以看到,只有第一阶的自相关系数和偏自相关系数超过两个标准差的范围(两端虚线)外,因此我们选择两个备选模型:AR(1)、ARMA(1,1)。
零售门店营业额预测分析(时间序列建模)_第9张图片
零售门店营业额预测分析(时间序列建模)_第10张图片
图7
零售门店营业额预测分析(时间序列建模)_第11张图片
零售门店营业额预测分析(时间序列建模)_第12张图片
图9
在图9中,由每个Q统计量的伴随概率可以看出,均大于显著性水平α=0.05,说明残差序列是一个白噪声序列,已经没有信息可以提取,因此模型的检验通过。
零售门店营业额预测分析(时间序列建模)_第13张图片
零售门店营业额预测分析(时间序列建模)_第14张图片
零售门店营业额预测分析(时间序列建模)_第15张图片
零售门店营业额预测分析(时间序列建模)_第16张图片
由于原先已经对原序列进行平稳性变换,如果要计算出2019年11月(即第58期)的营业额预测值,首先需要对序列DLTURt进行逆变换,根据DLTURt=LTURt – LTURt(-1)、LTURt=log10(TURt),我们可以得到TURt=10^(DLTURt+ LTURt(-1)),已知2019年10月(即第57期)的营业额为223738.33,因此把已知值代入TURt=10^(DLTURt+ LTURt(-1))可以得到,2019年11月的营业额预测值为401661.67,95%上下置信区间为(44641.67,3628610.77),由于该区间范围过大,指导意义不强。
三、 补充说明
开始有说明对于时间序列,我们可以选择建立多元时间序列模型进行经济预测,但需要注意的是对于多元时间序列,容易引发虚假回归的问题,而对该问题我们可以建立协整模型来进行克服,前提是我们选择的自变量不能过多也不能过少且能够解释因变量的变化情况,因此我们收集更多的可能影响营业额变化的因素信息,比如产品销量、产品成本损耗等。

备注:由于Markdown不支持公式编辑器的公式复制粘贴,所以涉及到公式的内容会以截图的形式放进来,如果有不清晰的地方欢迎在评论留言,我们共同探讨,谢谢。

你可能感兴趣的:(数据分析与挖掘,数据挖掘)