ARIMA模型

1.模型介绍

ARIMA,差分自回归滑动平均模型,又称求自回归滑动平均模型,是时间序列预测分析方法之一。

ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA是“滑动平均”,q为滑动平均项数;d是使之成为平稳序列所做的差分次数(阶数)。

2.ARIMA模型运用流程

以《应用系统负载分析与磁盘容量预测》为案例:

- (平稳性检验)根据时间序列的散点图自相关系数和偏自相关系数单位根检验(ADF),来判断数据的平稳性;

- (平稳化处理)对非平稳的时间序列数据进行差分处理,得到差分阶数d;

- (白噪声检测)为了验证序列中有用的信息是否已被提取完毕,如果为白噪声序列,说明序列中有用的信息已经被提取完毕,可以采用LB统计量的方法进行白噪声检验;

- (模型识别和定阶)根据所识别出来的特征建立相应的时间序列模型。平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARIMA模型。可以采用BIC准则对模型进行定阶,确定p,q参数,从而选择最优模型;

- (模型检验)检验已确定的模型其残差序列是否为白噪声,如果不是白噪声,说明残差中还存在有用的信息,需要修改模型或者进一步提取;

-(模型预测)应用已通过检验的模型进行预测;

3.平稳性检验

(1)看图法

å¨è¿éæå¥å¾çæè¿°

这里的“图”指的是时序图,平稳序列的图a是围绕一个常数上下波动;而不平稳的图b,则是有明显的增长或减少的趋势。

(2)自相关系数和偏自相关系数

这里会涉及到两个定义——截尾和拖尾。

微信æªå¾_20181003171718.png

平稳序列的自相关图和偏相关图要么都是拖尾要么都是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。

(3)单位根检验(ADF)
若单位根检验p值小于0.05则认为是平稳的。

4.差分处理

差分即取相邻项值差替代当前值,以此来消除一些波动,使数据趋于平稳。

你可能感兴趣的:(python)