时间序列之差分自回归移动平均法(ARIMA)

        ARIMA模型的基本思想是将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARMIA模型有四种形式:移动平均模型-MA(q)、自回归模型-AR(p)、自回归移动平均模型ARMA(p,q)以及差分自回归移动平均模型ARIMA(p,d,q ),可以说所有模型都是ARIMA(p,d,q )的变体。


ARIMA(p,d,q)模型的说明:

1. 差分

这个过程是ARIMA模型相比ARMA模型而言多的一个过程,在时间序列为非平稳序列时,可以对原序列做差分来得到平稳时间序列,可能会需要做多次差分。d这个参数就是定义原时间序列需要做几次差分,若时间序列本身就是平稳的,数据不需要做差分,则ARMIA模型为ARIMA(p,0,q),等同于ARMA(p,q)

2. 自回归

如果时间序列满足:,其中是独立同分布的随机变量序列,对于任意t,,则称时间序列服从p阶自回归模型,记为AR(p),等同于ARIMA(p,0,0)称为自回归系数。

3. 移动平均

如果时间序列满足:,则称时间序列服从q阶移动平均模型,记为MA(q),等同于ARIMA(0,0,q)。称为移动平均系数。

4. 自回归移动平均

如果时间序列满足:,则称时间序列服从(p,q)阶自回归移动模型,记为ARMA(p,q),等同于ARIMA(p,0,q)

 

p,d,q参数的确定及其原则

1. d是时间序列做差分的次数,做差分的目的是将时间序列转为平稳时间序列,什么样的时间序列能称为平稳时间序列呢?时间序列取自某一随机过程,次随机过程的随机特征不随时间变化,则我们称过程是平稳的,这是教科书上的说法。我的理解是,时间序列满足加性模型,即时间序列整体没有明显的上升或者下降趋势,随机波动的规模随时间的变化也是大致相同的。

2. pq,对平稳时间序列做其自相关图和偏自相关图,根据自相关偏自相关图的拖尾截尾的性质来确定pq的值。基本原则如下表:

模型

自相关系数

偏自相关系数

AR(p)

拖尾

p阶截尾

MA(q)

q阶截尾

拖尾

ARMA(p,q)

拖尾

拖尾

截尾是指时间序列的自相关函数(ACF)或偏自相关函数(PACF)在某阶后均为0的性质(比如AR的PACF);拖尾是ACF或PACF并不在某阶后均为0的性质(比如AR的ACF)。判断过程中拖尾截尾并不一定是以0为标准,可能只是趋于0

在一个实际的问题中,可能多个模型都适用与这个问题,这时选择的标准是精简预测,使参数尽量少。例如一个实际问题,可能ARMA(3,0)ARMA(0,1)ARMA(p,q)模型都能用,ARMA(p,q)模型参数p+q>2ARMA(3,0)参数有3个,ARMA(0,1)参数有1个,所以这里选择ARMA(0,1)模型。


其他说明

这个模型的实现过程相对指数平滑来说更复杂,还加上了一些主观的判断(在模型的选择中)。可能还涉及到白噪声检验(在得到平稳时间序列后,要检验序列是否为白噪声序列);还有在确定模型后有一个模型检测的过程,对残差序列进行检验。我这里只是根据我自己的理解对模型的一个简单介绍,不涉及具体的计算过程。


参考书:统计预测和决策(徐国祥编)。

你可能感兴趣的:(基础备忘)