时间序列预测模型——ARIMA

1.ARIMA模型概述

         ARIMA(Autoregressive Integrated Moving Average Model)全称自回归积分滑动平均模型,也记作ARIMA(p,d,q),属于统计预测模型。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,可分为:

移动平均过程(MA(q))

自回归过程(AR(p))

自回归移动平均过程( ARMA(p,q) )

自回归积分滑动平均过程 ( ARIMA(p,d,q) )

2.ARIMA建模基本步骤

  1. 获取被观测系统时间序列数据;若不是时间序列数据需要转换为时间序列数据。
  2. 对数据绘图,观测是否为平稳时间序列;对于非平稳时间序列要先进行d阶差分运算,化为平稳时间序列;
  3. 要对平稳时间序列分别求得其自相关系数ACF 和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层 p 和阶数 q
  4. 由以上得到的d、q、p,得到ARIMA模型。然后开始对得到的模型进行模型检验。

3.ARIMA模型的几个特例

      1.ARIMA(0,1,0) ,(此时当d=1,p和q为0时,称为random walk模型,)该模型表示每一个时刻的位置,只与上一时刻的位            置有关。 

      2. ARIMA(1,0,0) ,(此时p=1, d=0,q=0,称为 first-order autoregressive model)该模型说明时序数据是稳定的和自相关的。             一个时刻的Y值只与上一个时刻的Y值有关。

      3. ARIMA(1,1,0),(此时p=1,d=1,q=0,称为differenced first-order autoregressive model) ,该模型说明时序数据在一阶差             分化之后是稳定的和自回归的。即一个时刻的差分(y)只与上一个时刻的差分有关。

     4. ARIMA(0,1,1) ,(此时p=0, d=1 ,q=1,称为simple exponential smoothing with growth模型)=该模型说明数据在一阶差分后是            稳定的和移动平均的。即一个时刻的估计值的差分与上一个时刻的预测误差有关。

4.ARIMA模型参数讲解

         ARIMA模型有三个参数:p,d,q。

  • p--代表预测模型中采用的时序数据本身的滞后数(lags) ,也叫做AR/Auto-Regressive项
  • d--代表时序数据需要进行几阶差分化,才是稳定的,也叫Integrated项。
  • q--代表预测模型中采用的预测误差的滞后数(lags),也叫做MA/Moving Average项

5.ARIMA的优缺点

优点: 模型十分简单,只需要内生变量而不需要借助其他外生变量。

缺点:1.要求时序数据是稳定的(stationary),或者是通过差分化(differencing)后是稳定的。
2.本质上只能捕捉线性关系,而不能捕捉非线性关系。
注意,采用ARIMA模型预测时序数据,必须是稳定的,如果不稳定的数据,是无法捕捉到规律的。比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动。

6.判断时序数据是稳定的方法

严谨的定义: 一个时间序列的随机变量是稳定的,当且仅当它的所有统计特征都是独立于时间的(是关于时间的常量)。
判断的方法:

  1. 稳定的数据是没有趋势(trend),没有周期性(seasonality)的; 即它的均值,在时间轴上拥有常量的振幅,并且它的方差,在时间轴上是趋于同一个稳定的值的。
  2. 可以使用Dickey-Fuller Test进行假设检验。

7.自回归方法和移动平均方法

自回归方法:基于假设当前时期的指标值依赖于过去时期的指标值,对过去时期的指标值进行加权平均得到当前的指标值;

移动平均方法:思想是模拟指标值的随机性,指标值受白噪声序激励的影响。

你可能感兴趣的:(机器学习,统计分析,时间预测,数学建模,ARIMA,时间序列,数学建模)