ARIMA算法&指数平滑总结

ARIMA算法:


三大步:建模——诊断——预测


1. 建模:
(1)对数据绘图,观测是否为平稳时间序列;对于非平稳时间序列要先进行d阶差分运算,化为平稳时间序列;
(2) 经过第二步处理,已经得到平稳时间序列。要对平稳时间序列分别求得其自相关系数ACF和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层 p 和阶数 q
(3) 由以上得到的d、q、p,就是ARIMA的三个参数。由这三个参数得到ARIMA模型。然后开始对得到的模型进行模型检验。


2. 诊断
考察残差序列是否为白噪声。
白噪声序列:
(1)定义:0均值,同方差,不相关
(2)Box-Ljung test检验。原假设:残差不存在自相关,即白噪声序列。
(3)残差序列的自相关图,应表现平稳,无固定模式。


Tips:
1. 识别模型阶数
(1)如果自相关是拖尾,偏相关p阶截尾,则用 AR(p) 算法  #自回归模型
(2)如果自相关q阶截尾,偏相关拖尾,则用 MA(q) 算法  #滑动平均模型
(3)如果自相关和偏相关都是拖尾,则用 ARMA(p,q) 算法。
ARIMA 是 ARMA 算法的扩展版,ARMA算法处理平稳序列,而ARIMA算法使用d阶差分将不平稳序列转化为平稳序列,就是参数d。在进行了差分后,ARIMA模型就转化为ARMA模型。#ARMA:自回归滑动平均模型
在python中,以上三种模型可以统一用sm.tsa.ARMA()模型建模


2. 同个图可以对应不同的p、q,选择不同的模型,如何选择?
* AIC=-2 ln(L) + 2 k 中文名字:赤池信息量 akaike information criterion 
* BIC=-2 ln(L) + ln(n)*k 中文名字:贝叶斯信息量 bayesian information criterion 
* HQIC=-2 ln(L) + ln(ln(n))*k hannan-quinn information criterion
选择以上三个统计量最小的模型。


3. 考察序列平稳性
(1)ADF单位根平稳性检验
(2)平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快的衰减到0


指数平滑:


1. 简单指数平滑:适用于平稳序列
2. Holt指数平滑:存在趋势的时间序列
3. Winter指数平滑:既包含趋势成分,又包含季节成分的时间序列

你可能感兴趣的:(数据分析,数据挖掘)