机器学习-ARIMA模型预测

ARIMA模型全称是自回归移动平均模型(Autoregressive Integrated Moving Average Model),它是处理带有趋势、季节因素平稳随机项数据的模型。ARIMA的一般模型为ARIMA(p,d.q),称为差分自回归移动平均模型,AR是自回归,P为自回归项,MA为移动平均,q为移动平均项数,d为时间序列平稳时所做的差分次数。
1.ARIMA模型的核心思想:
ARIMA模型的核心思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,以时间序列的自相关分析为基础,用一定的数据模型来近似描述这个序列。这个模型一旦被识别后,就可以从时间序列的过去值及现在值来预测未来值。ARIMA模型考虑了数据在时间序列上的依存性,又考虑了数据随机波动的干扰性,对于短期趋势的预测准确率较高。ARIMA模型主要分为三种:
自回归模型(简称AR模型)
滑动平均模型(简称MA模型)
自回归滑动平均混合模型(简称ARIMA模型)

ARIMA模型预测的流程
1)根据时间序列的散点图、自相关函数和偏自相关函数图,以ADF单位根检验及方差、趋势及其季节性变化规律,对序列的平稳性进行识别。
2)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理。如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值与零无显著差异。
3)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是是截尾的,而自相关函数是拖尾的,可判定序列适合AR模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
4)进行参数估计,检验是否具有统计意义。
5)进行假设检验,诊断残差序列是否为白噪声。
6)利用已通过检验的模型进行预测分析。

ARIMA模型对非平稳序列需要平稳化处理,这是一个数据变换的过程。我们知道,任何数据变换都会造成不同程度的信息损失,基于数据变换的模型是一种近似求解方案,必然会不同程度地影响模型的准确度和精度。ARIMA模型也是这样,非平稳序列进行平稳化处理时,需要对数据进行n次(通常进行1~3次)差分处理及还原处理,每进行一次差分处理都会损失一部分信息。如果能够找到一种直接挖掘非平稳时间序列的方法,将会进一步提高模型的预测准确度。

你可能感兴趣的:(机器学习)