时间序列的变化主要受到长期趋势、季节变动、周期变动和不规则变动这四个因素的影响1。其中:
拖尾:始终有非零取值,不会在k大于某个常数后就恒等于零(或在0附近随机波动)
截尾:在大于某个常数k后快速趋于0为k阶截尾
表示随机过程的ARIMA模型一般分为4种类型2:
4类ARIMA过程以及白噪声过程、随机游走过程都是以过程的期望等于零为前提的。当随机过程的期望不等于零时,可以转化为零均值过程进行研究。
**定义:**如果一个线性随机过程可表达为:
x t = ϕ 1 x t − 1 + ϕ 2 x t − 2 + ⋅ ⋅ ⋅ + ϕ p x t − p + μ t x_t=\phi_1x_{t-1}+\phi_2 x_{t-2} + ··· +\phi_p x_{t-p}+\mu_t xt=ϕ1xt−1+ϕ2xt−2+⋅⋅⋅+ϕpxt−p+μt,
其中 ϕ i , i = 1 , ⋅ ⋅ ⋅ , p \phi_i,i=1,···,p ϕi,i=1,⋅⋅⋅,p是自回归系数, μ t \mu_t μt是白噪声过程,则这个线性过程 x t x_t xt称为 p p p阶自回归过程,用 A R ( p ) AR(p) AR(p)表示。
**定义:**如果一个线性随机过程可表达为:
x t = μ t + θ 1 μ t − 1 + θ 2 μ t − 2 + ⋅ ⋅ ⋅ + θ q μ t − q x_t=\mu_t+\theta_1 \mu_{t-1}+\theta_2 \mu_{t-2}+···+\theta_q \mu_{t-q} xt=μt+θ1μt−1+θ2μt−2+⋅⋅⋅+θqμt−q,
其中 θ 1 , θ 2 , ⋅ ⋅ ⋅ , θ q \theta_1,\theta_2,···,\theta_q θ1,θ2,⋅⋅⋅,θq是移动平均系数, μ t \mu_t μt是白噪声过程,则称上式为 q q q阶移动平均过程,记为 M A ( q ) MA(q) MA(q)
**定义:**由自回归和移动平均两部分共同构造的随机过程称为自回归移动平均过程,记为 A R M A ( p , q ) ARMA(p,q) ARMA(p,q),其中 p , q p,q p,q分别表示自回归和移动平均部分的最大滞后阶数。 A R M A ( p , q ) ARMA(p,q) ARMA(p,q)的一般表达式是:
x t = ϕ 1 x t − 1 + ϕ 2 x t − 2 + ⋅ ⋅ ⋅ + ϕ p x t − p + μ t + θ 1 μ t − 1 + θ 2 μ t − 2 + ⋅ ⋅ ⋅ + θ q μ t − q x_t=\phi_1x_{t-1}+\phi_2 x_{t-2} + ··· +\phi_p x_{t-p}+\mu_t+\theta_1 \mu_{t-1}+\theta_2 \mu_{t-2}+···+\theta_q \mu_{t-q} xt=ϕ1xt−1+ϕ2xt−2+⋅⋅⋅+ϕpxt−p+μt+θ1μt−1+θ2μt−2+⋅⋅⋅+θqμt−q
针对含有单位根的非平稳随机过程,假设一个随机过程含有 d d d个单位根,则其经过 d d d次差分之后可以变换成为一个平稳的自回归移动平均过程。("单整”就是积分的意思),记为 A R I M A ( p , d , q ) ARIMA(p,d,q) ARIMA(p,d,q)。
建立时间序列模型的步骤
判断序列平稳的方法有两种:
判断序列平稳过程中的3点注意事项:
极大似然法MLE
需要做的诊断是:
对应的检验方法:
ARIMA模型做样本外短期预测效果很好。实际中预测期k最好不要大于模型参数p+q。
预测并不能消除未来时期的高度不确定性。预测的最大价值在于向决策者提供了如果按过去和现在的变化规律发展下去或假定了某些变化的前提下时间序列将会导致何种结果。对预测的过低评价或过高期待都是有失偏颇的。
《数据挖掘:实用案例分析》,作者:张良均,出版社:机械工业出版社,出版时间:2013-07,ISBN:9787111425915 ↩︎
《计量经济学》,张晓峒著. —北京:清华大学出版社,2017(2018.9重印) ↩︎