自回归滑动平均模型( A u t o − R e g r e s s i v e a n d M o v i n g A v e r a g e M o d e l , A R M A Auto-Regressive \ and \ Moving \ Average \ Model,ARMA Auto−Regressive and Moving Average Model,ARMA)是基于自回归模型( A R AR AR)和滑动平均模型( M A MA MA)的混合模型。
{ x t = φ 0 + ∑ i = 1 p φ i x t − i + ε t − ∑ i = 1 q θ i ε t − i φ p ≠ 0 , θ q ≠ 0 E ( ε t ) = 0 , V a r ( ε t ) = σ ε 2 , E ( ε t ε s ) = 0 , s ≠ t E ( x s ε t ) = 0 , ∀ s < t (1) \tag{1} \left\{ \begin{aligned}& x_t = \varphi_0 + \sum_{i=1}^p \varphi_i x_{t-i} + \varepsilon_t - \sum_{i=1}^q \theta_{i} \varepsilon_{t-i}\\& \varphi_p \neq 0,\theta_q \neq 0\\& E(\varepsilon_t) = 0,Var(\varepsilon_t) = \sigma_{\varepsilon}^2,E(\varepsilon_t \varepsilon_s) = 0,s\neq t\\& E(x_s \varepsilon_t) = 0,\forall s < t \end{aligned} \right. ⎩⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎧xt=φ0+i=1∑pφixt−i+εt−i=1∑qθiεt−iφp=0,θq=0E(εt)=0,Var(εt)=σε2,E(εtεs)=0,s=tE(xsεt)=0,∀s<t(1)
当样本容量 n n n充分大时,样本自相关系数 ρ ^ k \hat{\rho}_k ρ^k和样本偏相关系数 γ k ^ \hat{\gamma_k} γk^近似服从正态分布(证明略)。
ρ ^ k ∼ N ( 0 , 1 n ) γ k ^ ∼ N ( 0 , 1 n ) (2) \tag{2} \begin{aligned} \hat{\rho}_k \sim N(0,\frac{1}{n})\\ \hat{\gamma_k} \sim N(0,\frac{1}{n}) \end{aligned} ρ^k∼N(0,n1)γk^∼N(0,n1)(2)
根据正态分布的性质有:
P ( ∣ ρ ^ k ∣ ≤ 2 n ) ≥ 0.95 P ( ∣ γ k ^ ∣ ≤ 2 n ) ≥ 0.95 (3) \tag{3} \begin{aligned} P(|\hat{\rho}_k| \le \frac{2}{\sqrt{n}}) \ge 0.95\\ P(|\hat{\gamma_k}| \le \frac{2}{\sqrt{n}}) \ge 0.95 \end{aligned} P(∣ρ^k∣≤n2)≥0.95P(∣γk^∣≤n2)≥0.95(3)
A C F ACF ACF定阶
如果样本自相关系数再最初的 q q q阶明显超过2被标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且由非零自相关性系数衰减到置信区间的过程非常突然,视为自相关系数截尾。结尾阶数即为 M A MA MA的阶数 q q q。
如果由超过5%样本自相关系数落入2倍标准差范围值之外,或者由显著非零的自相关系数衰减到置信区间的过程比较缓慢或者非常连续,视为自相关系数拖尾。
同理 P A C F PACF PACF。
图中蓝色虚线表示2倍标准差的置信区间,对于 M A MA MA模型,偏自相关系数拖尾,自相关系数 q q q阶截尾。
对于 A R AR AR模型而言,自相关系数拖尾,偏自相关系数 p p p阶截尾。
ARMA模型定阶
A R M A ( p , q ) ARMA(p,q) ARMA(p,q)模型自相关系数和偏自相关系数都是拖尾的,阶数无法通过 A C F ACF ACF和 P A C F PACF PACF图看出。
可以通过定量分析 A I C AIC AIC准则和 B I C BIC BIC准则来计算 A R M A ARMA ARMA模型的阶数 p , q p,q p,q
A I C AIC AIC准则(Akaike information Criterion 最小化信息量准则)
A I C = − 2 l n ( L ) + 2 K (4) AIC = - 2 ln(L) + 2 K \tag{4} AIC=−2ln(L)+2K(4)
B I C BIC BIC准则(Bayesian information Criterion 贝叶斯信息准则)
B I C = − 2 l n ( L ) + K l n ( n ) (5) BIC = -2 ln(L) + K ln(n) \tag{5} BIC=−2ln(L)+Kln(n)(5)
通过设定 ( p , q ) (p,q) (p,q)的上限 ( p m a x , q m a x ) (p_{max},q_{max}) (pmax,qmax),遍历 p ∈ [ 1 , p m a x ] , q ∈ [ 1 , q m a x ] p \in [1,p_{max}],q\in [1,q_{max}] p∈[1,pmax],q∈[1,qmax]中的所有整数组合,取其AIC最小或BIC最小时对应的 p , q p,q p,q为 A R M A ARMA ARMA模型的阶数 p ∗ , q ∗ p^{*},q^{*} p∗,q∗。
模型 | 自相关系数 | 偏自相关系数 |
---|---|---|
A R ( p ) AR(p) AR(p) | 拖尾 | p p p阶截尾 |
M A ( q ) MA(q) MA(q) | q q q阶截尾 | 拖尾 |
A R M A ( p , q ) ARMA(p,q) ARMA(p,q) | 拖尾 | 拖尾 |
图片来源:https://blog.csdn.net/weixin_39982225/article/details/120623005
王燕.应用时间序列分析[M].中国人民大学出版社.201907