自回归滑动平均模型ARMA

A R M A ARMA ARMA模型介绍

自回归滑动平均模型( A u t o − R e g r e s s i v e   a n d   M o v i n g   A v e r a g e   M o d e l , A R M A Auto-Regressive \ and \ Moving \ Average \ Model,ARMA AutoRegressive and Moving Average Model,ARMA)是基于自回归模型( A R AR AR)和滑动平均模型( M A MA MA)的混合模型。

{ x t = φ 0 + ∑ i = 1 p φ i x t − i + ε t − ∑ i = 1 q θ i ε t − i φ p ≠ 0 , θ q ≠ 0 E ( ε t ) = 0 , V a r ( ε t ) = σ ε 2 , E ( ε t ε s ) = 0 , s ≠ t E ( x s ε t ) = 0 , ∀ s < t (1) \tag{1} \left\{ \begin{aligned}& x_t = \varphi_0 + \sum_{i=1}^p \varphi_i x_{t-i} + \varepsilon_t - \sum_{i=1}^q \theta_{i} \varepsilon_{t-i}\\& \varphi_p \neq 0,\theta_q \neq 0\\& E(\varepsilon_t) = 0,Var(\varepsilon_t) = \sigma_{\varepsilon}^2,E(\varepsilon_t \varepsilon_s) = 0,s\neq t\\& E(x_s \varepsilon_t) = 0,\forall s < t \end{aligned} \right. xt=φ0+i=1pφixti+εti=1qθiεtiφp=0,θq=0E(εt)=0,Var(εt)=σε2,E(εtεs)=0,s=tE(xsεt)=0,s<t(1)

当样本容量 n n n充分大时,样本自相关系数 ρ ^ k \hat{\rho}_k ρ^k和样本偏相关系数 γ k ^ \hat{\gamma_k} γk^近似服从正态分布(证明略)。
ρ ^ k ∼ N ( 0 , 1 n ) γ k ^ ∼ N ( 0 , 1 n ) (2) \tag{2} \begin{aligned} \hat{\rho}_k \sim N(0,\frac{1}{n})\\ \hat{\gamma_k} \sim N(0,\frac{1}{n}) \end{aligned} ρ^kN(0,n1)γk^N(0,n1)(2)
根据正态分布的性质有:
P ( ∣ ρ ^ k ∣ ≤ 2 n ) ≥ 0.95 P ( ∣ γ k ^ ∣ ≤ 2 n ) ≥ 0.95 (3) \tag{3} \begin{aligned} P(|\hat{\rho}_k| \le \frac{2}{\sqrt{n}}) \ge 0.95\\ P(|\hat{\gamma_k}| \le \frac{2}{\sqrt{n}}) \ge 0.95 \end{aligned} P(ρ^kn 2)0.95P(γk^n 2)0.95(3)

定阶原则

A C F ACF ACF定阶

如果样本自相关系数再最初的 q q q阶明显超过2被标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且由非零自相关性系数衰减到置信区间的过程非常突然,视为自相关系数截尾。结尾阶数即为 M A MA MA的阶数 q q q

如果由超过5%样本自相关系数落入2倍标准差范围值之外,或者由显著非零的自相关系数衰减到置信区间的过程比较缓慢或者非常连续,视为自相关系数拖尾。

同理 P A C F PACF PACF

MA模型定阶示例
自回归滑动平均模型ARMA_第1张图片

图中蓝色虚线表示2倍标准差的置信区间,对于 M A MA MA模型,偏自相关系数拖尾,自相关系数 q q q阶截尾。


AR模型定阶示例
自回归滑动平均模型ARMA_第2张图片

对于 A R AR AR模型而言,自相关系数拖尾,偏自相关系数 p p p阶截尾。


ARMA模型定阶

A R M A ( p , q ) ARMA(p,q) ARMA(p,q)模型自相关系数和偏自相关系数都是拖尾的,阶数无法通过 A C F ACF ACF P A C F PACF PACF图看出。

自回归滑动平均模型ARMA_第3张图片

可以通过定量分析 A I C AIC AIC准则和 B I C BIC BIC准则来计算 A R M A ARMA ARMA模型的阶数 p , q p,q p,q

  • A I C AIC AIC准则(Akaike information Criterion 最小化信息量准则)
    A I C = − 2 l n ( L ) + 2 K (4) AIC = - 2 ln(L) + 2 K \tag{4} AIC=2ln(L)+2K(4)

    • L:表示模型的极大似然函数
    • K:表示模型参数个数
    • 不足:当样本容量很大时,在 A I C AIC AIC准则中拟合误差提供的信息就要受到样本容量的放大,而参数个数的惩罚因子却和样本容量没有关系(一直是2),因此当样本容量很大时,使用 A I C AIC AIC准则的模型不收敛于真实模型,它通常比真实模型所含的未知个数要多。
  • B I C BIC BIC准则(Bayesian information Criterion 贝叶斯信息准则)
    B I C = − 2 l n ( L ) + K l n ( n ) (5) BIC = -2 ln(L) + K ln(n) \tag{5} BIC=2ln(L)+Kln(n)(5)

    • n n n:样本容量

通过设定 ( p , q ) (p,q) (p,q)的上限 ( p m a x , q m a x ) (p_{max},q_{max}) (pmax,qmax),遍历 p ∈ [ 1 , p m a x ] , q ∈ [ 1 , q m a x ] p \in [1,p_{max}],q\in [1,q_{max}] p[1,pmax],q[1,qmax]中的所有整数组合,取其AIC最小或BIC最小时对应的 p , q p,q p,q A R M A ARMA ARMA模型的阶数 p ∗ , q ∗ p^{*},q^{*} p,q

定阶总结

模型 自相关系数 偏自相关系数
A R ( p ) AR(p) AR(p) 拖尾 p p p阶截尾
M A ( q ) MA(q) MA(q) q q q阶截尾 拖尾
A R M A ( p , q ) ARMA(p,q) ARMA(p,q) 拖尾 拖尾

图片来源:https://blog.csdn.net/weixin_39982225/article/details/120623005

王燕.应用时间序列分析[M].中国人民大学出版社.201907

自回归滑动平均模型ARMA_第4张图片

你可能感兴趣的:(机器学习,回归,机器学习,人工智能)