时间序列是指某种现象的指标按照时间顺序排列而成的数值序列。
本文主要介绍时间序列分析中常用的三种模型:季节分解、指数平滑方法以及 ARIMA 模型。
时间序列的数值变化规律一般有以下四种:长期变动趋势、季节变动规律、周期变动规律、不规则变动。一个时间序列往往是以上四类变化形式的叠加。
数值变化规律 | 字母表示 | 意义 |
---|---|---|
长期趋势 | T | 统计指标在相当长的一段时间内,收到长期趋势影响因素的影响,表现出的持续上升或者持续下降的趋势 |
季节趋势 | S | 由于季节的转变使得指标数值发生周期性变动(其周期一般以月、季、周为单位,不能以年为单位) |
循环变动 | C | 循环变动的周期往往是若干年,其在曲线图上表现为波浪式的周期变动 |
不规则变动 | I | 由某些随机因素导致的数值变化,并且这些因素的作用不可预知且没有规律性 |
这四种变动与指标数值的关系可能是叠加关系,也可能是乘积关系。
叠加模型和成绩模型
注意:
(1)使用时间序列分解的前提是具有年内的周期性(不包括以年份为周期的数据)
(2)在具体的时间序列图中,如果随着时间的推移,序列的季节波动越来越大,此时应该采用乘积模型;反之,如果时间序列图的波动保持恒定,则应该采用叠加模型
下面来看一个例子
进行时间序列分解的步骤主要有以下几步:
处理缺失值 ⇒ \Rightarrow ⇒ 定义时间变量 ⇒ \Rightarrow ⇒ 做出时序图选择模型 ⇒ \Rightarrow ⇒ 进行时间序列分解
在这个例子中,我们可以做出的时序图如下:
可以看出,第二季度的销量明显高于其他季度,因此数据表现出很强的季节性。同时,销量数据的季节波动变化不大,因此可以使用加法分解模型。
在 SPSS 中对数据进行季节性分解可得到结果为:
从表格中可知:第一二季度的季节因子为正,第三四季度的季节因子为负,说明第一二季度的平均销量要高于第三四季度。并且第二季度的平均销量要高于全年平均水平 20.930 件;第四季度的平均销量要低于全年平均水平 19.727 件。
有意思的是:采用加法模型时,季节因子的和为 0 ;而采用乘法模型时,季节因子的乘积为 1 ,同时,乘法模型的季节因子表示是全年平均销量的倍数。
简单(Simple)模型
名称 | 使用条件 | 与之类似的ARIMA模型 |
---|---|---|
简单指数平滑法 | 不含趋势和季节成分 | ARIMA(0, 1, 1) |
令 x t x_t xt 为 t t t 时刻的观测数据, S t S_t St 为第 t t t 期的平滑值,且令 S t = x ^ t + 1 S_t = \hat{x}_{t + 1} St=x^t+1,即第 t + 1 t + 1 t+1 期的预测值,且满足: x ^ t + 1 = α x t + ( 1 − α ) x t ^ \hat{x}_{t + 1} = \alpha x_t + (1 - \alpha)\hat{x_t} x^t+1=αxt+(1−α)xt^,因此可以证明: x ^ t + 1 = α x t + α ( 1 − α ) x t − 1 + α ( 1 − α ) 2 x t − 2 + ⋯ + α ( 1 − α ) t − 1 x 1 + ( 1 − α ) t l 0 \hat{x}_{t + 1} = \alpha x_t + \alpha(1 - \alpha)x_{t - 1} + \alpha(1 - \alpha)^2x_{t - 2} + \cdots + \alpha(1 - \alpha)^{t - 1}x_1 + (1 - \alpha)^tl_0 x^t+1=αxt+α(1−α)xt−1+α(1−α)2xt−2+⋯+α(1−α)t−1x1+(1−α)tl0,其中 l 0 = x ^ 1 l_0 = \hat{x}_1 l0=x^1 视为初始值, α \alpha α 为平滑系数 ( 0 ≤ α ≤ 1 ) (0 \leq \alpha \leq 1) (0≤α≤1)。
还可以看出,越接近当期的数据,其权重越大,意味着影响也越大;反之,早期数据对当期影响也就越小。
平滑指数 α \alpha α 一般是需要我们自己决定的。但是,SPSS 的专家建模器如果采用简单模型帮助我们建模会自动给出 α \alpha α 的值。
简单(Simple)模型只能往后预测一期数据,原因是公式 x ^ t + 1 = α x t + ( 1 − α ) x t ^ \hat{x}_{t + 1} = \alpha x_t + (1 - \alpha)\hat{x_t} x^t+1=αxt+(1−α)xt^ 中使用了本期的准确数据 x t x_t xt ,后面的数据只是预测出来的,而不是准确的。
线性趋势模型( l i n e a r t r e n d linear\ \ trend linear trend)
名称 | 使用条件 | 与之类似的 ARIMA 模型 |
---|---|---|
特线性趋势模型 | 线性趋势、不含季节成分 | ARIMA(0, 2, 2) |
该方法包含一个预测方程和两个平滑方程: { l t = α x t + ( 1 − α ) ( l t − 1 + b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 (趋势平滑方程) x ^ t + h = l t + h b t , h = 1 , 2 , ⋯ (预测方程) \left\{ \begin{aligned} &l_t = \alpha x_t + (1 - \alpha)(l_{t - 1} + b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \text{(趋势平滑方程)} \\ &\hat{x}_{t + h} = l_t + hb_t, h = 1, 2, \cdots \text{(预测方程)} \end{aligned} \right. ⎩⎪⎨⎪⎧lt=αxt+(1−α)(lt−1+bt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1(趋势平滑方程)x^t+h=lt+hbt,h=1,2,⋯(预测方程)
t t t:当前期
h h h:预测超前期数,也称之为预测补偿
x t x_t xt:第 t t t 期的实际观测值
l t l_t lt:时刻 t t t 的预估水平
b t b_t bt:时刻 t t t 的预测趋势
α \alpha α:水平的平滑参数
β \beta β:趋势的平滑参数
阻尼趋势模型( D a m p e d t r e n d Damped\ \ trend Damped trend)
称 | 使用条件 | 与之类似的 ARIMA 模型 |
---|---|---|
尼趋势模型 | 线性趋势逐渐减弱且不含季节成分 | ARIMA(1, 1, 2) |
{ l t = α x t + ( 1 − α ) ( l t − 1 + ϕ b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) ϕ b t − 1 (趋势平滑方程) x ^ t + h = l t + ( ϕ + ϕ 2 + ⋯ + ϕ h ) b t (预测方程) \left\{ \begin{aligned} &l_t = \alpha x_t + (1 - \alpha)(l_{t - 1} + \phi b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)\phi b_{t - 1} \text{(趋势平滑方程)} \\ &\hat{x}_{t + h} = l_t + (\phi + \phi^2 + \cdots + \phi^h)b_t \text{(预测方程)} \end{aligned} \right. ⎩⎪⎨⎪⎧lt=αxt+(1−α)(lt−1+ϕbt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)ϕbt−1(趋势平滑方程)x^t+h=lt+(ϕ+ϕ2+⋯+ϕh)bt(预测方程) α \alpha α:水平的平滑参数
β \beta β:趋势的平滑参数
ϕ \phi ϕ:阻尼参数( 0 < ϕ ≤ 1 0 < \phi \leq 1 0<ϕ≤1)
如果 ϕ = 1 \phi = 1 ϕ=1,则阻尼趋势模型就是霍特线性趋势模型。
简单季节性
简单季节性 | 使用条件 | 与之类似的 ARIMA 模型 |
---|---|---|
单季节性 | 含有稳定的季节成分、不含趋势 | SARIMA(0, 1, 1) × (0, 1, 1) s _s s |
{ l t = α ( x t − s t − m ) + ( 1 − α ) l t − 1 (水平平滑方程) s t = γ ( x t − l t − 1 ) + ( 1 − γ ) s t − m (季节平滑方程) x ^ t + h = l t + s t + h − m ( k + 1 ) , k = [ h − 1 m ] (预测方程) \left\{ \begin{aligned} &l_t = \alpha(x_t - s_{t - m}) + (1 - \alpha)l_{t - 1} \text{(水平平滑方程)} \\ &s_t = \gamma(x_t - l_{t - 1}) + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = l_t + s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right. ⎩⎪⎪⎪⎨⎪⎪⎪⎧lt=α(xt−st−m)+(1−α)lt−1(水平平滑方程)st=γ(xt−lt−1)+(1−γ)st−m(季节平滑方程)x^t+h=lt+st+h−m(k+1),k=[mh−1](预测方程) m m m:周期长度(月度数据取12,季度数据取4)
α \alpha α:水平的平滑参数
γ \gamma γ:季节的平滑参数
h h h:预测超前期数
x ^ t + h \hat{x}_{t + h} x^t+h:第 h h h 期的预测值
温特加法模型( W i n t e r ′ s a d d i t i v e Winter's\ \ additive Winter′s additive)
称 | 使用条件 | 与之类似的 ARIMA 模型 |
---|---|---|
特加法模型 | 含有线性趋势和稳定的季节成分 | SARIMA(0, 1, 0) × (0, 1, 1) s _s s |
{ l t = α ( x t − s t − m ) + ( 1 − α ) ( l t − 1 + b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 s t = γ ( x t − l t − 1 − b t − 1 ) + ( 1 − γ ) s t − m (季节平滑方程) x ^ t + h = l t + h b t + s t + h − m ( k + 1 ) , k = [ h − 1 m ] (预测方程) \left\{ \begin{aligned} &l_t = \alpha(x_t - s_{t - m}) + (1 - \alpha)(l_{t - 1} + b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \\ &s_t = \gamma(x_t - l_{t - 1} - b_{t - 1}) + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = l_t + hb_t + s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right. ⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧lt=α(xt−st−m)+(1−α)(lt−1+bt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1st=γ(xt−lt−1−bt−1)+(1−γ)st−m(季节平滑方程)x^t+h=lt+hbt+st+h−m(k+1),k=[mh−1](预测方程) m m m:周期长度(月度数据取12,季度数据取4)
α \alpha α:水平的平滑参数
β \beta β:趋势的平滑参数
γ \gamma γ:季节的平滑参数
x ^ t + h \hat{x}_{t + h} x^t+h:第 h h h 期的预测值
温特乘法模型( W i n t e r ′ s m u l t i p l i c a t i v e Winter's\ \ multiplicative Winter′s multiplicative)
称 | 使用条件 | 与之类似的 ARIMA 模型 |
---|---|---|
特乘法模型 | 含有线性趋势和不稳定的集结成分 | 不存在 |
{ l t = α x t s t − m + ( 1 − α ) ( l t − 1 + b t 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 (趋势平滑方程) s t = γ x t l t − 1 + b t + 1 + ( 1 − γ ) s t − m (季节平滑方程) x ^ t + h = ( l t + h b t ) s t + h − m ( k + 1 ) , k = [ h − 1 m ] (预测方程) \left\{ \begin{aligned} &l_t = \alpha \frac{x_t}{s_{t - m}} + (1 - \alpha)(l_{t - 1} + b{t_1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \text{(趋势平滑方程)} \\ &s_t = \gamma \frac{x_t}{l_{t - 1} + b_{t + 1}} + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = (l_t + hb_t)s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right. ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧lt=αst−mxt+(1−α)(lt−1+bt1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1(趋势平滑方程)st=γlt−1+bt+1xt+(1−γ)st−m(季节平滑方程)x^t+h=(lt+hbt)st+h−m(k+1),k=[mh−1](预测方程) m m m:周期长度(月度数据取12,季度数据取4)
α \alpha α:水平的平滑参数
β \beta β:趋势的平滑参数
γ \gamma γ:季节的平滑参数
x ^ t + h \hat{x}_{t + h} x^t+h:第 h h h 期的预测值
平稳时间序列( s t a t i o n a r y s e r i e s stationary\ \ series stationary series)
若时间序列 { x t } \{x_t\} {xt} 满足下列三个条件:
(1) E ( x t ) = E ( x t − s ) = u E(x_t) = E(x_{t - s}) = u E(xt)=E(xt−s)=u(均值为固定常数)
(2) V a r ( x t ) = V a r ( x t − s ) = σ 2 Var(x_t) = Var(x_{t - s}) = \sigma^2 Var(xt)=Var(xt−s)=σ2(方差存在且为常数)
(3) C o v ( x t , x t − s ) = γ s Cov(x_t, x_{t-s}) = \gamma_s Cov(xt,xt−s)=γs(协方差只和间隔 s s s 有关,与 t t t 无关)
则称 { x t } \{x_t\} {xt} 为协方差平稳,又称为弱平稳。
如果对于任意的 t 1 , t 2 , ⋯ , t k t_1, t_2, \cdots, t_k t1,t2,⋯,tk 和 h h h,多维随机变量 ( x t 1 , x t 2 , ⋯ , x t k ) (x_{t_1}, x_{t_2}, \cdots, x_{t_k}) (xt1,xt2,⋯,xtk) 和 ( x t 1 + h , x t 2 + h , ⋯ , x t k + h ) (x_{t_1 + h}, x_{t_2 + h}, \cdots, x_{t_k} + h) (xt1+h,xt2+h,⋯,xtk+h) 的联合分布相同,则称 { x t } \{x_t\} {xt} 为严格平稳。
注:严格平稳的要求太高,因此一般所说的平稳都是弱平稳。
白噪声序列
若时间序列 { x t } \{x_t\} {xt} 满足下列三个条件:
(1) E ( x t ) = E ( x t − s ) = 0 E(x_t) = E(x_{t - s}) = 0 E(xt)=E(xt−s)=0(均值为固定常数)
(2) V a r ( x t ) = V a r ( x t − s ) = σ 2 Var(x_t) = Var(x_{t - s}) = \sigma^2 Var(xt)=Var(xt−s)=σ2(方差存在且为常数)
(3) C o v ( x t , x t − s ) = 0 ( s ≠ 0 ) Cov(x_t, x_{t-s}) = 0(s \neq 0) Cov(xt,xt−s)=0(s=0)(协方差只和间隔 s s s 有关,与 t t t 无关)
则称 { x t } \{x_t\} {xt} 为白噪声序列。显然,白噪声序列是平稳时间序列的一个特例。
差分方程
将凑个时间序列变量表示为该变量的滞后项、时间和其他变量的函数,这样一个函数方程称为差分方程。例如:
y t = α 0 + α 1 y t − 1 + α 2 y t − 2 + ⋯ + α p y t − p + ε t y_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_t yt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εt( ε \varepsilon ε为白噪声序列)
滞后算子
用符号 L L L 表示滞后算子: L i y t = y t − i L^iy_t = y_{t - i} Liyt=yt−i,且由如下的性质:
(1) L C = C LC = C LC=C( C C C 为常数)
(2) ( L i + L j ) y t = y t − i + y t − j (L^i + L^j)y_t = y_{t - i} + y_{t - j} (Li+Lj)yt=yt−i+yt−j
(3) L i L j y t = y t − i − j L^iL^jy_t = y_{t - i - j} LiLjyt=yt−i−j
例如: y i = α 0 + ∑ i = 1 p α i y t − i + ε t + ∑ i = 1 q β i ε t − i y_i = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i} + \varepsilon_t + \sum_{i = 1}^{q}\beta_i\varepsilon_{t - i} yi=α0+i=1∑pαiyt−i+εt+i=1∑qβiεt−i 可以表示为: y t = α 0 + ∑ i = 1 p α i L i y t + ε t + ∑ i = 1 q β i L i ε t y_t = \alpha_0 + \sum_{i = 1}^{p}\alpha_iL^iy_t + \varepsilon_t + \sum_{i = 1}^{q}\beta_iL^i\varepsilon_t yt=α0+i=1∑pαiLiyt+εt+i=1∑qβiLiεt
p p p 阶的自回归模型(AR§模型):
y t = α 0 + α 1 y t − 1 + α 2 y t − 2 + ⋯ + α p y t − p + ε t y_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_t yt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εt ε \varepsilon ε 是方差为 σ 2 \sigma^2 σ2 的白噪声序列
(自回归:将自己的 1 至 p p p 阶滞后项视为自变量来进行回归)
注意
讨论的AR§模型一定是平稳的时间序列模型,原数据不平稳的话也要先转换为平稳的数据才能进行建模。
AR§模型平稳的条件
将 AR§ 模型的齐次部分转换为特征方程: x p = α 1 x p − 1 + α 2 x p − 2 + ⋯ + α p x^p = \alpha_1x_{p - 1} + \alpha_2x_{p - 2} + \cdots + \alpha_p xp=α1xp−1+α2xp−2+⋯+αp 特征方程是一个 p p p 阶多项式,因此可以求出 p p p 个解(可能有实根,也可能有虚根)
那么模型的平稳可以这样确定:
(1)如果这 p p p 个解的模长均小于1,则 { y t } \{y_t\} {yt} 平稳,即 AR§ 模型平稳;
(2)如果这 p p p 个解中有 k k k 个解的模场等于1,则 { y t } \{y_t\} {yt} 为 k k k 阶单位根过程( k k k 阶单位根过程可以经过 k k k 阶差分变为平稳的时间序列)
(3)如果这 p p p 个根至少有一个的模长大于1,则 { y t } \{y_t\} {yt} 称为爆炸过程。
下面来看一个例子
AR(3) 模型: y t = 0.1 + 0.2 y t − 1 + 0.3 y t − 2 + 0.5 y t − 3 + ε t y_t = 0.1 + 0.2y_{t - 1} + 0.3y_{t - 2} + 0.5y_{t - 3} + \varepsilon_t yt=0.1+0.2yt−1+0.3yt−2+0.5yt−3+εt 齐次部分的特征方程为: x 3 = 0.2 x 2 + 0.3 x + 0.5 x^3 = 0.2x^2 + 0.3x + 0.5 x3=0.2x2+0.3x+0.5 解得: x 1 = − 4 − 34 i 10 , x 2 = − 4 + 34 i 10 , x 3 = 1 x_1 = \frac{-4 - \sqrt{34}i}{10}, x_2 = \frac{-4 + \sqrt{34}i}{10}, x_3 = 1 x1=10−4−34i,x2=10−4+34i,x3=1
求模长: ∣ x 1 ∣ = ∣ x 2 ∣ = 16 100 + 34 100 = 0.7071 < 1 |x_1| = |x_2| = \sqrt{\frac{16}{100} + \frac{34}{100}} = 0.7071 < 1 ∣x1∣=∣x2∣=10016+10034=0.7071<1
所以 y t y_t yt 为一阶单位根过程
此时可以进行一阶差分变形: y t − y t − 1 = 0.1 − 0.8 ( y t − 1 − y t − 2 ) − 0.5 ( y t − 2 − y t − 3 ) + ε t y_t - y_{t - 1} = 0.1 - 0.8(y_{t - 1} - y_{t - 2}) - 0.5(y_{t - 2} - y_{t - 3}) + \varepsilon_t yt−yt−1=0.1−0.8(yt−1−yt−2)−0.5(yt−2−yt−3)+εt ⇒ Δ y t = 0.1 − 0.8 Δ y t − 1 − 0.5 Δ y t − 2 + ε t \Rightarrow \Delta y_t = 0.1 - 0.8\Delta y_{t - 1} - 0.5 \Delta y_{t - 2} + \varepsilon_t ⇒Δyt=0.1−0.8Δyt−1−0.5Δyt−2+εt(转换成了一个 AR(2) 过程)
此时齐次方程对应的特征方程: x 2 = − 0.8 x − 0.5 x^2 = -0.8x - 0.5 x2=−0.8x−0.5 解得 x 1 = − 4 − 34 i 10 , x 2 = − 4 + 34 i 10 x_1 = \frac{-4 - \sqrt{34}i}{10}, x_2 = \frac{-4 + \sqrt{34}i}{10} x1=10−4−34i,x2=10−4+34i
对于 AR(p) 模型而言: y t = α 0 + α 1 y t − 1 + α 2 y t − 2 + ⋯ + α p y t − p + ε t y_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_t yt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εt (1) { y t } \{y_t\} {yt} 为单位根的充要条件: α 1 + α 2 + ⋯ + α p = 1 \alpha_1 + \alpha_2 + \cdots + \alpha_p = 1 α1+α2+⋯+αp=1 (2) { y t } \{y_t\} {yt} 平稳的充分条件: ∣ α 1 ∣ + ∣ α 2 ∣ + ⋯ + ∣ α p ∣ < 1 |\alpha_1| + |\alpha_2| + \cdots + |\alpha_p| < 1 ∣α1∣+∣α2∣+⋯+∣αp∣<1 (3) { y t } \{y_t\} {yt} 平稳的必要条件: α 1 + α 2 + ⋯ + α p < 1 \alpha_1 + \alpha_2 + \cdots + \alpha_p < 1 α1+α2+⋯+αp<1
q q q 阶移动平均模型(MA(q)模型): y t = ε t + β 1 ε t − 1 + β 2 ε t − 2 + ⋯ + β q ε t − q y_t = \varepsilon_t + \beta_1\varepsilon_{t - 1} + \beta_2\varepsilon_{t - 2} + \cdots + \beta_q\varepsilon_{t - q} yt=εt+β1εt−1+β2εt−2+⋯+βqεt−q
MA模型和AR模型之间的关系
MA(1) 模型: y t = ε t − β 1 ε t − 1 y_t = \varepsilon_t - \beta_1\varepsilon_{t - 1} yt=εt−β1εt−1 将上面的式子使用滞后算子的写法为: y t = ( 1 − β 1 L ) ε t ⇒ 1 1 − β 1 L y t = ε t y_t = (1 - \beta_1L)\varepsilon_t \Rightarrow \frac{1}{1 - \beta_1L}y_t = \varepsilon_t yt=(1−β1L)εt⇒1−β1L1yt=εt又因为 ( 1 − β 1 L ) ( 1 + β 1 L + β 1 2 L 2 + ⋯ ) = ( 1 − β 1 L + β 1 2 L 2 + ⋯ ) − ( β 1 L + β 1 2 L 2 + ⋯ ) = 1 (1 - \beta_1L)(1 + \beta_1L + \beta_1^2L^2 + \cdots) = (1 - \beta_1L + \beta_1^2L^2 + \cdots) - (\beta_1L + \beta_1^2L^2 + \cdots) = 1 (1−β1L)(1+β1L+β12L2+⋯)=(1−β1L+β12L2+⋯)−(β1L+β12L2+⋯)=1所以 1 1 − β 1 L = 1 + β 1 L + β 1 2 L 2 + ⋯ ( 条件: ∣ β 1 ∣ < 1 ) \frac{1}{1 - \beta_1L} = 1 + \beta_1L + \beta_1^2L^2 + \cdots(\text{条件:}|\beta_1| < 1) 1−β1L1=1+β1L+β12L2+⋯(条件:∣β1∣<1)
则 1 1 − β 1 L y t = ε t ⇒ ( 1 + β 1 L + β 1 2 L 2 + ⋯ ) y t = ε t \frac{1}{1 - \beta_1L}y_t = \varepsilon_t \Rightarrow (1 + \beta_1L + \beta_1^2L^2 + \cdots)y_t = \varepsilon_t 1−β1L1yt=εt⇒(1+β1L+β12L2+⋯)yt=εt
所以 y t + β 1 y t − 1 + β 1 2 y t − 2 + ⋯ = ε t ⇒ y t = ε t − β 1 y t − 1 − β 1 2 y t − 2 + ⋯ y_t + \beta_1y_{t - 1} + \beta_1^2y_{t - 2} + \cdots = \varepsilon_t \Rightarrow y_t = \varepsilon_t - \beta_1y_{t - 1} - \beta_1^2y_{t - 2} + \cdots yt+β1yt−1+β12yt−2+⋯=εt⇒yt=εt−β1yt−1−β12yt−2+⋯
从上面的例子可以知道,可以将 1 阶移动平均模型转换为无穷阶的自回归模型。之所以需要 MA(q) 模型,是因为在模型分析中我们需要参数尽可能地少,因此需要 MA(q) 模型来帮助我们简化。
MA(q) 模型的平稳性
只要 q q q 是常数,那么 MA(q) 模型一定是平稳的。
自回归移动平均模型就是设法将自回归过程 AR 和移动平均过程 MA 结合起来,共同模拟由时间序列的随机过程。
模型 | ACF | PACF |
---|---|---|
AR(p) | 逐渐衰减,即拖尾 | p 阶后截尾 |
MA(q) | q 阶后截尾 | 逐渐衰减,即拖尾 |
ARMA(p, q) | 逐渐衰减,即拖尾 | 逐渐衰减,即拖尾 |
赤池信息准则: A I C = 2 ( 模型中参数的个数 ) − 2 ln ( 模型的极大似然函数值 ) AIC = 2(\text{模型中参数的个数}) - 2\ln (\text{模型的极大似然函数值}) AIC=2(模型中参数的个数)−2ln(模型的极大似然函数值)
贝叶斯信息准则: B I C = ln ( T ) ( 模型中参数的个数 ) − 2 ln 模型的极大似然函数值 BIC = \ln(T)(\text{模型中参数的个数}) - 2\ln \text{模型的极大似然函数值} BIC=ln(T)(模型中参数的个数)−2ln模型的极大似然函数值
AIC 和 BIC 是喧嚣原则,我们要选择使得 AIC 或者 BIC 最小的模型。(由于 BIC 对于模型复杂程度的惩罚系数更大,因此通常根据 BIC 来确定模型)
估计了时间序列模型后,我们需要对残差进行白噪声检验,如果残差是白噪声,则说明模型能够完全识别时间序列数据的规律。
H 0 = ρ 1 = ρ 2 = ⋯ = ρ s = 0 , H 1 : ρ i ( i = 1 , 2 , ⋯ , s ) 中 至 少 有 一 个 不 为 0 H_0 = \rho_1 = \rho_2 = \cdots = \rho_s = 0, H_1: \rho_i(i = 1, 2, \cdots, s)中至少有一个不为 0 H0=ρ1=ρ2=⋯=ρs=0,H1:ρi(i=1,2,⋯,s)中至少有一个不为0 在 H 0 H_0 H0 成立的条件下,统计量 Q = T ( T + 2 ) ∑ i = 1 s r k 2 T − k χ s − n 2 Q = T(T + 2)\sum_{i = 1}^{s}\frac{r_k^2}{T - k}~\chi_{s - n}^2 Q=T(T+2)∑i=1sT−krk2 χs−n2
软件可以计算出 p p p 值, p p p 值小于 0.05 则可以拒绝原假设,此时模型没有识别完全,需要进行修正。
(1) T T T 表示样本个数
(2) n n n 表示模型中的位置参数
(3) s s s 根据样本量的大小一般可以取 8,16,24 等(SPSS取18)
对于可能是 d d d 阶单位根过程的时间序列,我们需要先对数据进行差分处理,将其转换为平稳的时间序列后再进行建模。
季节性 ARIMA 模型是通过在 ARIMA 模型中包含额外的季节性项而生成的,其形式为: S A R I M A ( p , d , q ) × ( P , D , Q ) m SARIMA(p, d, q)\times(P, D, Q)_m SARIMA(p,d,q)×(P,D,Q)m(m 表示周期数) ( 1 − ∑ i = 1 p ϕ i L i ) ( 1 − ∑ i = 1 P Φ i L m i ) ( 1 − L ) d ( 1 − L m ) D y t = α 0 + ( 1 + ∑ i = 1 q θ i L i ) ( 1 + ∑ i = 1 Q Θ i L m i ) ε t (1 - \sum_{i = 1}^{p}\phi_iL^i)(1 - \sum_{i = 1}^{P}\Phi_iL^{mi})(1 - L)^d(1 - L^m)^Dy_t = \alpha_0 + (1 + \sum_{i = 1}^{q}\theta_iL^i)(1 + \sum_{i = 1}^{Q}\Theta_iL^{mi})\varepsilon_t (1−i=1∑pϕiLi)(1−i=1∑PΦiLmi)(1−L)d(1−Lm)Dyt=α0+(1+i=1∑qθiLi)(1+i=1∑QΘiLmi)εt