【时间序列分析基础系列之一】随机性时间序列模型

文章目录

  • 前言
  • 1 随机性时间序列模型
    • 1.1 基本概念
      • 1.1.1 随机过程概念
      • 1.1.2 几个重要的平稳随机过程
        • 白噪声(纯随机过程)
        • 独立增量随机过程
        • 二阶矩过程与宽平稳过程
        • 严平稳随机过程
        • 正态过程
      • 1.1.3 动态性
  • 2 算子
    • 2.1 差分算子
    • 2.2 格林函数
    • 2.3 后移算子
  • 3 分解
    • 3.1 Wold分解
  • 4 参数估计
    • 4.1 直接估计法
      • 4.1.1 矩估计
      • 4.1.2 极大似然估计
      • 4.1.3 条件最小二乘估计
    • 4.2 数值法
      • 4.2.1 线性迭代法
      • 4.2.2 牛顿-拉普森(Newton-Raphson)算法


前言

1 随机性时间序列模型

时间序列分析方法是通过对样本观测值的观察分析,将时间序列的趋势项、周期项和随机项分解出来。
其中,对于趋势性或周期性变化,常用确定性时序分析,而对于余下的随机项,可用随机时序模型拟合,属于随机时序分析。确定和随机两部分组合起来共同描述一个时间序列。
随机性时间序列模型最早由G.E.P.Box和G.M.Jenkins提出。

1.1 基本概念

1.1.1 随机过程概念

T T T是负无穷到正无穷的子集,如果 ∀ t ∈ T \forall t\in T tT,都有一个随机变量与之对应,就称为随机变量的集合为随机过程。
T T T是全体整数或全体非负整数时,称相应的随机过程为离散随机过程。把随机序列的指标集合 T T T看成时间指标时,这个随机序列就是离散时间序列。
T T T是全体实数或全体非负实数时,称相应的随机过程为连续随机过程。把随机序列的指标集合 T T T看成时间指标时,这个随机序列就是连续时间序列。

1.1.2 几个重要的平稳随机过程

白噪声(纯随机过程)

a t {a_t} at为平稳序列,对于 ∀ t ∈ N \forall t\in N tN,都有

E ( a t ) = μ E(a_t)=\mu E(at)=μ
C O V ( a t , a s ) = {   σ a 2 , ( t = s )   0 , t ≠ s COV(a_t,a_s) = \left\{ \begin{aligned} \ \sigma^2_a, (t=s) \\ \ 0, t\neq s \end{aligned} \right. COV(at,as)={ σa2,(t=s) 0,t=s

独立增量随机过程

对于 ∀ n , t i ∈ T ( i = 1 , 2 , . . . , n ; t 1 < t 2 < . . . < t n ) \forall n,t_i \in T(i=1,2,...,n; t_1n,tiT(i=1,2,...,n;t1<t2<...<tn),随机变量 X ( t 2 ) − X ( t 1 ) , X ( t 3 ) − X ( t 2 ) , . . . , X ( t n ) − X ( t n − 1 ) X(t_2)-X(t_1), X(t_3)-X(t_2),...,X(t_n)-X(t_n-1) X(t2)X(t1),X(t3)X(t2),...,X(tn)X(tn1)都相互独立,则称随机过程 { X t } = { X t : t ∈ T } \{X_t\}=\{X_t:t\in T\} {Xt}={Xt:tT}为独立增量随机过程

二阶矩过程与宽平稳过程

对于 ∀ t ∈ T , X t \forall t \in T,X_t tTXt的均值和方差存在,则称此过程为二阶矩过程。
若随机过程 { X t , t ∈ T } \{X_t, t \in T\} {Xt,tT}是一个二阶矩过程,且满足:
E X t = μ , ∀ t ∈ T   E [ X t + τ ] [ X t − μ ] = γ τ , ∀ t , t + τ ∈ T EX_t=\mu, \forall t\in T \\ \ \\ E[X_{t+\tau}][X_t-\mu]=\gamma_\tau, \forall t,t+\tau \in T EXt=μ,tT E[Xt+τ][Xtμ]=γτ,t,t+τT
则称 { X t , t ∈ T } \{X_t,t\in T \} {Xt,tT}为宽平稳随机过程。

注意:白噪声为宽平稳随机过程,平稳时间序列中讨论的都为宽平稳随机序列。

严平稳随机过程

对于 ∀ t i ( i = 1 , 2 , . . . , n ) \forall t_i(i=1,2,...,n) ti(i=1,2,...,n)和任意实数 s s s,随机过程 { X t } \{X_t\} {Xt} n n n维分布函数满足关系式,即为严平稳随机过程:
F n ( X 1 , X 2 , . . . , X n ; t 1 , t 2 , . . . , t n ) = F n ( X 1 , X 2 , . . . , X n ; t 1 + s , t 2 + s , . . . , t n + s ) F_n(X_1,X_2,...,X_n;t_1,t_2,...,t_n)=F_n(X_1,X_2,...,X_n;t_1+s,t_2+s,...,t_n+s) Fn(X1,X2,...,Xn;t1,t2,...,tn)=Fn(X1,X2,...,Xn;t1+s,t2+s,...,tn+s)
二阶矩存在的严平稳随机过程一定是宽平稳随机过程,反之不成立。

正态过程

{ X t , t ∈ T } \{X_t, t\in T\} {Xt,tT}的有限维分布都是正态分布,则称 { X t , t ∈ T } \{X_t, t \in T\} {Xt,tT}为正态随机过程。

1.1.3 动态性

动态性:系统现在的行为与其历史行为的相关性,也就是系统的记忆性,具体地,就是在某一时刻进入系统的输入对系统后续行为的影响,如果该输入只影响系统下一时刻的行为,而对下一时刻以后的行为不发生作用,那么系统就有一阶动态或一期记忆性。
那么以此类推,如果该输入对系统之后的 n n n个时刻的行为都有影响,那么就说系统具有 n n n阶动态性。例如, n n n阶自回归模型( A R ( n ) AR(n) AR(n))为:
X t = ϕ 1 X t − 1 + ϕ 2 X t − 2 + . . . + ϕ n X t − n + a t X_t = \phi_1 X_{t-1}+\phi_2 X_{t-2}+...+\phi_n X_{t-n}+a_t Xt=ϕ1Xt1+ϕ2Xt2+...+ϕnXtn+at
A R ( n ) AR(n) AR(n)模型对比来看, M A ( m ) MA(m) MA(m)模型描述的是系统对过去时刻进入系统的噪声的记忆:
X t = a t − θ 1 a t − 1 − θ 2 a t − 2 − . . . − θ m a t − m X_t = a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m} Xt=atθ1at1θ2at2...θmatm
综合来看, A R M A ( n , m ) ARMA(n,m) ARMA(n,m)描述的是系统对过去自身状态以及各时刻进入的噪声的记忆。
X t − ϕ 1 X t − 1 − ϕ 2 X t − 2 − . . . − ϕ n X t − n = a t − θ 1 a t − 1 − θ 2 a t − 2 − . . . − θ m a t − m X_t-\phi_1 X_{t-1}-\phi_2 X_{t-2}-...-\phi_n X_{t-n} \\=a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m} Xtϕ1Xt1ϕ2Xt2...ϕnXtn=atθ1at1θ2at2...θmatm

2 算子

2.1 差分算子

A R ( 1 ) AR(1) AR(1)模型为例:
X t = X t − 1 + a t X_t = X_{t-1}+a_t Xt=Xt1+at
即有下式,其中 ∇ \nabla 表示差分算子:
∇ X t = a t \nabla X_t = a_t Xt=at
除此之外,我们称 Y t = X t − X t − 1 Y_t=X_t - X_{t-1} Yt=XtXt1叫做关于 X t X_t Xt的一阶差分,记为:
Y t = ∇ X t Y_t = \nabla X_t Yt=Xt
由此递归,则称 Z t = Y t − Y t − 1 Z_t=Y_t - Y_{t-1} Zt=YtYt1叫做关于 Y t Y_t Yt的一阶差分,也是关于 X t X_t Xt的二阶差分,记为:
Z t = ∇ Y t = X t − X t − 1 − X t − 1 + X t − 2 = ∇ 2 X t Z_t = \nabla Y_t=X_t - X_{t-1}-X_{t-1} + X_{t-2}=\nabla^2X_t Zt=Yt=XtXt1Xt1+Xt2=2Xt
类似地,设 X t X_t Xt地第 k − 1 k-1 k1次差分为 W t W_t Wt,则称 W t − W t − 1 W_t-W_{t-1} WtWt1 X t X_t Xt k k k阶差分。

注意:k阶差分不是简单的$X_t - X_{t-k}$,而是叠加差分。

2.2 格林函数

同样以 A R ( 1 ) AR(1) AR(1)模型为例:
X t = X t − 1 + a t X_t = X_{t-1}+a_t Xt=Xt1+at
对应的齐次差分方程的解为:
X t = c φ 1 t + a t , t ∈ Z X_t = c\varphi_1^t+a_t, t\in Z Xt=cφ1t+at,tZ
A R ( 1 ) AR(1) AR(1)右边的形式可知,模型的特解可能是 { a t } \{a_t\} {at}序列的线性组合:

X t = φ 1 X t − 1 + a t = φ 1 ( φ 2 X t − 2 + a t − 1 ) + a t = φ 1 2 X t − 2 + φ 1 a t − 1 + a t = φ 1 2 ( φ X t − 3 + a t − 2 ) + φ 1 a t − 1 + a t = φ 3 X t − 3 + φ 2 a t − 2 + φ 1 a t − 1 + a t . . . = ∑ j = 0 ∞ φ 1 j a t − j \begin{aligned} X_t &= \varphi_1X_{t-1}+a_t \\ &= \varphi_1(\varphi_2X_{t-2}+a_{t-1})+a_t \\ &=\varphi_1^2X_{t-2}+\varphi_1a_{t-1}+a_t \\ &=\varphi_1^2(\varphi X_{t-3}+a_{t-2})+\varphi_1a_{t-1}+a_t \\ &=\varphi^3X_{t-3}+\varphi^2a_{t-2}+\varphi_1a_{t-1}+a_{t} \\ &... \\ &=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j} \end{aligned} Xt=φ1Xt1+at=φ1(φ2Xt2+at1)+at=φ12Xt2+φ1at1+at=φ12(φXt3+at2)+φ1at1+at=φ3Xt3+φ2at2+φ1at1+at...=j=0φ1jatj
A R ( 1 ) AR(1) AR(1)的通解为:
X t = ∑ j = 0 ∞ φ 1 j a t − j + c φ 1 t X_t=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j}+c\varphi_1^t Xt=j=0φ1jatj+cφ1t
而其中系数函数 φ 1 j \varphi_1^j φ1j客观地描述了该系数地动态性,故称此系数为格林函数,用 G j G_j Gj表示:
G j = φ 1 j G_j = \varphi_1^j Gj=φ1j
A R ( 1 ) AR(1) AR(1)的特解也可以改写为:
X t = ∑ j = 0 ∞ G 1 j a t − j X_t=\sum^{\infty}_{j=0}G_1^{j}a_{t-j} Xt=j=0G1jatj

2.3 后移算子

后移算子 B B B表示后移的期数,如: B j X t = X t − j B^jX_t=X_{t-j} BjXt=Xtj
具有如下性质:

  • 对和 t t t无关的随机变量 Y Y Y有: B Y = Y BY=Y BY=Y
  • 对整数 n n n,常数 a a a有: B n ( a X t ) = a B n X t = a X t − n B^n(aX_t)=aB^nX_t=aX_{t-n} Bn(aXt)=aBnXt=aXtn
  • 对整数 n , m n,m n,m有: B n + m ( X t ) = B n B m X t = X t − n − m B^{n+m}(X_t)=B^nB^mX_t=X_{t-n-m} Bn+m(Xt)=BnBmXt=Xtnm
  • 对多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=j=0pcjzj,有: ψ ( B ) X t = ∑ j = 0 p c j X t − j \psi(B)X_t=\sum^p_{j=0}c_jX_{t-j} ψ(B)Xt=j=0pcjXtj
  • 对多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=j=0pcjzj φ ( z ) = ∑ j = 0 q d j z j \varphi(z)=\sum^q_{j=0}d_jz^j φ(z)=j=0qdjzj的乘积 f ( z ) = ψ ( z ) φ ( z ) f(z)=\psi(z)\varphi(z) f(z)=ψ(z)φ(z),有:
    f ( B ) X t = ψ ( B ) [ φ ( B ) X t ] = φ ( B ) [ ψ ( B ) X t ] f(B)X_t=\psi(B)[\varphi(B)X_t]=\varphi(B)[\psi(B)X_t] f(B)Xt=ψ(B)[φ(B)Xt]=φ(B)[ψ(B)Xt]
  • 对时间序列 X t , Y t X_t,Y_t Xt,Yt而言,多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=j=0pcjzj和随机变量U,V,W,有: ψ ( B ) ( U X t + V Y t + W ) = U ψ ( B ) X t + V ψ ( B ) Y t + W ψ ( 1 ) \psi(B)(UX_t+VY_t+W)=U\psi(B)X_t+V\psi(B)Y_t+W\psi(1) ψ(B)(UXt+VYt+W)=Uψ(B)Xt+Vψ(B)Yt+Wψ(1)

3 分解

3.1 Wold分解

回顾 A R ( 1 ) AR(1) AR(1)模型的特解为下式,下式也被成为Wold分解式, G j G_j Gj也叫Wold系数:
X t = ∑ j = 0 ∞ = G j a t − j X_t = \sum^\infty_{j=0} =G_ja_{t-j} Xt=j=0=Gjatj
由于 a t − j a_{t-j} atj为相互独立的(模型假设),所以可以看作线性空间的基, X t X_t Xt可由 a t − j a_{t-j} atj进行线性表示。其系数 G j G_j Gj X t X_t Xt对于 a t − j a_{t-j} atj的坐标投影, X t X_t Xt G j a t − j G_ja_{t-j} Gjatj的正交向量和。
也就是说,用线性空间来审视上式,即为wold分解。

4 参数估计

4.1 直接估计法

常用的参数估计方法:

4.1.1 矩估计

4.1.2 极大似然估计

4.1.3 条件最小二乘估计

条件最小二乘估计是实际中最常用的参数估计方法,假设条件为:
a t − 1 = a t − 2 = . . . = a t − q = 0 a_{t-1}=a_{t-2}=...=a_{t-q}=0 at1=at2=...=atq=0
残差平方和方程为:
Q ( β ^ ) = ∑ t = p + 1 n a t 2 = ∑ t = p + 1 n [ X t − ∑ i = 1 p φ i X t − i + ∑ j = 1 q θ j a t − j ] 2 Q(\hat\beta)=\sum^n_{t=p+1}a_t^2=\sum^n_{t=p+1}[X_t-\sum^p_{i=1}\varphi_iX_{t-i}+\sum^q_{j=1}\theta_ja_{t-j}]^2 Q(β^)=t=p+1nat2=t=p+1n[Xti=1pφiXti+j=1qθjatj]2
解法:迭代法
优缺点:

  • OLS估计充分应用每一个观察值提供的信息,因而估计精度高
  • 条件OLS估计使用率较高
  • 但是需要假定总体分布(缺点)

4.2 数值法

都是用迭代

4.2.1 线性迭代法

给出初始值,根据式子进行迭代计算,直至相邻两次迭代值相差不大时停止迭代,最后迭代结果作为近似解

4.2.2 牛顿-拉普森(Newton-Raphson)算法

你可能感兴趣的:(时间序列分析,回归)