一.概述
1.时间序列的预处理:
对观测值序列的纯随机性和平稳性的检测称为"时间序列的预处理",根据检测结果可将序列分为不同类型.记γ(s,t)=Cov(Xs,Xt)
2.概率分布族:
对时间序列 { X t , t ∈ T } , ∀ m ∈ Z + , t 1 , t 2 . . . t m ∈ T \{X_t,t\in T\},∀m\in Z^+,t_1,t_2...t_m\in T {Xt,t∈T},∀m∈Z+,t1,t2...tm∈T,将 X t 1 , X t 2 . . . X t m X_{t_1},X_{t_2}...X_{t_m} Xt1,Xt2...Xtm的联合概率分布记为 F t 1 , t 2 . . . t m ( x 1 , x 2 . . . x m ) F_{t_1,t_2...t_m}(x_1,x_2...x_m) Ft1,t2...tm(x1,x2...xm),则称 { F t 1 , t 2 . . . t m ( x 1 , x 2 . . . x m ) , ∀ m ∈ Z + , ∀ t 1 , t 2 . . . t m ∈ T } \{F_{t_1,t_2...t_m}(x_1,x_2...x_m),∀m\in Z^+,∀t_1,t_2...t_m\in T\} {Ft1,t2...tm(x1,x2...xm),∀m∈Z+,∀t1,t2...tm∈T}为 { X t } \{X_t\} {Xt}的概率分布族
二.平稳性检测
1.概念
"平稳序列"(Stationary Series)是指在某1常数附近波动且波动幅度有限的序列.具体来说,要求期望/方差为常数而协方差只与时期间隔有关
(1)严平稳:
"严平稳"(Strictly Stationary)/"强平稳"(Strongly Stationary)是1种条件比较苛刻的平稳性定义.其认为只有当序列所有的统计性质都不随时
间推移而变化时,该序列才是平稳的.也就是说,严平稳序列需要满足如下性质:
设 { X t } \{X_t\} {Xt}为1个时间序列,若对 ∀ m ∈ Z + , ∀ t 1 , t 2 . . . t m ∈ T , ∀ τ ∈ Z ∀m\in Z^+,∀t_1,t_2...t_m\in T,∀\tau\in Z ∀m∈Z+,∀t1,t2...tm∈T,∀τ∈Z,有 F t 1 , t 2 . . . t m ( x 1 , x 2 . . . x m ) = F t 1 + τ , t 2 + τ . . . t m + τ ( x 1 , x 2 . . . x m ) F_{t_1,t_2...t_m}(x_1,x_2...x_m)=F_{t_{1+\tau},t_{2+\tau}...t_{m+\tau}}(x_1,x_2...x_m) Ft1,t2...tm(x1,x2...xm)=Ft1+τ,t2+τ...tm+τ(x1,x2...xm),则称 { X t } \{X_t\} {Xt}为1个严平稳时间序列或强平稳时间序列
一把来说很难证明某时间序列是强平稳的,因此实践中通常使用弱平稳条件
(2)宽平稳:
"宽/弱平稳"(Weak Stationary)/"广义平稳"(Wide-Sense Stationary)是使用序列的特征统计量来定义的1种平稳性.其认为序列的统计性质主要由
其低阶矩决定,故只要保证序列的低阶矩(此处是2阶矩)平稳,就能保证序列的主要性质近似稳定.也就是说,宽平稳序列需要满足如下性质:
设 { X t } \{X_t\} {Xt}为1个时间序列,若对 ∀ t , k ∈ T ∀t,k\in T ∀t,k∈T,有 ① 均 值 满 足 : E ( X t ) = μ ˉ ② 二 阶 矩 满 足 : E ( X t 2 ) < + ∞ ③ 自 协 方 差 满 足 : γ ( 0 , k ) = γ ( t , t + k ) ①均值满足:E(X_t)=\bar{μ}\\②二阶矩满足:E(X_t^2)<+\infty\\③自协方差满足:γ(0,k)=γ(t,t+k) ①均值满足:E(Xt)=μˉ②二阶矩满足:E(Xt2)<+∞③自协方差满足:γ(0,k)=γ(t,t+k)则称 { X t } \{X_t\} {Xt}为1个宽平稳时间序列或弱平稳时间序列或二阶平稳时间序列或广义平稳时间序列
(3)严平稳与宽平稳的关系:
两种平稳过程并没有包含关系,即弱平稳不一定是强平稳,强平稳也不一定是弱平稳 ( ( (因为 E ( X t 2 ) E(X_t^2) E(Xt2)可能不存在 ) ) ).例如,若 { Z t } \{Z_t\} {Zt}独立服从柯西分布,则其是强平稳时间序列,但由于柯西分布的期望与方差不存在,故其不是弱平稳时间序列.但当某严平稳时间序列满足 E ( X t 2 ) < + ∞ E(X_t^2)<+\infty E(Xt2)<+∞时,其一定也是宽平稳时间序列.另外,当序列服从多元正态分布时,宽平稳可推出严平稳
2.相关统计性质
(1)均值:
由于每个 X i X_i Xi的均值均相等,故 μ i = μ = ∑ j = 1 n x j n ( i = 1 , 2... n ) μ_i=μ=\frac{\displaystyle\sum_{j=1}^nx_j}{n}\,(i=1,2...n) μi=μ=nj=1∑nxj(i=1,2...n)
(2)方差与协方差与自相关系数:
对宽平稳时间序列 { X t , t ∈ T } , ∀ k ∈ Z \{X_t,t\in T\},∀k\in Z {Xt,t∈T},∀k∈Z,定义延迟 k k k阶自协方差函数 r ( k ) r(k) r(k)为 r ( k ) = γ ( t , t + k ) r(k)=γ(t,t+k) r(k)=γ(t,t+k)其估计量为 r ^ ( k ) = ∑ t = 1 n − k ( x t − x ˉ ) ( x t + k − x ˉ ) n − k ( 0 < k < n ) \hat{r}(k)=\frac{\displaystyle\sum_{t=1}^{n-k}(x_t-\bar{x})(x_{t+k}-\bar{x})}{n-k}\,(0
r^(k)=n−kt=1∑n−k(xt−xˉ)(xt+k−xˉ)(0<k<n) 从而可知宽平稳时间序列具有常数方差 D ( X t ) = γ ( t , t ) = r ( 0 ) D(X_t)=γ(t,t)=r(0) D(Xt)=γ(t,t)=r(0)其估计量为 r ^ ( 0 ) = ∑ t = 1 n ( x t − x ˉ ) 2 n − 1 \hat{r}(0)=\frac{\displaystyle\sum_{t=1}^n(x_t-\bar{x})^2}{n-1} r^(0)=n−1t=1∑n(xt−xˉ)2以保证无偏性.定义延迟 k k k阶自相关系数 ρ ( k ) ρ(k) ρ(k)为 ρ ( k ) = γ ( t , t + k ) D ( X t ) D ( X t + k ) = r ( k ) r ( 0 ) ρ(k)=\frac{γ(t,t+k)}{\sqrt{D(X_t)D(X_{t+k})}}=\frac{r(k)}{r(0)} ρ(k)=D(Xt)D(Xt+k)γ(t,t+k)=r(0)r(k) ρ ( k ) ρ(k) ρ(k)具有如下性质 ① 规 范 性 : ρ ( 0 ) = 1 且 ∣ ρ ( k ) ∣ ≤ 1 ( k ∈ Z ) ② 对 称 性 : ρ ( k ) = ρ ( − k ) ③ 非 负 定 性 : 自 相 关 系 数 矩 阵 Γ m 为 对 称 非 负 定 矩 阵 , 其 中 Γ m = [ ρ ( 0 ) ρ ( 1 ) . . . ρ ( m − 1 ) ρ ( 1 ) ρ ( 0 ) . . . ρ ( m − 2 ) . . . . . . . . . . . . ρ ( m − 1 ) ρ ( m − 2 ) . . . ρ ( 0 ) ] ④ 非 唯 一 性 : 由 模 型 可 唯 一 确 定 自 相 关 系 数 , 但 由 自 相 关 系 数 不 能 唯 一 确 定 模 型 ①规范性:ρ(0)=1且|ρ(k)|≤1\,(k∈Z)\\②对称性:ρ(k)=ρ(-k)\\③非负定性:自相关系数矩阵Γ_m为对称非负定矩阵,其中\\Γ_m=\left[\begin{matrix}ρ(0)&ρ(1)&...&ρ(m-1)\\ρ(1)&ρ(0)&...&ρ(m-2)\\...&...&...&...\\ρ(m-1)&ρ(m-2)&...&ρ(0)\end{matrix}\right]\\④非唯一性:由模型可唯一确定自相关系数,但由自相关系数不能唯一确定模型 ①规范性:ρ(0)=1且∣ρ(k)∣≤1(k∈Z)②对称性:ρ(k)=ρ(−k)③非负定性:自相关系数矩阵Γm为对称非负定矩阵,其中Γm=⎣⎢⎢⎡ρ(0)ρ(1)...ρ(m−1)ρ(1)ρ(0)...ρ(m−2)............ρ(m−1)ρ(m−2)...ρ(0)⎦⎥⎥⎤④非唯一性:由模型可唯一确定自相关系数,但由自相关系数不能唯一确定模型其估计量为 ρ ^ 2 ( k ) = r ^ ( k ) r ^ ( 0 ) ( 0 < k < n ) \hat{ρ}^2(k)=\frac{\hat{r}(k)}{\hat{r}(0)}\,(0ρ^2(k)=r^(0)r^(k)(0<k<n) 当 k < < n k<k<<n 时,可简化为 ρ ^ 2 ( k ) = ∑ t = 1 n − k ( x t − x ˉ ) ( x t + k − x ˉ ) ∑ t = 1 n ( x t − x ˉ ) 2 ( 0 < k < n ) \hat{ρ}^2(k)=\frac{\displaystyle\sum_{t=1}^{n-k}(x_t-\bar{x})(x_{t+k}-\bar{x})}{\displaystyle\sum_{t=1}^n(x_t-\bar{x})^2}\,(0ρ^2(k)=t=1∑n(xt−xˉ)2t=1∑n−k(xt−xˉ)(xt+k−xˉ)(0<k<n)
3.检测方法:
①图检验:这种方法操作简单但带有主观性
Ⅰ.时序图检验:平稳序列的时序图应显示序列值始终在1个常数附近波动,且波动范围有界、无明显趋势及周期特征
Ⅱ.自相关图检验:平稳序列通常具有短期相关性,即其协方差随延迟期数的增大而衰减的速度比非平稳序列要快
②构造检验统计量进行检验
Ⅰ.单位根检验:如果序列中存在单位根,就是非平稳序列
i.DF检验
ii.ADF检验
iii.PP检验
4.平稳时间序列的意义:
①时间序列结构的特殊性:包含多个随机变量,但每个变量只有1个观测值
②平稳性的意义:减少了随机变量个数,增加了待估变量观测值的数量,从而降低了时间序列分析的难度并提高了特征统计量的估计精度
三.纯随机性检测
1.概念:
"纯随机序列"(Purely Random Series)又称"白噪声序列"(White Noise Series),是指各序列值间没有任何关系(即"没有记忆")且具有相同均值和
方差的序列.即纯随机序列需要满足如下性质:
① E ( X t ) = μ ② γ ( t , s ) = { 0 ( t ≠ s ) σ 2 ( t = s ) ①E(X_t)=μ\\②γ(t,s)=\begin{cases}0\,(t≠s)\\σ^2\,(t=s)\end{cases} ①E(Xt)=μ②γ(t,s)={0(t=s)σ2(t=s)
2.相关统计性质
(1)纯随机性:
即满足 r ( k ) = 0 ( k ≠ 0 ) r(k)=0\,(k≠0) r(k)=0(k=0)这说明纯随机序列的各序列值间没有任何关系(即没有记忆).也就是说,这类序列进行的是完全无序的随机波动,是没有任何信息可供提取的平稳序列,因而应终止对这类序列的分析.反之,非春随机序列的序列值间存在着一定程度的相互关系(称为相关信息).时间序列分析的目的就是提取相关信息.一旦所有相关信息都被提取出来了,那么剩下的残差序列应为春随机序列.故纯随机性还可用于判断相关信息的提取是否充分
(2)方差齐性:
即满足 D ( X t ) = r ( 0 ) = σ 2 D(X_t)=r(0)=σ^2 D(Xt)=r(0)=σ2根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的位置参数估计值才是准确有效的方差最小线性无偏估计;否则,拟合模型的精度会受到很大影响.另外,进行模型拟合时需要检验拟合模型的残差是否满足方差齐性假定.如果不满足,就说明残差序列还不是白噪声序列(即拟合模型没有充分提取随机序列中的相关信息),这时拟合模型的精度是值得怀疑的.如果随机序列不满足方差齐性假定,就需要使用条件异方差模型来处理异方差信息
(3)巴利特定理:
纯随机时间序列满足巴利特定理(Barlett Theorem),即对1个期数为 n n n的纯随机时间序列,其自相关系数满足 ρ ^ ( k ) ∼ N ( 0 , 1 n ) ( k ≠ 0 ) \hat{ρ}(k)\sim N(0,\frac{1}{n})\,(k\ne0) ρ^(k)∼N(0,n1)(k=0)
(4)克努耶定理:
纯随机时间序列满足克努耶定理(Quenouille Theorem),即对1个期数为 n n n的纯随机时间序列,其偏自相关系数满足 ρ ^ x t − 1 . . . x t − k + 1 ( k ) ∼ N ( 0 , 1 n ) ( k ≠ 0 ) \hat{ρ}_{x_{t-1}...x_{t-k+1}}(k)\sim N(0,\frac{1}{n})\,(k\ne0) ρ^xt−1...xt−k+1(k)∼N(0,n1)(k=0)
3.检测方法
(1)检验假设:
原假设为: ρ ( i ) = 0 ( i = 1 , 2... m , m ≥ 1 ) ρ(i)=0\,(i=1,2...m,m\geq1) ρ(i)=0(i=1,2...m,m≥1)实践中通常取 m = 6 m=6 m=6或 12 12 12.这是因为平稳序列通常具有短期相关性,相关关系通常只出现在延迟期数较小的序列值间.另一方面,如果考虑的期数过多,短期相关性可能被掩盖,因为平稳序列的协方差会随延迟期数的增大而迅速衰减,使延迟期数较大的自相关系数均为0
(2)检验统计量:
通常是构造检验统计量来进行检验,包括:
①Q统计量:即检验是否满足 Q = n ∑ k = 1 m ρ ^ k 2 ∼ χ 2 ( m ) Q=n\displaystyle\sum_{k=1}^m\hat{ρ}^2_k\sim\chi^2(m) Q=nk=1∑mρ^k2∼χ2(m);该统计量在样本数较少时效果不佳
②LB统计量:即检验是否满足 L B = n ( n + 2 ) ∑ k = 1 m ρ ^ k 2 n − k ∼ χ 2 ( m ) LB=n(n+2)\displaystyle\sum_{k=1}^m\frac{\hat{ρ}^2_k}{n-k}\sim\chi^2(m) LB=n(n+2)k=1∑mn−kρ^k2∼χ2(m);该统计量更常用
其中 n n n为序列长度, m m m为要检验的最大的延迟期数, ρ ^ ( k ) \hat{ρ}(k) ρ^(k)为延迟 k k k阶自相关系数的估计量