本文主要介绍时间序列分析中会用到的一些数学知识。
令 X X X具有概率密度函数 f ( x ) f(x) f(x),并且令 ( X , Y ) (X,Y) (X,Y)对具有联合概率密度函数 f ( x , y ) f(x,y) f(x,y)。
定义 X X X的期望值为: E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)={\int\limits_{-\infty}^\infty}xf(x)dx E(X)=−∞∫∞xf(x)dx。
随机变量 X X X的方差定义为: D ( X ) = E { [ X − E ( X ) ] 2 } D(X)=E\{[X-E(X)]^2\} D(X)=E{[X−E(X)]2},方差通常还记为 V a r ( X ) Var(X) Var(X)、 μ 2 \mu^2 μ2。
若 X X X是离散型随机变量,则 D ( X ) = ∑ k = 1 ∞ [ x k − E ( x ) ] 2 p k D(X)=\sum_{k=1}^{\infty}[x_k-E(x)]^2p_k D(X)=∑k=1∞[xk−E(x)]2pk.
若 X X X是连续型随机变量,则 D ( X ) = ∫ − ∞ ∞ [ x − E ( x ) ] 2 f ( x ) d x D(X)=\int_{-\infty}^{\infty}[x-E(x)]^2f(x)dx D(X)=∫−∞∞[x−E(x)]2f(x)dx
D ( X ) = E { [ X − E ( X ) ] 2 D(X)=E\{[X-E(X)]^2 D(X)=E{[X−E(X)]2
= E { X 2 − 2 X E ( X ) + [ E ( X ) ] 2 } =E\{X^2-2XE(X)+[E(X)]^2\} =E{X2−2XE(X)+[E(X)]2}
= E ( X 2 ) − 2 E ( X ) E ( X ) + [ E ( x ) ] 2 =E(X^2)-2E(X)E(X)+[E(x)]^2 =E(X2)−2E(X)E(X)+[E(x)]2
= E ( X 2 ) − [ E ( X ) ] 2 =E(X^2)-[E(X)]^2 =E(X2)−[E(X)]2
C o v ( X , Y ) = E { ( X − E ( X ) ) ( Y − E ( Y ) ) } = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E\{(X-E(X))(Y-E(Y))\}=E(XY)-E(X)E(Y) Cov(X,Y)=E{(X−E(X))(Y−E(Y))}=E(XY)−E(X)E(Y)
X X X与 Y Y Y的相关系数用 C o r r ( X , Y ) Corr(X,Y) Corr(X,Y)或者 ρ \rho ρ表示,定义如下:
ρ = C o r r ( X , Y ) = C o v ( X , Y ) V a r ( X ) V a r ( Y ) ) \rho=Corr(X,Y)=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y))}} ρ=Corr(X,Y)=Var(X)Var(Y))Cov(X,Y)
对于随机变量序列 { Y t : t = 0 , 1 , 2 , 3 , . . . } \{Y_t: t=0,1,2,3,...\} {Yt:t=0,1,2,3,...}称为一个随机过程,并以之作为观测时间序列的模型。
γ t , s = C o v ( Y t , Y s ) , t , s = 0 , 1 , 2 , 3 , . . . \gamma_{t,s}=Cov(Y_t,Y_s),t,s=0,1,2,3,... γt,s=Cov(Yt,Ys),t,s=0,1,2,3,...
其中 C o v ( Y t , Y s ) = E [ ( Y t − μ t ) ( Y s − μ s ) ] Cov(Y_t,Y_s)=E[(Y_t-\mu_t)(Y_s-\mu_s)] Cov(Yt,Ys)=E[(Yt−μt)(Ys−μs)]。
ρ t , s = C o v ( Y t , Y s ) , t , s = 0 , 1 , 2 , 3 , . . . {{\rho}_{t,s}}={Cov(Y_t,Y_s)},t,s=0,1,2,3,... ρt,s=Cov(Yt,Ys),t,s=0,1,2,3,...
其中:
C o r r ( Y t , Y s ) = C o v ( Y t , Y s ) V a r ( Y t ) V a r ( Y s ) = γ t , s γ t , t γ s , s {Corr(Y_t,Y_s)} =\frac{Cov(Y_t,Y_s)}{\sqrt{Var(Y_t)Var(Y_s)}} =\frac{\gamma _{t,s}}{\sqrt{\gamma _{t,t}\gamma _{s,s}}} Corr(Yt,Ys)=Var(Yt)Var(Ys)Cov(Yt,Ys)=γt,tγs,sγt,s
在研究不同时间序列的模型协方差的性质时,反复用到如下结论:如果 c 1 , c 2 , c 3 , . . . c m c_1,c_2,c_3,...c_m c1,c2,c3,...cm和 d 1 , d 2 , d 3 , . . . d n d_1,d_2,d_3,...d_n d1,d2,d3,...dn表示常数, t 1 , t 2 , t 3 , . . . t m t_1,t_2,t_3,...t_m t1,t2,t3,...tm和 s 1 , s 2 , s 3 , . . . s n s_1,s_2,s_3,...s_n s1,s2,s3,...sn表示时间点,则有:
C o v [ ∑ i = 1 m c i Y t i , ∑ j = 1 n d i Y s j ] = ∑ i = 1 m ∑ j = 1 n c i d j C o v ( Y t i , Y s j ) {Cov[\sum_{i=1}^{m}{c_iY_{t_i}},\sum_{j=1}^{n}{d_iY_{s_j}}]} =\sum_{i=1}^{m}\sum_{j=1}^{n}c_id_jCov(Y_{t_i},Y_{s_j}) Cov[i=1∑mciYti,j=1∑ndiYsj]=i=1∑mj=1∑ncidjCov(Yti,Ysj)
平稳性的基本思想是,决定过程特性的统计规律不随着时间的变化而变化。
如果对于一切时间间隔 k k k和时间点 t 1 , t 2 , t 3 , . . . , t n t_1,t_2,t_3,...,t_n t1,t2,t3,...,tn,都有 Y t 1 , Y t 2 , . . . , Y t n Y_{t_1},Y_{t_2},...,Y_{t_n} Yt1,Yt2,...,Ytn与 Y t 1 − k , Y t 2 − k , . . . , Y t n − k Y_{t_1-k},Y_{t_2-k},...,Y_{t_n-k} Yt1−k,Yt2−k,...,Ytn−k的联合分布相同,则称过程 { Y t } \{Y_t\} {Yt}为严平稳。
1. E ( Y t ) = μ E(Y_t)=\mu E(Yt)=μ,序列的均值应该是一个常数,而不是随时间变化的函数。下图中左图满足要求,而右图的均值是随时间而变化的。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iZpgSgvs-1571583421313)(http://www.analyticsvidhya.com/wp-content/uploads/2015/02/Mean_nonstationary.png)]
2. V a r ( Y t ) = γ Var(Y_t)=\gamma Var(Yt)=γ,序列的方差为一个常数,而不随时间的变化。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jihJVijQ-1571583421314)(http://www.analyticsvidhya.com/wp-content/uploads/2015/02/Var_nonstationary.png)]
3. C o v ( Y t , Y t + k ) = γ 0 , k Cov(Y_t,Y_{t+k})=\gamma_{0,k} Cov(Yt,Yt+k)=γ0,k,序列协方差的值只与时间间隔 k k k有关,与时间 t t t无关。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I3ysuAE1-1571583421315)(http://www.analyticsvidhya.com/wp-content/uploads/2015/02/Cov_nonstationary.png)]
以上的三个条件必须全部满足,才能被称为弱平稳的时间序列。我们建立时间序列模型时必须要求时间序列是平稳的,这是因为我们用时间序列做预测时,我们的随机变量的基本特性必须能在包括未来阶段的一个长时期里维持不变,否则,基于历史和现状来预测未来的思路便是错误的。所以在时间序列建模时第一步就是要将不平稳的序列平稳化,可以采用差分等方法。
弱平稳序列的自相关系数:
ρ k = C o v ( x t , x t , k ) V a r ( x t ) V a r ( x t − k ) = C o v ( x t , x t − k ) V a r ( x t ) = γ k γ 0 \rho_k = \frac{Cov(x_t,x_{t,k})}{\sqrt{Var(x_t)Var(x_{t-k})}} =\frac{Cov(x_t,x_{t-k})}{Var(x_t)} =\frac{\gamma_k}{\gamma_0} ρk=Var(xt)Var(xt−k)Cov(xt,xt,k)=Var(xt)Cov(xt,xt−k)=γ0γk
令 e 1 , e 2 , e 3 , . . . e_1,e_2,e_3,... e1,e2,e3,...为均值为 0 0 0,方差是 σ e 2 {\sigma_e^2} σe2的独立同分布的随机变量序列,观测时间序列 Y t : t = 1 , 2 , 3 , . . . {Y_t:t=1,2,3,...} Yt:t=1,2,3,...构造如下:
Y 1 = e 1 Y_1=e_1 Y1=e1
Y 2 = e 1 + e 2 Y_2=e_1+e_2 Y2=e1+e2
. . . ... ...
Y t = e 1 + e 2 + e 3 Y_t=e_1+e_2+e_3 Yt=e1+e2+e3
也可以写成:
Y t = Y t − 1 + e t Y_t=Y_{t-1}+e_t Yt=Yt−1+et
其初始条件为 Y 1 = e 1 Y_1=e_1 Y1=e1, e e e指沿数轴(前向或后向)方向游动的步长大小, Y t Y_t Yt是在时刻 t t t,“漫步者”到达的位置。
对于所有的 t t t:
均值: μ t = 0 \mu_t=0 μt=0
方差: D ( Y t ) = t σ e 2 D(Y_t)=t\sigma_e^2 D(Yt)=tσe2
自协方差: γ t , s = t σ e 2 \gamma_{t,s}=t\sigma_e^2 γt,s=tσe2
自相关系数: ρ t , s = γ t , s γ t , t γ s , s = t s , 1 ≤ t ≤ s \rho_{t,s}=\frac{\gamma_{t,s}}{\sqrt{\gamma_{t,t}\gamma_{s,s}}}=\sqrt{\frac{t}{s}},1\leq t\leq s ρt,s=γt,tγs,sγt,s=st,1≤t≤s
可以看到,随机游动的方差、自协方差均是随时间线性增长的,所以随机游动不是平稳序列。
如果序列 { Y t } \{Y_t\} {Yt}的所有观测值都是独立同分布的,而且他的均值 μ \mu μ和方差 σ 2 \sigma^2 σ2都是有穷的常数,则该序列称为白噪声(white noise)或纯随机过程(purely random process)。
白噪声的三个条件: