时间序列分析1.基本数学概念


本文主要介绍时间序列分析中会用到的一些数学知识。


1.均值、方差、协方差、相关系数

1.1 期望

1.1.1 期望的定义

X X X具有概率密度函数 f ( x ) f(x) f(x),并且令 ( X , Y ) (X,Y) (X,Y)对具有联合概率密度函数 f ( x , y ) f(x,y) f(x,y)
定义 X X X的期望值为: E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)={\int\limits_{-\infty}^\infty}xf(x)dx E(X)=xf(x)dx

1.1.2 期望的性质

  1. E ( a X + b Y + c ) = a E ( X ) + b E ( Y ) + c E(aX+bY+c) = aE(X)+bE(Y)+c E(aX+bY+c)=aE(X)+bE(Y)+c
  2. X X X Y Y Y相互独立时, E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)

1.2 方差

1.2.1 方差的定义

随机变量 X X X的方差定义为: D ( X ) = E { [ X − E ( X ) ] 2 } D(X)=E\{[X-E(X)]^2\} D(X)=E{[XE(X)]2},方差通常还记为 V a r ( X ) Var(X) Var(X) μ 2 \mu^2 μ2
X X X是离散型随机变量,则 D ( X ) = ∑ k = 1 ∞ [ x k − E ( x ) ] 2 p k D(X)=\sum_{k=1}^{\infty}[x_k-E(x)]^2p_k D(X)=k=1[xkE(x)]2pk.
X X X是连续型随机变量,则 D ( X ) = ∫ − ∞ ∞ [ x − E ( x ) ] 2 f ( x ) d x D(X)=\int_{-\infty}^{\infty}[x-E(x)]^2f(x)dx D(X)=[xE(x)]2f(x)dx

D ( X ) = E { [ X − E ( X ) ] 2 D(X)=E\{[X-E(X)]^2 D(X)=E{[XE(X)]2
= E { X 2 − 2 X E ( X ) + [ E ( X ) ] 2 } =E\{X^2-2XE(X)+[E(X)]^2\} =E{X22XE(X)+[E(X)]2}
= E ( X 2 ) − 2 E ( X ) E ( X ) + [ E ( x ) ] 2 =E(X^2)-2E(X)E(X)+[E(x)]^2 =E(X2)2E(X)E(X)+[E(x)]2
= E ( X 2 ) − [ E ( X ) ] 2 =E(X^2)-[E(X)]^2 =E(X2)[E(X)]2

1.2.2 方差的性质

  1. D ( a X + b ) = a 2 D ( X ) D(aX+b)=a^2D(X) D(aX+b)=a2D(X)
  2. X X X Y Y Y相互独立,则 D ( X ± Y ) = D ( X ) + D ( Y ) D(X\pm Y) = D(X)+D(Y) D(X±Y)=D(X)+D(Y)
  3. X X X Y Y Y不独立,则 D ( X ± Y ) = D ( X ) + D ( Y ) ± 2 C o v ( X , Y ) D(X\pm Y)=D(X)+D(Y)\pm2Cov(X,Y) D(X±Y)=D(X)+D(Y)±2Cov(X,Y)

1.3 协方差

1.3.1 协方差的定义

C o v ( X , Y ) = E { ( X − E ( X ) ) ( Y − E ( Y ) ) } = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E\{(X-E(X))(Y-E(Y))\}=E(XY)-E(X)E(Y) Cov(X,Y)=E{(XE(X))(YE(Y))}=E(XY)E(X)E(Y)

1.3.2 协方差的性质

  1. C o v ( a + b X , c + d Y ) = b d C o v ( X , Y ) Cov(a+bX,c+dY)=bdCov(X,Y) Cov(a+bX,c+dY)=bdCov(X,Y)
  2. C o v ( X + Y , Z ) = C o v ( X , Z ) + C o v ( Y , Z ) Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z) Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)
  3. C o v ( X , X ) = D ( X ) Cov(X,X)=D(X) Cov(X,X)=D(X)
  4. C o v ( X , Y ) = C o v ( Y , X ) Cov(X,Y)=Cov(Y,X) Cov(X,Y)=Cov(Y,X)
  5. X X X Y Y Y相互独立,那么 C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0

1.4 相关系数

1.4.1 相关系数的定义

X X X Y Y Y的相关系数用 C o r r ( X , Y ) Corr(X,Y) Corr(X,Y)或者 ρ \rho ρ表示,定义如下:
ρ = C o r r ( X , Y ) = C o v ( X , Y ) V a r ( X ) V a r ( Y ) ) \rho=Corr(X,Y)=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y))}} ρ=Corr(X,Y)=Var(X)Var(Y)) Cov(X,Y)

1.4.2 相关系数的性质

  1. − 1 ≤ C o r r ( X , Y ) ≤ 1 -1\leq Corr(X,Y)\leq 1 1Corr(X,Y)1
  2. C o r r ( X , Y ) = ± 1 Corr(X,Y)=\pm 1 Corr(X,Y)=±1的充要条件是,存在常数 a a a b b b,使得 P r ( Y = a X + b ) = 1 Pr(Y=aX+b)=1 Pr(Y=aX+b)=1.
  3. 相关系数如果为正号,则表示正相关,如果为负号,则表示负相关。通俗点说,正相关就是变量会与参照数同方向变动,负相关就是变量与参照数反向变动;
  4. 取值为0,这是极端,表示不相关。取值接近 ± 1 \pm 1 ±1时说明线性相关程度强。

1.5 时间序列与随机过程

对于随机变量序列 { Y t : t = 0 , 1 , 2 , 3 , . . . } \{Y_t: t=0,1,2,3,...\} {Yt:t=0,1,2,3,...}称为一个随机过程,并以之作为观测时间序列的模型。

1.5.1 自协方差函数

γ t , s = C o v ( Y t , Y s ) , t , s = 0 , 1 , 2 , 3 , . . . \gamma_{t,s}=Cov(Y_t,Y_s),t,s=0,1,2,3,... γt,s=Cov(Yt,Ys),t,s=0,1,2,3,...
其中 C o v ( Y t , Y s ) = E [ ( Y t − μ t ) ( Y s − μ s ) ] Cov(Y_t,Y_s)=E[(Y_t-\mu_t)(Y_s-\mu_s)] Cov(Yt,Ys)=E[(Ytμt)(Ysμs)]

1.5.2 自相关函数

ρ t , s = C o v ( Y t , Y s ) , t , s = 0 , 1 , 2 , 3 , . . . {{\rho}_{t,s}}={Cov(Y_t,Y_s)},t,s=0,1,2,3,... ρt,s=Cov(Yt,Ys),t,s=0,1,2,3,...
其中:
C o r r ( Y t , Y s ) = C o v ( Y t , Y s ) V a r ( Y t ) V a r ( Y s ) = γ t , s γ t , t γ s , s {Corr(Y_t,Y_s)} =\frac{Cov(Y_t,Y_s)}{\sqrt{Var(Y_t)Var(Y_s)}} =\frac{\gamma _{t,s}}{\sqrt{\gamma _{t,t}\gamma _{s,s}}} Corr(Yt,Ys)=Var(Yt)Var(Ys) Cov(Yt,Ys)=γt,tγs,s γt,s

1.5.3 重要结论

在研究不同时间序列的模型协方差的性质时,反复用到如下结论:如果 c 1 , c 2 , c 3 , . . . c m c_1,c_2,c_3,...c_m c1,c2,c3,...cm d 1 , d 2 , d 3 , . . . d n d_1,d_2,d_3,...d_n d1,d2,d3,...dn表示常数, t 1 , t 2 , t 3 , . . . t m t_1,t_2,t_3,...t_m t1,t2,t3,...tm s 1 , s 2 , s 3 , . . . s n s_1,s_2,s_3,...s_n s1,s2,s3,...sn表示时间点,则有:
C o v [ ∑ i = 1 m c i Y t i , ∑ j = 1 n d i Y s j ] = ∑ i = 1 m ∑ j = 1 n c i d j C o v ( Y t i , Y s j ) {Cov[\sum_{i=1}^{m}{c_iY_{t_i}},\sum_{j=1}^{n}{d_iY_{s_j}}]} =\sum_{i=1}^{m}\sum_{j=1}^{n}c_id_jCov(Y_{t_i},Y_{s_j}) Cov[i=1mciYti,j=1ndiYsj]=i=1mj=1ncidjCov(Yti,Ysj)

2.平稳性

平稳性的基本思想是,决定过程特性的统计规律不随着时间的变化而变化。

2.1 严平稳

如果对于一切时间间隔 k k k和时间点 t 1 , t 2 , t 3 , . . . , t n t_1,t_2,t_3,...,t_n t1,t2,t3,...,tn,都有 Y t 1 , Y t 2 , . . . , Y t n Y_{t_1},Y_{t_2},...,Y_{t_n} Yt1,Yt2,...,Ytn Y t 1 − k , Y t 2 − k , . . . , Y t n − k Y_{t_1-k},Y_{t_2-k},...,Y_{t_n-k} Yt1k,Yt2k,...,Ytnk的联合分布相同,则称过程 { Y t } \{Y_t\} {Yt}为严平稳。

2.2 弱平稳

2.2.1 弱平稳时间序列的条件

1. E ( Y t ) = μ E(Y_t)=\mu E(Yt)=μ,序列的均值应该是一个常数,而不是随时间变化的函数。下图中左图满足要求,而右图的均值是随时间而变化的。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iZpgSgvs-1571583421313)(http://www.analyticsvidhya.com/wp-content/uploads/2015/02/Mean_nonstationary.png)]

2. V a r ( Y t ) = γ Var(Y_t)=\gamma Var(Yt)=γ,序列的方差为一个常数,而不随时间的变化。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jihJVijQ-1571583421314)(http://www.analyticsvidhya.com/wp-content/uploads/2015/02/Var_nonstationary.png)]

3. C o v ( Y t , Y t + k ) = γ 0 , k Cov(Y_t,Y_{t+k})=\gamma_{0,k} Cov(Yt,Yt+k)=γ0,k,序列协方差的值只与时间间隔 k k k有关,与时间 t t t无关。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I3ysuAE1-1571583421315)(http://www.analyticsvidhya.com/wp-content/uploads/2015/02/Cov_nonstationary.png)]
以上的三个条件必须全部满足,才能被称为弱平稳的时间序列。我们建立时间序列模型时必须要求时间序列是平稳的,这是因为我们用时间序列做预测时,我们的随机变量的基本特性必须能在包括未来阶段的一个长时期里维持不变,否则,基于历史和现状来预测未来的思路便是错误的。所以在时间序列建模时第一步就是要将不平稳的序列平稳化,可以采用差分等方法。

2.2.2 弱平稳时间序列的自相关系数

弱平稳序列的自相关系数:
ρ k = C o v ( x t , x t , k ) V a r ( x t ) V a r ( x t − k ) = C o v ( x t , x t − k ) V a r ( x t ) = γ k γ 0 \rho_k = \frac{Cov(x_t,x_{t,k})}{\sqrt{Var(x_t)Var(x_{t-k})}} =\frac{Cov(x_t,x_{t-k})}{Var(x_t)} =\frac{\gamma_k}{\gamma_0} ρk=Var(xt)Var(xtk) Cov(xt,xt,k)=Var(xt)Cov(xt,xtk)=γ0γk

2.3 随机游动

e 1 , e 2 , e 3 , . . . e_1,e_2,e_3,... e1,e2,e3,...为均值为 0 0 0,方差是 σ e 2 {\sigma_e^2} σe2的独立同分布的随机变量序列,观测时间序列 Y t : t = 1 , 2 , 3 , . . . {Y_t:t=1,2,3,...} Yt:t=1,2,3,...构造如下:
Y 1 = e 1 Y_1=e_1 Y1=e1
Y 2 = e 1 + e 2 Y_2=e_1+e_2 Y2=e1+e2
. . . ... ...
Y t = e 1 + e 2 + e 3 Y_t=e_1+e_2+e_3 Yt=e1+e2+e3
也可以写成:
Y t = Y t − 1 + e t Y_t=Y_{t-1}+e_t Yt=Yt1+et
其初始条件为 Y 1 = e 1 Y_1=e_1 Y1=e1 e e e指沿数轴(前向或后向)方向游动的步长大小, Y t Y_t Yt是在时刻 t t t,“漫步者”到达的位置。
对于所有的 t t t:
均值: μ t = 0 \mu_t=0 μt=0
方差: D ( Y t ) = t σ e 2 D(Y_t)=t\sigma_e^2 D(Yt)=tσe2
自协方差: γ t , s = t σ e 2 \gamma_{t,s}=t\sigma_e^2 γt,s=tσe2
自相关系数: ρ t , s = γ t , s γ t , t γ s , s = t s , 1 ≤ t ≤ s \rho_{t,s}=\frac{\gamma_{t,s}}{\sqrt{\gamma_{t,t}\gamma_{s,s}}}=\sqrt{\frac{t}{s}},1\leq t\leq s ρt,s=γt,tγs,s γt,s=st ,1ts

可以看到,随机游动的方差、自协方差均是随时间线性增长的,所以随机游动不是平稳序列。

2.4 白噪声

如果序列 { Y t } \{Y_t\} {Yt}的所有观测值都是独立同分布的,而且他的均值 μ \mu μ和方差 σ 2 \sigma^2 σ2都是有穷的常数,则该序列称为白噪声(white noise)或纯随机过程(purely random process)。
白噪声的三个条件:

  1. 有限均值
  2. 有限方差
  3. 独立同分布
    如果白噪声的分布是均值为0的正态分布,则 { Y t } \{Y_t\} {Yt}也称为高斯白噪声。
    P r ( e t 1 ≤ x 1 , e t 2 ≤ x 2 , . . . , e t n ≤ x n ) Pr(e_{t_1}\leq x_1,e_{t_2}\leq x_2,...,e_{t_n}\leq x_n) Pr(et1x1,et2x2,...,etnxn)
    = P r ( e t 1 ≤ x 1 ) P r ( e t 2 ≤ x 2 ) . . . P r ( e t n ≤ x n ) ( 根 据 独 立 性 ) =Pr(e_{t_1}\leq x_1)Pr(e_{t_2}\leq x_2)...Pr(e_{t_n}\leq x_n)(根据独立性) =Pr(et1x1)Pr(et2x2)...Pr(etnxn)()
    = P r ( e t 1 − k ≤ x 1 ) P r ( e t 2 − k ≤ x 2 ) . . . P r ( e t n − k ≤ x n ) ( 同 分 布 ) =Pr(e_{t_1-k}\leq x_1)Pr(e_{t_2-k}\leq x_2)...Pr(e_{t_n-k}\leq x_n)(同分布) =Pr(et1kx1)Pr(et2kx2)...Pr(etnkxn)()
    = P r ( e t 1 − k ≤ x 1 , e t 2 − k ≤ x 2 , . . . , e t n − k ≤ x n ) ( 根 据 独 立 性 ) =Pr(e_{t_1-k}\leq x_1,e_{t_2-k}\leq x_2,...,e_{t_n-k}\leq x_n) (根据独立性) =Pr(et1kx1,et2kx2,...,etnkxn)()
    根据定义要求,显然白噪声是严平稳的。

参考资料

你可能感兴趣的:(机器学习,时间序列)