数据挖掘——时间序列算法之平稳性检验

数据挖掘——时间序列算法之平稳性检验

    • 平稳时间序列定义
    • 时间序列平稳性检验
    • 针对平稳和不平稳序列,目前的主要算法

平稳时间序列定义

对于随机变量X,可以计算其均值 μ \mu μ、方差 σ 2 \sigma^{2} σ2;对于两个随机变量X和Y。可以计算X,Y的协方差 c o v ( X , Y ) = E [ ( X − μ X ) ( Y − μ Y ) ] cov(X,Y)=E[(X-\mu_{X})(Y-\mu_{Y})] cov(X,Y)=E[(XμX)(YμY)]和相关系数 ρ ( X , Y ) = c o v ( X , Y ) σ X σ Y \rho(X,Y)=\frac{cov(X,Y)}{\sigma_{X}\sigma_{Y}} ρ(X,Y)=σXσYcov(X,Y),他们度量了两个不同时间之间的相互影响程度。

对于时间序列 X t , t ∈ T {X_{t},t\in T} Xt,tT,任意时刻的序列值 X t X_{t} Xt都是一个随机变量,每一个随机变量都会有均值和方差,记 X t X_{t} Xt的均值为 μ t \mu_{t} μt,方差为 σ t \sigma_{t} σt;任取 t , s ∈ T t,s \in T t,sT,定义序列 X t X_{t} Xt的自协方差函数 γ ( t , s ) = E [ ( X t − μ t ) ( X s − μ s ) ] \gamma(t,s)=E[(X_{t}-\mu_{t})(X_{s}-\mu_{s})] γ(t,s)=E[(Xtμt)(Xsμs)]和自相关系数 ρ ( t , s ) = c o n v ( X t , X s ) σ t σ s \rho(t,s)=\frac{conv(X_{t},X_{s})}{\sigma_{t} \sigma_{s}} ρ(t,s)=σtσsconv(Xt,Xs)。之所以称他们为自协方差函数和自相关系数,是因为他们衡量的是同一个事件在两个不同时期(时刻t和s)之间的相关程度,形象的讲就是度量自己过去的行为对自己现在的影响。

由此得到平稳性检验的根本思想:如果时间序列 { X t , T ∈ T } \{X_{t},T \in T\} {Xt,TT}在某一常数附近波动且波动范围有限,即有常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的或者说延迟k期的序列变量之间的影响程度是一样的,则称 { X t , t ∈ T } \{X_{t},t\in T\} {Xt,tT}为平稳序列。

时间序列平稳性检验

数据挖掘——时间序列算法之平稳性检验_第1张图片
但是图检验方法的主观臆断成分大,目前常用的是单位根检验。

针对平稳和不平稳序列,目前的主要算法

数据挖掘——时间序列算法之平稳性检验_第2张图片

你可能感兴趣的:(时间序列预测算法)