时间序列中那些必不可少的预处理

                                                                                     作者丨梅子

                                                              来源丨医数思维云课堂(ID:Datamedi)   

本期的主题是时间序列的预处理~~序列在建模前到底要做哪些预处理呢?首先,大伙都知道的平稳性检验是必须的。

说到平稳,其实有两种平稳——宽平稳、严平稳

严平稳相较于宽平稳来说,条件更多更严格,而我们时常运用时间序列,大多宽平稳就够了~~

什么是严平稳:是在固定时间和位置的概率分布与所有时间和置的概率分布相同的随机过程。这样,数学期望和方差这些参数也随时间和位置变化。(比如白噪声)

什么是宽平稳:宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。

如何判断序列是平稳的?

01 时序图检验

咱们先从图形法上看(通常越是简单的方法,往往越能看到问题哦.....)

有增长趋势,不是平稳变化

变化平稳,但有周期

平稳无周期但序列毫无关联,显示白噪声特点

平稳,无周期,无白噪声

 研究平稳时间序列的意义:

(1)极大地减少了随机变量的个数,并增加了待估变量的样本容量。 

(2)极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度。

02 自相关图检验

平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零

自相关系数递减为零的速度相当缓慢。在很长的延迟时期里,自相关系数一直为正,而后一直为负,并且显示出明显的三角对称性,这是具有单调趋势的非平稳序列的一种典型的自相关图形式。

03 纯随机性检验

拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。下面将介绍的是纯随机性检验

如果序列彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列成为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列

为了确定平稳序列是否值得继续分析下去,我们需要对平稳序列进行纯随机性检验。

R语言中使用Box.test 函数进行纯随机性检验(即白噪声检验)。Box.test 函数的命令格式为:

Box.test( x,type=,lag= )

x:变量名

type:检验统计量类型

type=“Box-Pierce”,输出白噪声检验的 QPB  统计量。该统计量为系统默认输出结果。

type=“Ljung-Box”,输出白噪声检验的 QLB  统计量。

Lag:延迟阶数  。系统默认输出滞后1 阶的检验统计量结果。

white_noise<-rnorm(1000)

white_noise<-ts(white_noise)

plot(white_noise)

acf(white_noise)

Box.test(white_noise,lag = 6)

Box-Pierce test

data:  white_noise

X-squared = 5.7237, df = 6, p-value = 0.4548

我们可以发现,统计量的 P 值大于0.05,则无法拒绝原假设,此序列是白噪声序列,没有研究价值

今天大家和小编一起学习如何使用R语言实现时间序列,期待大家与小编共同进步!!!

怎么样?是不是挺简单的,希望大家多多练习。如果你有关于时间序列分析方面的问题,可以及时联系小编,小编一定不遗余力哟,期待我们的再次相约。

你可能感兴趣的:(时间序列中那些必不可少的预处理)