R 计算时间序列自相关性教程

本文介绍时间序列自相关性,并通过示例介绍R计算过程。

时间序列自相关性

自相关性是时间序列与其自身滞后一定连续时间周期的相关性程度。它也被称为“序列相关”或“滞后相关”,即衡量变量的当前值和历史值之间的关系。

当自相关性较高时,可以简单依赖过去值预测未来值。

R计算自相关性示例

假设我们有下面时间序列数据,表示在15个不同时间周期内数值变化情况:

#define data
x <- c(22, 24, 25, 25, 28, 29, 34, 37, 40, 44, 51, 48, 47, 50, 51)

我们可以使用acf()函数计算每个滞后时间周期的自相关性:

acf(x, pl=FALSE)
# Autocorrelations of series ‘x’, by lag
# 
#      0      1      2      3      4      5      6      7      8      9     10     11 
#  1.000  0.832  0.656  0.491  0.279  0.031 -0.165 -0.304 -0.401 -0.458 -0.450 -0.369 

下面对输出结果解释如下:

  • 滞后0周期自相关性为1
  • 滞后1周期自相关性为0.832
  • 滞后2周期自相关性为0.656
  • 滞后3周期自相关性为0.491

我们也可以使用lag参数设定滞后周期:

#calculate autocorrelations up to lag=5
acf(x, lag=5, pl=FALSE)

# Autocorrelations of series 'x', by lag
# 
#     0     1     2     3     4     5 
# 1.000 0.832 0.656 0.491 0.279 0.031 

** 自相关性图示展示

acf默认情况下即显示自相关性的图示,因此只需去掉pl=FALSE参数:

#plot autocorrelation function
acf(x)

x轴显示滞后周期,y轴显示与滞后周期间的自相关性。缺省图从滞后周期为0开始,所以自相关性总是为1。我们还可以指定图示的标题:

#plot autocorrelation function with custom title
acf(x, main='Autocorrelation by Lag')

R 计算时间序列自相关性教程_第1张图片

你可能感兴趣的:(r语言,数据挖掘,自相关性,时间序列)