R语言与数据分析之九:时间内序列--HoltWinters指数平滑法

今天继续就指数平滑法中最复杂的一种时间序列:有增长或者降低趋势并且存在季节性波动的时间序列的预测算法即Holt-Winters和大家分享。这种序列可以被分解为水平趋势部分、季节波动部分,因此这两个因素应该在算法中有对应的参数来控制。

Holt-Winters算法中提供了alpha、beta和gamma 来分别对应当前点的水平、趋势部分和季节部分,参数的去执法范围都是0-1之间,并且参数接近0时,近期的观测值的影响权重就越小。我们以澳大利亚昆士兰州海滨纪念商品的月度销售日子为分析对象,老套路,咱先录入数据,并绘制出该时间序列,捞个整体印象:

souvenir <- scan("http://robjhyndman.com/tsdldata/data/fancy.dat")
souvenirtimeseries <- ts(souvenir, frequency=12, start=c(1987,1))
logsouvenirtimeseries <- log(souvenirtimeseries)
plot.ts(logsouvenirtimeseries)

R语言与数据分析之九:时间内序列--HoltWinters指数平滑法_第1张图片

我们采用R中提供的HoltWinters算法进行预测,实现和结果如下:

souvenirtimeseriesforecasts <- HoltWinters(logsouvenirtimeseries)
R语言与数据分析之九:时间内序列--HoltWinters指数平滑法_第2张图片

Alpha=0.4,意味着当期预测基于平衡了最近和较远期的观测值。Beta 为0表明趋势部分的斜率在整个时间序列上市不变的,且等于初始值,这个也符合我们的直观感受,水平改变非常多,但是趋势部分斜率是基本不变的,于此相反gamma=0.96表明当期季节部分预测仅仅基于最近的观测值。

我们同时画出预测值和观测值来看下预测的效果如何:

plot(souvenirtimeseriesforecasts)
R语言与数据分析之九:时间内序列--HoltWinters指数平滑法_第3张图片

可见Holt-Winters算法非常成功的预测了季节峰值,为了预测未来期数的值,我们同样采用forecast函数包,以预测未来48个月销售为例:

library("forecast")
souvenirtimeseriesforecasts2 <- forecast.HoltWinters(souvenirtimeseriesforecasts, h=48)
plot.forecast(souvenirtimeseriesforecasts2)
R语言与数据分析之九:时间内序列--HoltWinters指数平滑法_第4张图片

图中蓝色线条显示的为预测值,深灰色部分为80%的置信区间,浅灰色为95的置信区间。

接下来老套路采用Ljung-Box 和画出直方图来检查预测误差的随机性,就不重复贴代码了,有忘记的童鞋请转前两篇,我这里就直接贴结果图了:

R语言与数据分析之九:时间内序列--HoltWinters指数平滑法_第5张图片

R语言与数据分析之九:时间内序列--HoltWinters指数平滑法_第6张图片

三张图的结果表示咱们R提供的Holt-Winters()算法还是特别牛掰的,关于指数平滑就到此就彻底结束啦。



你可能感兴趣的:(R语言,机器学习)