周期性时间序列的预测

女主宣言

AIOps 从立项到现在已经半年有余,从最开始的 LVS 异常检测,到如今的实时关联分析,智能运维已经渗透到我们日常运维中的许多场景,之后我们会将积累的经验分享出来,供大家学习参考,本文最先发布于 OpsDev,转载已获取作者授权。

PS:丰富的一线技术、多元化的表现形式,尽在“HULK一线技术杂谈”,点关注哦!

周期性时间序列的预测_第1张图片

At Tranquility Base, 1969

by NASA IOTD

最近在研究时间序列的时候,发现很多序列具有很强的周期性,那如何对此类序列进行预测呢?


1

数据处理

挑选一个如下图的具有周期性的时间序列。该序列是取得是过去7天的数据,每小时一个点,一共7*24个点。

周期性时间序列的预测_第2张图片  

2

划分数据集

我们取前六天的数据做训练,第七天做测试集。


3

平滑处理

时间序列经常会出现毛刺的点,需要做平滑处理才能分析,类似上图中的数据。消除数据的毛刺,可以用移动平均法,但是移动平均有时候处理完后并不能使数据平滑,我这里采用的方法很简单,但效果还不错:把每个点与上一点的变化值作为一个新的序列,对这里边的异常值,也就是变化比较离谱的值剃掉,用前后数据的均值填充:

周期性时间序列的预测_第3张图片

经过处理以后,上图的时间序列得到了平滑处理,效果如下图。

周期性时间序列的预测_第4张图片  

4

周期性分解

具有周期性特征的序列需要将周期性特征提取出来。python里面的statsmodels工具包里面有针对周期性分解的函数seasonal_decompose,我们可以将序列进行分解。seasonal_decompose这个函数里面有个two_sided的参数,默认是True。Trend处理的时候用到移动平均的方法,熟悉此方法的读者就会发现,经过该方法处理以后,序列收尾两段有一部分数据缺失了,但是如果该参数为FALSE,则只有开始的时候有一段缺失值。

周期性时间序列的预测_第5张图片
周期性时间序列的预测_第6张图片

图3中的第一张图是observed,体现的原始数据;第二张是trend,体现的是分解出来的趋势部分;第三张是seasonal,体现的是周期部分;最后是residual,体现的是残差部分。


本文采用的是seasonal_decompose的加法模型进行的分解,即 observed = trend + seasonal + residual,另还有乘法模型。在建模的时候,只针对trend部分学习和预测,如何将trend的预测结果加工成合理的最终结果?后面会有介绍。


5

预测

我们对trend部分进行预测,最后再加上seasonal部分。对trend的预测,我们采用ARIMA模型。熟悉该模型的都知道,需要确定三个参数p,q和d,可以使用aic和bic的方法进行定阶,可以查阅相关的文献。

周期性时间序列的预测_第7张图片


得到模型以后,就可以进行预测。

周期性时间序列的预测_第8张图片


下面是预测的结果,从图中可以看到预测的结果将周期性的特征完美地体现出来了。

周期性时间序列的预测_第9张图片
 

6

评估

对第七天作出预测,评估的指标为均方根误差rmse,本序列的rmse小于5,效果还是不错的。


7

总结

本文介绍了周期性序列的预测方法,你可能会问并不是所有的序列都具有周期性,事实确实如此,接下来几篇博客,我会重点介绍周期性检测的一些方法。希望此博客对您研究时间序列有所帮助。

HULK一线技术杂谈

由360云平台团队打造的技术分享公众号,内容涉及云计算数据库大数据监控泛前端自动化测试等众多技术领域,通过夯实的技术积累和丰富的一线实战经验,为你带来最有料的技术分享

640?wx_fmt=gif

你可能感兴趣的:(周期性时间序列的预测)