时间序列突变点检测

我对时间序列异常点算法小结:

基于时间序列的异常检测算法小结_Jasminexjf的博客-CSDN博客_基于时间序列的异常检测算法

当前异常检测类型:

最重要的异常类型,例如意外的峰值、下降、趋势变化和水平转移

我主要研究的是负荷预测的突变点,所以异常针对的是:

STL分解: 你所能做的就是利用显著性水平来调整你的置信区间

分类与回归树: xgboost  缺点是越来越多的特征会很快影响您的计算性能。

在我的数据集中,异常点并没有被标记,让 CART 算法自动寻找数据集中的模式,预测异常点的置信区间,可以引入许多特征参数来执行学习并获得复杂的模型,但是应该对特征进行选择,特征太多,会影响性能

ARIMA

突变点检测:时间序列趋势检验以及突变点检测任务简说

突变点检测:时间序列趋势检验以及突变点检测任务简说_Watch_dou的博客-CSDN博客_时间序列突变点检测​​​​​​​​​​​​​

 其中BG切割算法,可以参考这篇:《多维时间序列突变点检测方法研究》

对洪峰突变点检测,对七日最大洪量检测,对洪峰洪量进行BG预测,还可对其进行皮尔逊相关系数分析,滑动T检验法对竹山站年平均径流序列进行检验---结果差不多

针对我要研究的负荷预测---肯定会有天气,节假日,周末,季初季末,月初月末因素等影响,因此也是多维时间序列。

MK检验:优点:数据不需要遵循什么分布,不受少数异常值的干扰,计算简便。

                缺点:不适用于检测多个突变点的序列

pettitt方法:非参数检验,直接利用秩序列做突变点

滑动T检验:通过考察两组样本平均值的差异是否显著来检验突变

指间平滑法:缺点:如果您需要跟踪几个季节周期,例如同时具有周和年依赖项,则应该只选择一个。通常,它是最短的

神经网络:???

k-sigma的同比算法:即当前数据点的状态由之前不同周期的相同位置数据(比如上周或者前一天的同一时刻)决定,通过历史同期的数据分布来确定当前数据的合理波动范围

                       缺点:很多数据是不符合这种正态分布的假设的数据绝不是平稳的、每个周期完全一样的, 很难用单一的统计方式来解决

Prophet:适用于形态较稳定,有周期特性的数据,同时考虑了节假日的特性。由于Prophet采用傅里叶级数来处理周期性因子,导致一般夜间(波动较小)的数据情况较难预测准确;它更关注整体的波动状态,对一些局部信息的捕捉较差。

你可能感兴趣的:(机器学习,算法,深度学习)