时间序列概述

什么是时间序列

时间序列是按照时间先后顺序出现的有序数列
比如:

  • 某工厂每日的产品出货量
  • 某奶茶店日销售数量
  • 某股票每日的价格走势数据
  • 某APP的日访问次数

从上面的例子中可以看出,时间序列在制造业,零售业,金融业和互联网行业中都有着非常多的应用场景。

时间序列预测

预测有两种,一种是点预测,另一种是区间预测
时间序列概述_第1张图片
首先时间序列都要可预测,其次要进一步可定量预测。我们这里讲的时间序列预测都指的可定量预测。

时间序列可预测的前提:

  • 了解影响时间序列观测值的影响因素
  • 有可利用的历史数据
  • 预测不会影响试图预测的结果

时间序列可定量预测的前提:

  • 过去的一些模式会在未来延续下去

时间序列的专有名词

观察值:时间序列需要预测的值
外部变量:影响观察值的其他变量
误差:无法被解释的量
趋势:当一个时间序列数据长期增长或者长期下降时,表示该序列有趋势。在某些场合,其实代表着“转换方向”。例如从增长的趋势转换为下降趋势。
季节性:当时间序列中的数据受到季节性因素(例如一年时间或者一周的时间)的影响时,表示该序列具有季节性。季节性总是一个已知并且固定的频率
周期性:当时间序列数据存在不固定频率的上升和下降时,表示该序列具有周期性。这些波动经常由经济活动引起,并且与商业周期有关。许多初学者都不能很好的区分季节性和周期性,然而这两个概念是完全不同的。

  • 当数据的波动是无规律时,标识序列存在周期性
  • 如果波动的频率不变且与固定的长度的时间段有关,标识序列存在季节性

一般而言。周期的的长度比较长,并且周期的波动幅度也更大。比如经常会提到经济发展具有一定的周期性,这种波动的频率一般时无规律的。

无多时间序列同时包含趋势、季节性以及周期性。当我们选择预测方法时,首先应该分析时间序列数据所具备的特征,然后选择合适的预测方法抓取特征。

时间序列的评估

时间序列不能做交叉验证,得使用back test,在量化中又称为回测
时间序列有很多常用的评估指标。如果将时间序列问题看作简单的回归问题。所有回归类的评估指标都可以用作时间序列的评估。

比如MSE、MAE、RMSE、R²等等。但是时间序列不仅仅时简单的回归问题,它具有时序的概念,于是我们可以衍生出更多的时间序列的评估指标。比如,在时间序列中R²有额外的含义:
在这里插入图片描述
R²在时序预测的特别含义为:
我们所采用的时序预测效果相对于朴素预测(这里指的时平均朴素法)效果的提升度。

按照这种思路我们自己也可以衍生出一系列的评价指标。比如我们将朴素预测改为:“将上一刻时刻的值,作为一下时刻的预测值”。然后对比预测效果和朴素预测的预测效果可以得到新的评估函数。平均绝对值标注误差简称MASE。
在这里插入图片描述
如果MASE=0.5,意味着模型预测的误差时朴素预测误差的一半,如果MASE=1,就说明我们所采用的预测方法相对于朴素预测并没有提升。

同样,我们可以将MASE的公式中绝对值用平方来代替,从而得到,平均平方标注误差简称MSSE
在这里插入图片描述

时间序列与机器学习

时间序列时如何产生的? 从概率的角度上看,时间序列时随机过程在时间方向上的一次采样。这个采样只能随着时间往后,而无法在空间上重复(因为时间一去不复返)

时间序列的建模就是期望通过这样的采样数据来学习模型,然后对后面的时间进行预测。

**机器学习是如何学习的?从概率的角度上看,有监督的学习的训练样本就是P(y|x)**在空间方向上的采样。这个采样可以不断重复,没有时间先后的概念。

机器学习的建模就是期望通过这样的采样数据来学习模型,然后对其他的样本进行预测

对于ARIMA这样的传统时间序列模型,他们和机器学习的建模有很大的相似性。

  • 机器学习中建模一般需要假设样本独立同分布,依托大数定律拟合参数
  • 时间序列中建模一般需要假设样本平稳遍历性,依托遍历定理拟合参数

一个在空间上通过对样本的采样和计算得到随机变量的相关性质。
一个在时间上通过对样本的采样和计算得到随机变量(过程)的相关性质

你可能感兴趣的:(时间序列,人工智能,算法,大数据)