时间序列分析的关键问题

特征提取

利用深度神经网络或者传统特征工程的方法,例如卷积、多尺度卷积或者PCA降维法。
首先,时间序列的特征工程也大多是基于这三个数据衍生出来的:

  1. 时序值衍生的特征
    因为时间序列是通过历史来预测未来,那么,这个时序值的历史数据,也就是当前时间点之前的信息就非常有用,通过他可以发现时间序列的趋势因素、季节性周期性因素以及一些不规则的变动,具体来说这部分特征可以分为三种:滞后值、滑动窗口统计和拓展窗口统计。滞后值也称lag feature,比如对于t时刻的数据,我们认为他是跟昨天的数据、上周同一天的数据、上个月同一天的数据、去年同期的数据是高度相关的。另一种特征叫做扩展窗口统计(Expanding Window Statistics),其实也算是一种特殊的滑动窗口统计,不过他用来统计的数据是整个序列全部的数据,统计值可以是平均数、中位数、标准差、最大值、最小值等,这种特征一般是用在多序列建模,比如不同的股票价格,可能会有着不同的内在属性,在预测的时候用这个特征作为区分也是一种方式。

  2. 序列属性衍生的特征。这种方式又包含连续变量衍生和类别变量Encoding。一个序列可能会伴有多个连续变量的特征,比如说对于股票数据,除了收盘价,可能还会有成交量、开盘价等伴随的特征,对于销量数据,可能还会伴随有价格的特征。对于这种连续变量,可以直接作为一个特征,也可以像之前时序值衍生的特征那样做处理,或者也可以与先前的数据做差值,比如t时刻的价格减去t-1时刻的价格。

其次,深度神经网络在时间序列的应用非常广泛:

  1. 可以采用变压器编码器架构的时间序列表示学习的框架,利用预训练方案,它可以在下游任务上提供比完全监督学习更大的性能优势,既可以利用但甚至不利用额外的未标记数据,即通过重用现有的数据样本。
  2. 多维度卷积核以及动态化。
  3. 因果分析和关联规则。
    能够找到可以与任务(分类,预测)密切相关的特征(表征信息)。

任务导向

1.异常检测 找到异常检测相关的表征。
2.多变量问题:挖掘变量关系,dtw。

你可能感兴趣的:(深度学习,机器学习,神经网络)