微信公众号“圆圆的算法笔记”,持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~
后台回复“交流”加入“圆圆的算法笔记”交流群;回复“时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“、”表示学习“、”元学习“等获取各个领域干货算法笔记~
论文标题:Retrieval Based Time Series Forecasting
下载地址:https://arxiv.org/pdf/2209.13525.pdf
今天为大家介绍一篇CIKM 2022中比较有意思的时间序列预测论文。这篇论文的独特之处在于,在其他论文都在卷深度学习时序预测模型结构时,这篇文章从检索引入相关数据的角度解决时序预测问题。
如果我们把时间序列预测看成一个数据补全问题,那么预测窗口长度占序列总长度的比例就决定了预测结果的不确定性有多大。因为缺失数据占比越多,对序列的补全就越发困难。这种情况下,单纯的优化模型结构也无济于事。因此,本文的核心思路为,当数据缺失比例较高时,能不能从其他时间序列中检索出一些相关的,作为一种信息补充手段,侧面缓解数据缺失度高的问题,降低预测的不确定性。
文中使用了单独一章的篇幅,从理论的角度分析引入检索序列作为信息补充,能够带来的预测效果增益。整体的论证包括3个步骤(X表示输入的有缺失值序列,\hat{X}表示模型预测的序列,\tilde{X}表示真实的无缺失值对的序列,Y表示检索的额外序列):
综合上面3个步骤的论证,引入检索的序列对于最终预测结果的不确定性是有缓解作用的。
在具体的实现上,主要包括两个方面,一方面是针对当前样本如何检索出相关序列,另一方面是如何将这些检索到的序列引入到模型中。
在检索数据上有两种方法,一种是基于内容检索,另一种是基于关系检索。基于内容检索需要对比当前时间序列和数据库中其他时间序列之间的序列相似度,然而由于本文的场景是给定的历史序列比较短,因此这种基于内容检索的方法会带来比较大的不确定性。本文采用了另一种方法,基于关系进行检索。构造一个时间序列的关系图,在图上进行随机游走计算序列之间的关系分,将分数最高,也就是逻辑关系最密切的topK个序列检索出来作为模型输入。
在模型结构上,原始的时间序列和检索得到的多个时间序列,经过两个独立的全连接层,生成各个序列的向量化表示。接下来,使用content attention计算原始序列和各个检索序列之间的关系,并使用temporal attention计算序列内部不同时间步的关系。这里就和Spatial-Temporal的模型结构很像了。最终通过一层全连接输出层,将预测结果映射到期望的输出维度。
其实从这个方法的整体来看,与图时间序列预测非常像。主要的区别在于,本文并不是针对图时间序列预测这个场景,文中原始序列也不在database中。而Spatial-Temporal中所有序列都在database中。文中最后也提出了本文和Spatial-Temporal的关系,第一个步骤就是在筛选重要的邻居节点,第二个步骤是图上的信息汇聚。
下面几张图是基于检索的时序预测相比一些主流深度学习模型的效果,对比模型包括Informer、Nbeats等:
文中也进行了一些消融实验,对比模型不同配置的效果差异:
本文从检索的角度解决时间序列预测问题,通过在数据库中检索和当前时间序列相关的其他序列,为当前样本的预测提供更丰富的信息,减小当历史已知时间窗口较短时模型预测的不确定行。
微信公众号“ 圆圆的算法笔记”,持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~ 后台回复“ 交流”加入“ 圆圆的算法笔记”交流群;回复“ 时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“、”表示学习“、”元学习“等获取各个领域干货算法笔记~ 后台留言”交流“,加入圆圆算法交流群~ 后台留言”论文“,获取各个方向顶会论文汇总~
【历史干货算法笔记】
12篇顶会论文,深度学习时间序列预测经典方案汇总
如何搭建适合时间序列预测的Transformer模型?
Spatial-Temporal时间序列预测建模方法汇总
最新NLP Prompt代表工作梳理!ACL 2022 Prompt方向论文解析
图表示学习经典工作梳理——基础篇
一网打尽:14种预训练语言模型大汇总
Vision-Language多模态建模方法脉络梳理
花式Finetune方法大汇总
从ViT到Swin,10篇顶会论文看Transformer在CV领域的发展历程