论文阅读:2022AAAI-CATN: Cross Attentive Tree-aware Network for Multivariate Time Series Forecasting

开个小专栏

新年了,虎年第一篇推送,想读论文,记录读论文的收获,那么就从2022年AAAI时间序列研究的论文读取

2022年AAAI时间序列研究论文

这次2022年AAAI的时间序列方向的论文有研究预测/分类、时空预测、序列与推荐、知识表达、检测、神经网络、时间损失函数topic

第一次论文阅读读的是“Cross Attentive Tree-aware Network for Multivariate Time Series Forecasting”,是分类和预测(classification and prediction)Topic的

问题

(1)引言部分:inter-series correlation and intra-series temporal pattern是什么?是变量之间还是sample样本之间的【文中一直没有给出相应的解释】
(2)引言部分:long-range dependencies, short- range dependencies as well as cross dependencies at different time steps. 是什么?【和上一个问题一样,文中一直没有给出相应的解释】
(3)引言部分:用了复杂的模型之后效果变好的指标是什么呢➡️预测精度提高?【预测性能评估指标有MSE/RMSE/MAPE/SMAPE/WAPE,实验看了MSE/RMSE/MAPE,先选baseline,再比较其它算法和proposed method相比于baseline的提高】√
(4)相关工作部分:2D卷积捕捉短期特征short-term patterns,循环结构(recurrent structure)捕捉长期特征long-term patterns,有什么样的理论证明?
(5)公式(1)的s/c-L(Z,P)这块儿是什么?是一个符号吗?

(6)Tree Embedding是embedding什么呢?【embedding是把1w编码成wd向量】√
(7)High-order feature是根部节点还是叶子节点,看起来是叶子节点【是叶子节点】

(8)卷积是怎样卷积的?怎样乘起来的?时间序列用LSTM?【时间序列预测分类问题研究首先想到的是LSTM】
(9)correlation map/correlation layer/fusion layer,其中fusion layer是发挥什么作用?为了便于计算,文中有两个set,分别是Contrast Set和Query Set,它们分别对应了一个correlation map,称之为contrast correlation map和query correlation map。√
(10)红圈中是1*w维度可能是对的吧,表示做了w个attention,从公式8和公式9没有看懂,可能和attention有关?【维度变换这块儿没变换对应上】

(11)Table1中的Improvement列是什么意思?【Improvement列中的*表示baseline,百分比表示proposed method比baseline提升了多少,加粗的字体表示最优的结果】√
(12)【本文最大的疑惑】把变量聚类后给第k个层级叶节点编码,k怎么选?

备注:

(1)Hierarchical clustering (HC)➡️文中根据变量和变量的相似性,给变量作聚类
(2)前提假设:We believe that there is a potential hierarchical and grouped correlation between multiple variables 多个变量之间存在隐含的hierarchical和grouped相关性
(3)single linkage是让所有簇的距离为簇间结点最短的距离,同时每一次合并所有簇间距中最短的那一个,而complete则是让簇间结点距离最长的作为簇间距,并且每一次让所有簇间距最短两簇进行合并,因此实际上不是都找最长,而是最长最短。例子:https://blog.csdn.net/M1M1M16/article/details/79415871
基于此,这篇paper采用了一种median linkage,不完全是中位数的意思,它是只用距离小于中位数的pair计算average linkage,hhh
(4)卷积:nc个filter核,宽度是wc,长度是lc,长度的lc和d相等
(5)VAR:Vector Auto-Regression,是一种先进统计方法advanced statistical method,能够捕捉线性关联linear correlation
(6)LSTNet,可以发掘short-term local dependency patterns和long-term pattern
(7)实验中的horizons不是时间窗口,而是采样时间间隔,一个时间滑动窗口slide window是由几个horizon组成的,例如采样时间间隔5minutes,那么一个horizon就是5minute,那么时间窗口slide window={15,30,45,60}的单位是minutes,分别代表3,6,9,12个horizon,示意图如下:

(8)消融实验ablation study
通俗的解释是设立对照组的意思,通过去除某个模块的作用,来证明该模块的必要性,如果消融实验后得到结果不好或者性能大幅下降,说明该模块起到了作用。

英文表述:

最大相似性:minimal dissimilarity
选择baseline:We selected eight methods as baselines, including
w/o:without无的缩写
个人觉得本文英文表达很朴素实用,没有华丽的记叙文样式的动词和短语,依然表达地清晰

欢迎关注、点赞、收藏一键三连

欢迎各位小码农一块儿讨论啊

你可能感兴趣的:(论文阅读,深度学习,lstm,机器学习)