MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks

当今的信息物理融合系统(cps)是大型且复杂的数据密集型系统。为了准确、及时地检测可能发生的入侵或故障,需要对大量相互连接的传感器和执行器产生的数据进行持续监测和分析。近年来,基于深度学习的多变量时间序列无监督异常检测技术被提出,用于检测CPSs攻击。然而,目前的方法要么受限于其表示学习方法,无法同时有效地编码时间和空间信息,要么无法在没有明确了解不同变量或传感器之间的内部关系的情况下容易扩展到其他任务,而这些变量或传感器对表征CPSs数据至关重要本文提出一种新的无监督多元时间序列异常检测方法MAD-SGCN,利用长短期记忆网络(LSTMs)和基于谱的图卷积网络(GCNs)有效地同时捕获输入序列的时间和空间相关性。设计了一种自监督图结构学习机制,以最小化对CPSs网络结构先验知识的使用。在4个CPS数据集上的实验验证了所提方法的优越性。

阅读者总结:这篇论文是图卷积神经网络在多元时间序列上的应用,应该说这方面的论文不是很多。这篇论文主要将分布在不同位置上的传感器当做图中的节点,文中考虑了多元时间序列变量之间的空间与时间相关性。主要利用GCN和GAT,应该说模型的构造上并不是很新颖,并且在解释各个模型之间关系和数学化过程中,显得有简略了。除此之外,在模型设计原因方面也说的不清楚。从实验部分看,模型效果与KDD2020年上的GCN模型相比,要好很多,但是KDD2020上图卷积考虑了如何学习图结构,已经时间序列之间的时间动态性。明显这篇论文相比这方面要简略很多,其实是假设了图结构的固定性,明显是存在缺陷的

问题:

然而,这种方法对于没有显式图结构的数据集是不可行的。mtat -GAT[18]利用两个图注意力(Graph Attention, GAT)层并行编码时间和空间依赖关系,将多元时间序列中的所有时间戳和所有变量视为两个节点之间相互连接的完全图。然而,静态完全图中可能存在不必要的噪声边缘,从而限制了异常检测的性能。

方法:

本文提出一种新的基于变分自编码器(VAE)序列重构的无监督异常检测方法MAD-SGCN。采用GCNs和LSTMs作为VAE的编码器和解码器的主要组件,以捕获序列中的时空信息。此外,本文建议应用具有稀疏性和不确定性约束的自监督学习,以准确和自动地学习序列中不同变量之间的关系,即图的结构。利用两个变量之间具有相同关系的不同gcn分别对正常序列和随机置换序列进行编码,迫使图结构通过判别器的监督来学习,判别器的目的是区分从这两种来源生成的特征。该框架中应用了注意力机制来衡量序列中不同变量的重要性。最后,考虑到该方法中存在多个子任务,采用[19]中的动态加权机制,并对熵值进行了具体的自适应调整 来查找损失的最佳自适应超参数配置。

MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第1张图片

 框架:MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第2张图片

 过程:

MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第3张图片

 

 MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第4张图片

MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第5张图片 MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第6张图片

 实验部分:

MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第7张图片

MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第8张图片 

 

 MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第9张图片

 

从图中可以看出,忽略了时间和空间相关性的模型通常比其他模型表现更差。值得注意的是,DAGMM虽然利用了深度神经网络强大的特征提取能力,但其性能并不理想。这是因为它与其他传统方法一样,旨在对单数据点进行建模。当相邻数据点之间不存在时间依赖关系且不同变量之间的相关性为线性时,其性能可能较好,但当处理高度复杂的多元时间序列数据时,其性能不佳,这证实了对此类数据内部的时间和空间信息进行建模的必要性。

MAD-SGCN: Multivariate Anomaly Detection with Self-learning Graph Convolutional Networks_第10张图片 

 

你可能感兴趣的:(时空数据预测(基于图神经网络),深度学习,人工智能)