(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks

内含动画的PPT已经上传,可以在我上传的资源里看到,可免费下载

论文链接:https://arxiv.org/pdf/1901.04997.pdf
论文代码:https://github.com/LiDan456/MAD-GANs
本文一个大的贡献是开源了两个数据集
1、The Secure Water Treatment (SWaT)
2、The Water Distribution (WADI)

本篇论文“MAD-GAN:利用GAN对时间序列数据进行多元异常检测”,发表于2019ICANN上,文章主要围绕”异常检测+多元时间序列+网络入侵+GAN“展开,以下是我这几天阅读该篇文章的收获,其中,模型及结构我自己做了一个动画版,动画版我用了很久的时间去理顺作者的思想做出来的,能够更直观明确地表现出该模型的流程,但是我还不太清楚怎么怎么将动画展示在博客中,后期如果学会我会及时更新,如果有小伙伴着急需要,也可以私信我,对文章理解不到位的地方,也请各位小伙伴指正,共同学习进步!

本文背景

现实世界中的信息物理融合系统(Cyber-Physical Systems),如智能建筑、工厂、发电厂、数据中心等,变得越发巨大和复杂。通常会安装大量的传感器来监测系统的运行状态并检测异常,运维人员从而发现潜在的安全隐患并采取必要的措施。传感器通常生成的是大量的多变量的时间序列,因此本文是基于多变量时间序列的异常检测。异常检测就是找出和系统中正常行为的状态不一致的时间点。通常由于缺乏有标记的数据,异常检测通常是当作无监督的机器学习任务。

本文贡献

(1)提出了基于生成对抗网络(GAN)的多变量时间序列异常检测模型。
(2)以 LSTM 为基本模型来捕获时间上的依赖关系,并将其嵌入到 GAN 的框架中。
(3)同时利用 GAN 的生成器和判别器来检测异常,利用判别器得到判别损失,利用生成器得到重建的损失。

文章目录

    • **内含动画的PPT已经上传,可以在我上传的资源里看到,可免费下载**
          • 本文背景
          • 本文贡献
        • 一、论文概括
        • 二、相关的研究工作
        • 三、作者的研究方法

一、论文概括

  1. 研究对象
  2. 目标
  3. 方法
  4. 结论

(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第1张图片

二、相关的研究工作

  1. 异常检测
  2. MAD-GAN(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第2张图片

三、作者的研究方法

  • 模型及分析
  • 子序列的形成
  • DR评分
  • 算法流程
  • 两个CPS数据集介绍
  • 模型相关参数设置
  • 评测指标
  • 实验结果及比对
    (四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第3张图片
    关于这个模型的理解,我说说我个人的想法,看似没什么,就是一个GAN模型,但是真正每一步去理解它的时候,总感觉有些地方理解的不透彻,怎么把这个模型的原理搞清楚,并且能够清晰地解释给别人听,让别人也能听明白并理解这个模型,我花了较长时间去思考,某天深夜,想喝奶茶,突然灵机一动,奶茶的例子能够解释这个模型。

(1)为了理解模型的每一块,花了很长的时间做了上面这张图的动态PPT,PPT会跳转出来该模型的怎么运行的,通过动画更能清楚明白地去理解,建议大家先下载定位到这一页再看下面的文字描述解释。

(2)首先分成两个部分,训练阶段+异常检测阶段

  • 训练阶段,看成是对奶茶店的新入职的员工进行培训,让她具备制作奶茶的技能;
  • 异常检测阶段,看成新员工通过培训,去上岗给顾客做奶茶,顾客的反馈就是检测

(3)具体理解

角色:制作奶茶新员工A(Generator)+品尝奶茶新员工B(Discriminator)+奶茶制作清单Random Latent Space

- 训练阶段

角色:制作奶茶新员工A(Generator)+品尝奶茶新员工B(Discriminator)+奶茶制作清单Random Latent Space

  • 首先新员工A(Generator生成器,做奶茶的人)进入培训阶段,首先会拿到一份奶茶制作清单Random Latent Space(可以看成一点点他们家所有饮品的列表)——>新员工需要根据所获得的这份清单去练习制作奶茶(生成样本)——>员工A将制作出来的奶茶给另一位新员工B(Discriminator)去判定自己制作的这杯奶茶怎么样——>B因为也是刚入职,所以她凭借自己品过的奶茶(训练样本)的少许经验去给A提出修改意见(Score)——>A收到修改意见继续努力进步,同时B也在不断地提高自己的鉴品能力——>在反复进行的过程中,A,B都满足了“一点点公司”上岗要求。

此时场景从幕后转换到幕前,A,B上岗啦!!

- 异常检测阶段

角色:制作奶茶新员工A(Generator)+品尝奶茶新员工B(Discriminator)+奶茶制作清单Random Latent Space+顾客下单饮品(测试样本,测试样本中的订单中有一点点,Coco,星巴克,鹿角巷等,正常的订单是一点点,其它的视为异常)

  • AB开始上班啦!有顾客开始点单啦!但是顾客点单的方式并不完全中规中矩,比如,红茶玛奇朵,顾客会说成玛奇朵(订单是一点点的,匹配度高,正常);但是会有顾客说我要一杯香草榛果拿铁(订单是星巴克家的,匹配度低,异常)
  • 检测正常:A收到订单(测试集),顾客说要波霸奶茶,波霸奶茶被映射到Random Latent Space(一点点的菜单里能找到)——>A对应找到波霸奶茶,顾客订单和菜单匹配度100%——>根据制作出来波霸奶茶——>顾客拿到做好的奶茶与自己的订单比较——>一致,重构损失0,并且旁边的B在监督的过程中观察到A是根据菜单里做的,匹配,判别损失0——>这个订单正常
  • 检测异常:A收到订单(测试集),顾客说要香草榛果拿铁,香草榛果拿铁映射到Random Latent Space(一点点的菜单里没有找到)——>A没有找到100%匹配的,根据最高相似度找到香草奶茶,制作出香草奶茶——>顾客拿到做好的奶茶与自己的订单比较——>不一致,重构损失大,原来香草榛果拿铁是星巴克的,一点点没有,只好按照最高匹配度找到一杯和香草榛果拿铁差不多的饮品制作——>这个订单异常

(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第4张图片

(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第5张图片
(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第6张图片
(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第7张图片
(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第8张图片
(四)MAD-GAN: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks_第9张图片

你可能感兴趣的:(论文解析)