摘要:本文根据对现有基于深度学习的异常检测算法的调研,介绍现有的深度异常检测算法,并对深度异常检测算法的未来发展趋势进行大致的预测。
本文分享自华为云社区《【论文阅读】异常检测算法及发展趋势分析》,原文作者:MUR11。
异常检测问题是很多实际应用场景中的一个重要问题。本文根据对现有基于深度学习的异常检测算法的调研,介绍现有的深度异常检测算法,并对深度异常检测算法的未来发展趋势进行大致的预测。
异常检测在实际生产生活中有大量的应用。例如:从信用卡交易记录中找出潜在的盗刷或套现记录、在交通监控视频中找出违法的交通参与者、在医学影像中找出病变的组织、在网络中找出找出入侵者、从物联网传输的信号中找出异常传输等。
当前大部分异常检测场景高度依赖人工,对于人力有大量的需求。未来随着老龄化加剧、工作人口减少,使用算法代替人工进行异常是大势所趋。
常见的异常类型可以分为三类:
上述三类异常中,条件异常经过一定的转换后等价于点异常,因此实际上常见的异常类型只有点异常、群体异常两种。当前业界的研究和应用主要集中在点异常的检测上,下文也将重点介绍点异常的检测算法。
当前主流的异常检测算法通常基于深度学习技术,按照使用的监督信息可以分为有监督方法、无监督方法、半监督方法。此外,也有一些将深度学习技术和传统的非深度学习技术结合在一起的异常检测算法。下面对这几类方法分别展开介绍。
深度有监督学习是目前深度学习研究最充分、应用最广泛的一类方法。利用这类方法进行异常检测时,包括数据收集、模型训练、模型推理三个阶段:
这类方法的优点是实现简单、精度高,缺点是需要收集大量的正常样本和异常样本并进行标注。实际中,异常样本往往是很稀缺的,通常难以收集足够数量的异常样本来训练模型,因此也就无法应用深度有监督异常检测方法。
为了更好地应对实际应用中难以收集到足够数量的异常样本的情况,深度无监督异常检测方法通过建模正常样本,来间接地实现异常检测的功能。具体来说,深度无监督异常检测的步骤如下:
该类方法是目前使用深度学习技术进行异常检测的主流方法,其中具有代表性的两类模型分别是自编码器和生成对抗网络。
仍以图像异常检测任务为例。使用自编码器模型检测图像中的异常时,流程如下:
使用生成对抗网络模型检测图像中的异常时,流程如下:
以上两个小节简单介绍了两种典型的深度无监督异常检测算法的实现步骤。从上述步骤可以看出,无监督异常检测算法通常是通过计算重构或生成的图像与实际图像之间的差异来判断是否存在故障。这种方法虽然不需要异常样本,更适合实际场景,但是缺点也比较明显——抗噪声干扰的能力比较差。由于像素级的差异不一定是实际的故障造成的,也有可能是污渍等无关痛痒的干扰造成的,而深度无监督异常检测算法无法区分这些不同的差异,因此在实际应用中,深度无监督异常检测算法的误报通常较多。
实际中有时也能收集到少量的异常样本,为了尽可能充分地利用这些异常样本提升异常检测算法的精度,学术界提出了一类深度半监督异常检测算法,该类算法的主要步骤如下:
该类方法的优点是数据收集简单,并且可以端到端的进行表示学习和分类器的学习,但是往往训练过程中需要尝试大量的参数,训练耗时较长。
除上述完全基于深度学习的异常检测算法外,近年来也有一些将深度学习和传统的非深度异常检测方法结合在一起的方法,如下图所示。这类方法中,深度学习模型仅作为特征提取器,而核心的识别异常的功能由传统异常检测算法实现。
这类方法的优点是可以灵活组合不同的深度学习模型和非深度的异常检测算法,缺点是特征表示学习的过程和判定的过程割裂开了,导致判定的过程不能反作用于特征表示学习的过程,深度学习模型提取的特征不一定能够表征出异常,也不一定能够和后续的异常检测算法相匹配。
本节结合前文内容,对异常检测领域中几个有价值的研究场景进行总结,并对未来的研究趋势进行大致的预测:
[1] Paul Bergmann, Sindy Loewe, Michael Fauser, David Sattlegger, Carsten Steger. Improving Unsupervised Defect Segmentation by Applying Structural Similarity To Autoencoders. arXiv 2019.
[2] Thomas Schlegl, Philipp Seeböck, Sebastian M. Waldstein, Ursula Schmidt-Erfurth, Georg Langs. Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery. arXiv 2017.
[3] Raghavendra Chalapathy. Anomaly Detection Using One-Class Neural Networks. arXiv 2019.
点击关注,第一时间了解华为云新鲜技术~