smile-yan

《异常检测——从经典算法到深度学习》7 基于条件VAE异常检测

《异常检测——从经典算法到深度学习》

0 概论
1 基于隔离森林的异常检测算法
2 基于LOF的异常检测算法
3 基于One-Class SVM的异常检测算法
4 基于高斯概率密度异常检测算法
5 Opprentice——异常检测经典算法最终篇
6 基于重构概率的 VAE 异常检测
7 基于条件VAE异常检测
8 Donut: 基于 VAE 的 Web 应用周期性 KPI 无监督异常检测
9 异常检测资料汇总（持续更新&抛砖引玉）
10 基于条件 VAE 的鲁棒无监督KPI异常检测
11 针对大量出现的KPI流快速部署异常检测模型

7. 基于条件VAE异常检测

论文名称：Anomaly Detection With Conditional Variational Autoencoders
发表时间：2019.12 立即下载

论文总体结构：

INTRODUCTION ：引出并总体介绍CVAE，概括论文亮点，介绍论文结构。
PROBLEM STATEMENT：简单陈述问题，引出需要的解决方法。
BACKGROUND AND PROPOSED METHOD：介绍 VAE、CVAE 、CVAE 异常检测的度量方法、VAE 异常检测。
EXPERIMENTS ON BENCHMARKS ：基于 MNIST 与 Fashion-MNIST 的异常检测实验、综合问题。
EXPERIMENTS ON CMS TRIGGER RATE MONITORING：基于CMS数据的实验。
CONCLUSIONS AND FUTURE WORK：总结

7.1 INTRODUCTION

7.1.1 总体介绍 CVAE (Conditional Variational Autoencoders)

CVAE是一种条件有向图模型，输入观测值对产生输出的隐变量的先验值进行调制，以便将高维输出空间的分布建模为以输入观测值为条件的生成模型。

CVAE is a conditional directed graphical model where input observations modulate the prior on latent variables that generate the outputs, in order to model the distribution of high-dimensional output space as a generative model conditioned on the input observation

这种定义性质的话可能并不那么容易理解，但是通过结合图模型可能可以方便很多。

其中的实现表示生成模型 $p_\theta {(x|u,k)}$ ，虚线表示变分似然 $q_\phi{(u|x,k)}$ 。其中 $\theta$ 和 $\phi$ 都是变分参数，与 VAE 训练过程是相同的，分别在 decode 和 encode 过程中生成。

与 VAE 模型相比，多了另外参数 k ，可以认为这是额外的输入数据（extra input），也可以认为是条件，在多了 k 的影响下，VAE 便成了 Conditional VAE.

如果对 VAE 有所了解的话，那么理解 CVAE 就非常简单了。

推荐参考：

VAE 模型基本原理简单介绍
Conditional Variational Autoencoders

7.1.2 概括论文亮点 (Contributions)

定义了新的损失函数 (loss function)，让模型能够学习最佳重构方案( reconstruction resolution)。
设计新的与 CVAE 相关联的异常度量指标，在经典机器学习和粒子物理特定数据集上都具有了优异的性能。
提出基于MNIST数据集，新的异常检测实验方案。

7.2 问题陈述

首先论文吐槽了一下没找到合适的数据集，所以不得不选择了手写数字数据集 (MNIST)。

然后给出条件 $k$ （已知），输入数据 $x$ ，以及隐变量 $u$ （未知）之间的关系 $x = f (k, u)$ 。

对于很多观测数据 $X=[x_1,x_2,...,x_n]$ ，我们需要重点观测的实例包括：

单一特征的大变化，我们称之为 A 类型异常；
变化小但是系统化的特征，我们称之为 B 类型异常。

不需要着重观测的数据：

不相关特征且严重程度较小

总之，我们需要一种算法，利用数据中已知的因果结构，找出上面列出的两种类型的问题，将其推广到不可见的情况，并使用数据而不是依赖于特征工程。在目标应用程序的上下文中，推理时间可以忽略不计。

7.3 背景介绍与方法提出

7.3.1 VAE & CVAE

VAE 基本原理在 VAE 模型基本原理简单介绍已经比较详细的介绍了，这里只介绍对 VAE 模型的改进部分（CVAE）。

通常情况下训练 VAE 模型时，使用 MSE ( mean squared error ) 来计算输入数据 x 与 decoder 生成数据之间的差异。

计算差异的公式可以由正态分布概率密度函数推导：

${1\over \sqrt {2\pi}\sigma} exp(-{(x-\mu)^2\over 2\sigma^2}) \ \ \ \ \ \ \ \ (1)$

取对数后，得

$\log f(x) = \log {1\over \sqrt {2\pi}\sigma} + (-{(x-\mu)^2\over 2\sigma^2})\\ \log f(x) = -\log {\sqrt {2\pi}\sigma} -{(x-\mu)^2\over 2\sigma^2} \ \ \ \ \ \ (2)$

这篇论文认为，认为可以固定方差 $\sigma = 1$ 。当 $\sigma =1$ 时，极大似然的 log 值计算公式为：

However, this is equivalent to setting the observation model pθ(x|z) as a normal distribution of fixed variance σ = 1. Indeed, the log-likelihood of a normal distribution with fixed variance of 1 is given as:

$-\log \N(x;\mu,1)=||x-\mu||^2+\log(\sqrt{2\pi}) \ \ \ \ \ \ \ \ (3)$

注：

从公式(2) 到公式(3) 存在问题，即代入 $\sigma =1$ ,原来的式子(2)应该多一项 $1\over 2$ ，也就是说，导入后正确结果是：

$-\log \N(x;\mu,1)={||x-\mu||^2\over 2}+\log(\sqrt{2\pi}) \ \ \ \ \ \ \ \ (4)$

很明显，这样的假设 ( $\sigma=1$ ) 是存在很大的问题的，初始化若干个正态分布，然后根据数据特征的实际情况而进行调整数据特征的均值和方差。如果直接添加这项限制，对 VAE 的随机性特征会有很大限制。

但除非事先知道数据的相关信息，否则数据的分布是不需要很大的特征振幅。

所以可以通过学习MSE重构的方差，模型可以找到重建数据的每个特征的最佳误差方案，从而从相关性中分离固有噪声。这在经验上给出了类似的结果，关联一个微调的加权参数，同时消除了调整所述超参数的需要。

7.3.2 CVAE 改进部分

CVAE 结构中，有三种类型的变量（参见图1）。对于随机可观测变量 $x$ ， $u$ （未知，未观测）和k（已知，观测）是独立的随机隐变量。

条件似然函数 $p_\theta{(x|u,k)}$ 是非线性转换而来的， $\phi$ 是另一个非线性函数，近似于推理后验 $q_\phi{(u|k,x)}=N(\mu,\sigma I)$ .

隐变量 $u$ 允许在 $x$ 与给定 $k$ 的条件分布下对多个模式进行建模，使得该模型足以对一个相互映射进行建模。

为了近似 $\phi$ 和 $\theta$ ，对 ELBO 进行调整：

其中隐变量 $z$ 用于捕捉不可观测的变异因子 $u$ .

损失函数为：

注：

如果不了解 ELBO 的话，请参考 VAE 模型基本原理简单介绍。

我们的模型虽然是基于 CVAE 但是着重于异常检测输出变量的条件分布。

我们使用Keras和TensorFlow作为后端，使用Adam优化器和早期停止准则训练模型。一旦模型参数被学习，我们就可以使用不同的度量来检测异常：

A 类问题：从隐变量 $z$ 采样，通过计算重构损失 $||{1\over \sigma} {(x-\hat x)^2}||_\infty$ 。
B 类问题：通过计算KL平均散度。

7.3.3 CVAE 异常检测的一种度量

对于给定数据 (x,k)，VAE 的评估方法 $L (x, k)$ 是 $log\ p_\theta{(x|k)}$ 的近似上限，测量x与给定k的模型之间的差异。因此，对这种损失的价值进行阈值化是处理AD的一种自然方法。因此，CVAE在这里提供了一个模型，可以自然地估计x是如何异常的，而不是计算（x，k）的异常程度。这意味着如果存在一个稀有的k值和一个适当的x值相关联，那么应该被视为正常的。

方程6中的损失函数，可以分解为两个独立问题。由于两个独立的异常场景，我们不会组合各个指标到一个总体得分中，而是使用逻辑 $O R$ 来确定异常实例。

第一种情况，我们对识别单个特征上的异常感兴趣。当大多数特征没有表现出异常并降低异常分数时，通常使用的重建误差均值可能是一个错误的选择.
第二种情况，我们期望 $μ_z$ 落在异常情况下分布的尾部。如[11]中所述， $D_{KL}$ 度量了表示后验分布所需的额外信息量，给定了用于解释当前观察结果的隐变量的先验值。 $D_{KL}$ 的绝对值越低，观察到的状态越可预测。

最后，VAE 的使用让该方法可以推广到文献[12]中所讨论的不可见的观测值问题。

[11] Mevlana Gemici, Chia-Chun Hung, Adam Santoro, Greg Wayne, Shakir Mohamed, Danilo J Rezende, David Amos, and Timothy Lillicrap. Generative temporal models with memory. arXiv preprint arXiv:1702.04649, 2017.
[12] Durk P Kingma, Shakir Mohamed, Danilo Jimenez Rezende, and Max Welling. Semi-supervised learning with deep generative models. In Advances in NeurIPS, pages 3581–3589, 2014.

7.3.4 VAE 异常检测

这一部分总体上介绍了基于VAE 的异常检测一些方法。

这里暂时略过了，如有需要可以仔细了解。

7.4 实验

7.4.1 基于MNIST & Fashion-MNIST 的异常检测

首先解释了一下为什么用这两个数据集（略）。

其次，论文对异常的定义与很多论文不同。一般情况下 MNIST 数据集用于异常检测是把某个数字对应的数据看作异常，其他的作为异常。

这篇论文中，使用 LeNet-5 对数据进行分类，再用 LeNet-5 算法与人为指定的阈值进行分类，分类后的结果作为这次CVAE实验的数据集。

下面的图片是使用不同分类算法提出来的它们认为可能是异常的数据。最终实验时只采用了 LeNet-5 的分类结果。

实验中，我们给向量 $k$ 指定了一个类标签，而 $u$ 应该包含关于其他变化因素的信息，例如用来写数字的手。检测异常的问题类似于 B型问题。在这种情况下，我们期望 $\mu(D_{KL})$ 在标签错误或不常见的情况下会更高。

在实验中，选取了10,000 个样本作为测试集。如下图所示，实验把 CVAE 算法与其他三种算法进行了比较。左图是基于 MNIST 的实验结果，右图是基于 Fashion-MNIST 的实验结构。

7.4.2 合成问题

合成的数据集使用了正态分布( $\mu = 0$ ， $\sigma = 1$ )，连续并且相互独立的隐变量 $u$ 和 $k$ 。可观测的 $x$ 仅仅是 $u$ ， $k$ 和其他噪声 $\epsilon$ 共同生成的： $x_j = f_j{(\overrightarrow{\mu})} \cdot \sum_{i=0}^{m}{S_{ji}k_i}+\epsilon$ ，
其中
* $j$ 是 $\overrightarrow x$ 的索引。

二元矩阵 $S$ 是描述了哪一个 $k$ 用于计算特征 $j$ 。
函数 $f(\overrightarrow u)$ 描述了哪个 $u$ 进入了定义每个特征 $j$ 的产品： $f_j(\overrightarrow u)= \prod_{o} u_o$ 。

对每个样本， $S$ 和 $f(\overrightarrow u)$ 保持不变，而 $k$ 和 $u$ 发生改变。为简单起见，我们确保每个 $j$ 只依赖于一个 $k$ 并且依赖是均匀分布的。最后，我们可以操作 $o$ 和 $m$ 的值。例如，第一列 $x_0$ 可以用 $k_0$ ， $u_1$ 和 $u_4$ 表示： $x_0=k_0u_1u_4$ ； $x_99$ 可能通过 $k_4$ ， $u_0$ 生成等等。

我们生成 $x$ 为100维 ( $n = 100$ ) 且 $m = o = 5$ 的样本。相关矩阵的一个例子如下图（图5）所示。

对于测试，我们根据表 I 生成样本。选择 5 $\sigma$ 和 3 $\sigma$ 来自于我们的目标应用程序的遗留需求。该异常检测算法的执行方式是:

A类问题：比较 decoder 的输出和 encoder 的输入，以发现仅在一个特征上观察到的问题 ;
B类问题：比较属于相同因果关系组（即输入时使用相同的 $k$ 值）的样本的所有特征的 $D_{KL}$ 域。

两个问题对应的ROC曲线如图6（下图）所示。给定A型异常的高阶偏差，算法很容易发现这些类型的问题。在层次结构的背景下，算法需要建立一个映射模型，从单一输入到多个可能的输出。

如 [3] 中讨论我们需要能够进行不同预测的模型，B类问题给出了良好的结果，优于普通的 VAE ，证明了CVAE 适合这样的任务。

[3] Kihyuk Sohn, Honglak Lee, and Xinchen Yan. Learning structured output representation using deep conditional generative models. In Advances in neural information processing systems, pages 3483–3491, 2015.

7.5 基于 CMS 的实验

7.5.1 动机

这项工作的出现直接从明确的紧急监测的CMS[29]实验。CERN LHC[30 ]的CMS实验以每秒4000万次粒子碰撞(事件)的惊人速度运行。每个事件对应大约1 MB未处理的数据。由于可以理解的存储限制和技术限制(例如，足够快的电子读出)，这个实验需要实时地将记录的数据数量从每秒4000万件减少到1000件。为了达到这个目的，一组被统称为触发器系统的分层算法被用来处理和过滤进入的数据流，这是物理事件选择过程的开始。

触发算法[31]旨在降低事件率，同时保持实验的物理范围。CMS触发系统的结构分为两个阶段，使用越来越复杂的信息和更精细的算法:

L1 触发：在定制设计的电子产品上实施; 把输入速率从 40 MHz 减少到 100 kHz，时间小于 10 $\mu$ s。
高等级触发（HLT）：一个在计算机场上运行的碰撞重建软件；将L1触发器的100 kHz速率输出降低到1 kHz ，时间小于 300 ms

L1和HLT系统都实现了一组规则来执行选择(称为路径)。HLT是由一组可配置的L1触发路径选择的事件来种子的。

在典型的运行条件下，触发系统可以调节观测到的碰撞产生的海量数据。通过对每个检测器子系统的独立监控，保证了记录数据的质量（比如说电压），通过监控触发率事件接受率会受到问题数量的影响，例如检测故障，软件问题等。根据问题的性质，与特定路径相关的比率可能会改变到不可接受的水平。危急情况包括降到零或增加到极值。在这种情况下，系统应该向值班人员发出警报，要求进行问题诊断和干预。

HLT路径通常是非常强相关的。这是由于一组路径选择了类似的物理对象(因此重构了相同的事件)和/或通过L1触发路径的相同选择来种子。奇异路径的速率偏差临界水平应视为异常，而随机触发路径数量上的偏差较小则可能是统计波动的结果。另一方面，在一组由类似物理或使用相同硬件基础设施相关的触发路径上的可观察到的相干漂移(甚至很小)，是在触发系统或硬件组件中可能存在故障的指示。

我们在算法中探索了这种层次结构。每个HLT路径都有一个直接的、预先配置的链接，通过指定的配置链接到一组L1触发器路径，如图7（下图）所示。配置变化很少，例如节点被添加、禁用或更正。因此，HLT系统的性能直接与L1触发器的状态有关。

我们不关注最小化推断时间，因为异常可以在几分钟内标记出来，这对于所有考虑的算法来说已经足够长了。

[29] Serguei Chatrchyan et al. The CMS experiment at the CERN LHC. JINST, 3:S08004, 2008.
[30] The LHC Study Group. The Large Hadron Collider, conceptual design. Technical report, CERN/AC/95-05 (LHC) Geneva, 1995.
[31] V ardan Khachatryan et al. The CMS trigger system. JINST, 12(01):P01020, 2017

7.5.2 实验

把 HLT 速率用作 $x$ ，把 L1 触发率用作 $k$ ，我们的原型使用了4条L1触发路径，每条都包含6条唯一的HLT路径。我们仅从配置中存在所有选择路径的样本中提取速率。最终得到102895个样本，然后将样本分为训练集、验证集和测试集，我们的测试集有2800个样本。操作人员为每个 CMS 子检测器和每个样本设置质量标签。由于全局质量标志是由所有子系统的贡献组成的，一个样本可以被认为是坏的，因为与我们选择的触发路径集无关的检测器组件的性能不佳，或者与我们试图解决的问题无关。因此，我们不能在测试集中使用这些标签。相反，我们考虑可能在生产环境中发生的假想情况，类似于用于合成问题的情况。我们以与合成数据集相似的方式操作我们的测试集，生成四个合成测试数据集。我们检测一个HLT路径上的孤立问题-类型A;在同一L1触发路径上的HLT路径存在问题-类型B。

我们将结果报告在图6中。该算法在CMS数据集上的性能与合成算法的性能相当。CMS实验目前没有提供任何工具来跟踪属于B类的问题。鉴于所提方法的良好性能，我们相信可以考虑部署该解决方案，并在生产环境中提供进一步的测试和改进。

7.6 总结

本文介绍了利用 CVAE 异常样本的方法。结合CMS触发率监控的具体案例，对现有的监控功能进行了扩展，显示了良好的检测性能。该算法不依赖于训练时的合成异常，也不依赖于附加的特征工程。我们证明了该方法不受CMS实验的限制，并且具有跨不同领域工作的潜力。然而，需要对更困难的数据集进行更多的测试，比如说在 CIFAR，提供了更多的类和更高的方差。我们没有对任何实验进行超参数扫描，因此我们期望进一步优化后的结果会更好。后续研究预测使用CMS触发器系统的完整配置。该方法的一个有趣的扩展是学习潜存空间中未知变化因素的正确编码，这在目前是不受限制的(例如MNIST数据集中数字的倾斜或粗体)。

7.7 相关代码

复现论文思路的代码很难，如果有小伙伴找到对应的代码实现，欢迎分享在下方的评论中。感谢！

首先提出两个重要假设：

Conditional VAE 结构中的 Condition 结构及具体数值必须根据实际情况调整。
Conditional VAE 不一定需要额外的输入，但是需要额外的条件。论文中图2 中输入层含有的 $k$ 以及博客 https://ijdykeman.github.io/ml/2016/12/21/cvae.html 提到的 CVAE 中的条件不一定是指输入时的条件，也可以是隐变量映射的高斯分布的一些特征条件。比如说论文中提到，定义方差等于1，这也是一种 condition。对隐变量映射的高斯分布所加的一些约束条件。

关于 CVAE 的代码部分这里暂时没有合适的例子，有时间的话再补上。另外分享一下找到的相关的另外一份代码，推荐了解一下，请关注里面的 condition 具体指的是什么。https://github.com/amunategui/CVAE-Financial-Anomaly-Detection

Smileyan
2020.11.25 15:33

pytorch正向传播没问题，loss.backward()使定义的神经网络中权重参数变为nan 加速却甩不掉伤悲 pytorch 神经网络人工智能
记录一个非常坑爹的bug:loss回传导致神经网络中一个linear层的权重参数变为nan1.首先loss值是正常数值；2.查了好多网上的解决办法：检查原始输入神经网络数据有没有nan值，初始化权重参数，使用relu激活函数，梯度裁剪，降低优化器的学习率等等都没解决，个人认为这些应该影响不大，一般不会出问题；3.最后是使用如下异常检测：检测在loss回传过程中哪一块出现了问题torch.autog
工信教考 | AI智能体应用工程师（模拟试题）人工智能-猫猫人工智能开源自然语言处理语言模型架构
关于AI智能体工程师的模拟试题，下面根据AI智能体工程师所需掌握的知识和技能，设计一些模拟题型的示例。这些题目旨在考察应试者在人工智能、机器学习、深度学习、算法设计、系统开发等方面的能力。一、选择题无监督学习常用于哪些任务？（单选）A.回归分析B.聚类分析C.分类预测D.序列预测答案：B解析：无监督学习常用于聚类、降维、异常检测等任务，如市场分割、数据可视化等。以下哪种激活函数常用于分类问题的输出
数据分析-13-时间序列异常值检测的类型及常见的检测方法皮皮冰燃数据分析数据分析
参考时间序列异常值的分类及检测参考异常值数据预警分析1时间序列异常的类型时间序列异常检测是数据处理和分析的重要环节，广泛应用于量化交易、网络安全检测、自动驾驶汽车和大型工业设备日常维护等领域。在时间序列数据中，异常通常指的是与正常数据模式显著不同的数据点，可能由系统故障、错误或外部干扰引起。异常数据，也称为离群点，是指在数据集中与其他数据点明显不同的样本。这些数据点往往不符合预期的模式或行为，可能
【大数据】孤立森林算法大雨淅淅大数据算法 python 大数据人工智能
目录一、孤立森林算法概述二、孤立森林算法优缺点和改进2.1孤立森林算法优点2.2孤立森林算法缺点2.3孤立森林算法改进三、孤立森林算法代码实现3.1孤立森林算法python实现3.2孤立森林算法JAVA实现3.3孤立森林算法C++实现四、孤立森林算法应用一、孤立森林算法概述孤立森林算法是一种用于异常检测的机器学习算法。它基于这样的直觉：异常点是数据中的少数派，它们在特征空间中的分布与正常数据点不同
基于STM32的工厂安全监测系统：采用FreeRTOS、MQTT协议、InfluxDB存储与Grafana可视化，实现实时数据监测与异常检测算法优化的综合解决方案（代码示例）极客小张 stm32 安全 grafana 算法物联网 c++异常检测算法
一、项目概述项目目标与用途随着工业自动化的不断推进，工厂的安全问题成为了企业管理者关注的重点。工厂中的温度、湿度、气体浓度、烟雾、压力等环境参数直接影响着生产的安全性和产品的质量。本项目旨在设计并实现一个嵌入式工厂安全监测系统，实时监测工厂环境中的关键安全参数，通过无线通信模块将数据传输到云端进行存储和分析，从而实现对工厂环境的智能化监控和预警。项目解决的问题与价值实时监测：实时采集工厂内的温度、
电力行业电气领域相关数据集下载地址汇总输电线路变电站电网应用数据集汇总(全网最全) FL1623863129 数据集目标检测
在电力行业电气领域，数据集扮演着至关重要的角色。这些数据集涵盖了从发电到用电的各个环节，包括输电线路图像、变电站监测、电力负荷预测等多样化内容。例如，输电线路图像数据集通过无人机或直升机拍摄，包含了杆塔、绝缘子、导线等详细图像，为目标检测、分类和异常检测提供了丰富的素材。此外，还有针对变电站烟火检测、导线破损检测等特定任务的数据集，这些数据集通过收集实际场景中的图像和视频，帮助研究人员训练更加精准
周报 | 24.8.12-24.8.18文章汇总双木的木深度学习拓展阅读深度学习人工智能 transformer 算法 python stable diffusion llama
为了更好地整理文章和发表接下来的文章，以后每周都汇总一份周报。周报|24.8.5-24.8.11文章汇总-CSDN博客OpenCV与AI深度学习|实战|使用YoloV8实例分割识别猪的姿态（含数据集）-CSDN博客极市平台|异常检测开源数据集汇总-CSDN博客程序员学长|快速学习一个算法，集成学习-CSDN博客Coggle数据科学|行业落地分享：大模型RAG汽车应用实践_rag中的意图识别-CSD
异常GPT：使用LVLMs检测工业异常 DUT_LYH gpt 人工智能算法
AnomalyGPT：利用LVLMs进行工业异常检测摘要本文介绍了一种名为AnomalyGPT的新型工业异常检测方法，该方法基于大型视觉语言模型(LVLMs)。AnomalyGPT能够检测并定位图像中的异常，无需手动设置阈值。此外，AnomalyGPT还可以提供与图像相关的详细信息，以交互方式与用户进行交流。本文详细阐述了AnomalyGPT的模型架构、解码器、提示学习器以及异常模拟方法，并在Vi
基于极限树特征递归消除和LightGBM的异常检测模型宋罗世家技术屋信息资源管理与发展专栏算法 python
摘要入侵检测数据维数大、数据样本不均衡、数据集分散性大的问题严重影响分类性能,为了解决该问题,文章提出基于极限随机树的特征递归消除（ExtraTrees-RecursiveFeatureElimination,ET-RFE）和LightGBM（LGBM）的入侵检测方法。首先对网络数据进行独热编码重构,在数据级层面均衡少量样本的攻击类别;其次,使用基于ET-RFE对流量特征进行降维处理,寻找含有信息
探索LightGBM：监督式聚类与异常检测 Echo_Wish Python 笔记 Python算法聚类数据挖掘机器学习
导言监督式聚类和异常检测是在监督学习框架下进行的一种特殊形式的数据分析技术。在Python中，LightGBM提供了一些功能来执行监督式聚类和异常检测任务。本教程将详细介绍如何使用LightGBM进行监督式聚类和异常检测，并提供相应的代码示例。监督式聚类监督式聚类是一种将聚类任务结合到监督学习框架中的技术。LightGBM提供了一种基于决策树的监督式聚类方法。以下是一个简单的示例：importli
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试 deephub llama 深度学习时间序列基础模型
2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源基础模型:laglllama。在原论文《Lag-Llama:TowardsFoundationMo
基于UI交互意图理解的异常检测方法美团测试
美团到店平台技术部/质量工程部与复旦大学周扬帆教授团队开展了科研合作，基于业务实际场景，自主研发了多模态UI交互意图识别模型以及配套的UI交互框架。本文从大前端质量保障领域的痛点出发，介绍了UI交互意图识别的方法设计与实现。基于UI交互意图编写的测试用例在实际业务中展现出了可以跨端、跨App的泛化能力，希望可以为从事相关工作的同学带来一些启发或帮助。1.背景近年来，随着美团多种业务线的扩充和迭代，
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试人工智能深度学习python
2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源基础模型:laglllama。在原论文《Lag-Llama:TowardsFoundationMo
异常检测-基于统计学的方法-学习笔记-2 Rank_Fan007
异常检测的学习笔记并非原创，而是搜索各位大佬的帖子整理而得。如有冒犯，请联系我。1.概述统计学⽅法对数据的正常性做出假定。它们假定正常的数据对象由⼀个统计模型产⽣，而不遵守该模型的数据是异常点。异常检测的统计学⽅法的⼀般思想是：学习⼀个拟合给定数据集的⽣成模型，然后识别该模型低概率区域中的对象，把它们作为异常点。根据如何指定和学习模型，异常检测的统计学⽅法可以划分为两个主要类型：参数⽅法和⾮参数⽅
Deep Learning for Anomaly Detection: A Review（翻译） appron 入侵检测异常检测网络攻击检测
前言一、引言二、异常检测：问题的复杂性和挑战1.主要问题复杂性2.深度异常检测所面临的主要挑战三、用深度异常检测应对挑战1.预备工作2.深度异常检测方法的分类四.深度学习的特征提取1.预训练模型2.特定的特征提取模型五.学习常态的特征表征(特征提取器即分类器，即时连接同步训练的特征提取器和分类器)1.通用规范特征学习1.1自动编码器。(特征提取器即分类器）1.2生成对抗网络。(AnoGAN,f-A
ICCV 2023 | 腾讯优图16篇论文入选！轻量级主干、异常检测和扩散模型等方向 Amusi（CVer）
点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>【计算机视觉和论文写作】交流群来源：腾讯优图实验室作为全球计算机领域顶级的学术会议之一，ICCV2023（InternationalConferenceonComputerVision）国际计算机视觉大会将于今年10月在法国巴黎举行。近日，ICCV公布了论文录用结果，本届会议共有8068篇投稿，接收率为26.8%。今年
ICCV 2023 | 8篇论文看扩散模型diffusion用于图像检测任务：动作检测、目标检测、异常检测、deepfake检测... 机器学习与AI生成创作目标检测人工智能计算机视觉
1、动作检测DiffTAD:TemporalActionDetectionwithProposalDenoisingDiffusion基于扩散方法提出一种新的时序动作检测（TAD）算法，简称DiffTAD。以随机时序proposals作为输入，可以在未修剪的长视频中准确生成动作proposals。从生成建模的视角，与先前的判别学习方法不同。首先将真实proposals从正向扩散到随机proposa
智能运维哪些算法？智能运维包含哪些云呐AIOps 智能运维 AIOps 运维管理系统运维
在智能运维领域，详细介绍一些关键的算法，并阐述这些算法是如何被应用于智能运维系统中的。此外，关于智能运维中包含的主要组成部分或功能模块，以及它们各自的作用和重要性。如何应用再场景中应用在智能运维行业，一些关键算法包括：机器学习算法：如决策树、随机森林、svm算法等，从历史数据中学习方法和规律，预测未来的特点和故障。在智能操作和维护系统中，这些算法被应用于故障预测、异常检测、资源调度等方面，以帮助操
NeurIPS 2023 时间序列相关论文总结 STLearner 大数据智慧城市 pytorch 数据挖掘论文阅读深度学习
祝大家中秋国庆双节快乐！NeurIPS2023将于11月28日到12月9日在美国路易斯安那州新奥尔良举行。根据官方公布的邮件显示，今年共有12343篇投稿，接受率为26.1%，官网显示一共有3564篇论文。本文总结了NeurIPS23时间序列（不含时空数据，已经另外总结）的相关论文。包括时间序列预测，分类，异常检测，因果发现，交通，医疗等领域时间序列应用和大模型在时间序列问题建模的探索等方向。1.
WWW 2024 | 时间序列（Time Series）和时空数据（Spatial-Temporal）论文总结 STLearner 时空数据人工智能机器学习深度学习数据挖掘智慧城市论文阅读
WWW2024已经放榜，本次会议共提交了2008篇文章，researchtracks共录用约400多篇论文，录用率为20.2%。本次会议将于2024年5月13日-17日在新加坡举办。本文总结了WWW2024有关时间序列（TimeSeries）和时空数据（Spatial-Temporal）的相关文章，部分挂在了arXiv上。时间序列Topic：时序预测，异常检测，时域频域，大模型等时空数据Topic
梯度提升树系列6——GBDT在异常检测领域的应用 theskylife 数据挖掘机器学习数据挖掘 GBDT 分类 python
目录写在开头1异常检测的基本概念1.1定义和目标1.2GBDT在异常检测中的适用性2信用卡欺诈检测案例分析2.1场景介绍2.2收集数据和特征工程2.3进行异常值识别2.4模型效果评估2.5模型优化3策略和技巧4面临的挑战和解决方案4.1数据不平衡4.2过拟合4.3模型解释性写在最后在如今数据驱动的时代，异常检测成为了保障系统安全的关键技术，尤其在金融安全、网络安全等领域中扮演着至关重要的角色。梯度
时间序列异常检测论文TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate Time Series Data 蛐蛐蛐 transformer 深度学习人工智能
由于工作需要，想用一下这篇论文的方法，但感觉其代码还是有很多不清除的地方，简单总结一下。关于论文的内容介绍，可以参考：【VLDB】融合transformer和对抗学习的多变量时间序列异常检测算法TranAD论文和代码解读-知乎说得比较清楚了，我就不重复了。但是读代码的时候还是有很多不明白的地方。这里以Data文件夹下的SWaT数据集为例进行分析。首先，打开train.xlsx，可以看到就是两个me
Python报No such file or directory: ‘science‘的解决方法蛐蛐蛐 Python技巧论文点评 python 开发语言
接上一篇博文：时间序列异常检测论文TranAD:DeepTransformerNetworksforAnomalyDetectioninMultivariateTimeSeriesData-CSDN博客还是想看看这篇论文的可视化结果。但是当我重新运行原版代码的时候，会报错：FileNotFoundError:[Errno2]Nosuchfileordirectory:'science'Theabo
Wazuh功能——异常和恶意软件检测 Threathunter
异常检测是指在系统中发现与预期行为不匹配的模式的行为。一旦恶意软件(例如rootkit)安装在系统上，它就会修改系统以隐藏自己，不让用户看到。尽管恶意软件使用多种技术来实现这一点，Wazuh却使用了一种广谱的方法来发现异常模式，表明可能存在入侵者。负责这项任务的主要组件是rootcheck，然而，Syscheck也扮演着重要的角色。一、怎样工作1、文件完整性监测恶意软件可以替换其主机系统上的文件、
【人工智能】神奇的Embedding：文本变向量，大语言模型智慧密码解析(10) 魔道不误砍柴功 AI 大模型人工智能 embedding 语言模型
什么是嵌入？OpenAI的文本嵌入衡量文本字符串的相关性。嵌入通常用于：Search搜索（结果按与查询字符串的相关性排序）Clustering聚类（文本字符串按相似性分组）Recommendations推荐（推荐具有相关文本字符串的条目）Anomalydetection异常检测（识别出相关性很小的异常值）Diversitymeasurement多样性测量（分析相似性分布）Classificatio
Arxiv网络科学论文摘要15篇(2020-10-21) ComplexLY
考虑拓扑的图池化网络;因果网络模体：识别A/B测试中的异构溢出效应;关系事件模型与逆强化学习之间的联系，用于表征群体互动序列;不能通过外表来判断用户：了解社交媒体研究中多模式处理中的危害;气候讨论中推文的传播;目标路网中断导致的级联故障;通过基于订阅的频道嵌入来理解YouTube社区;鲁棒的异步和独立于网络的合作学习;通过学习和预测行为进行早期异常检测;Heider与协同演化平衡：从离散到连续相变
基于LLM的数据漂移和异常检测新缸中之脑 LLM
大型语言模型(LLM)的最新进展被证明是许多领域的颠覆性力量（请参阅：通用人工智能的火花：GPT-4的早期实验）。和许多人一样，我们非常感兴趣地关注这些发展，并探索LLM影响数据科学和机器学习领域的工作流程和常见实践的潜力。在我们之前的文章中，我们展示了LLM使用Kaggle竞赛中的表格数据提供预测的潜力。只需很少的努力（即数据清理和/或功能开发），我们基于LLM的模型就可以在几个竞赛参赛作品中获
京东数据分析岗面试题目整理 Data地平线
1，怎么做恶意刷单检验分类问题用机器学习方法建模解决，特征有：1）商家特征：商家历史销量、信用、产品类别、发货快递公司等2）用户行为特征：用户信用、下单量、转化率、下单路径、浏览店铺行为、支付账号3）环境特征（主要是避免机器刷单）：地区、ip、手机型号等4）异常检测：ip地址经常变动、经常清空cookie信息、账号近期交易成功率上升等5）评论文本检测：刷单的评论文本可能套路较为一致，计算与已标注评
2-5 异常检测 Anomaly detection with robust deep autoencoders 笔记 Siberia_
一、基本信息题目：Anomalydetectionwithrobustdeepautoencoders 期刊/会议：ACMSIGKDD 发表时间：2017年引用次数：26二、论文总结2.1研究方向提高自编码模型的抗噪声能力2.2写作动机受鲁棒PCA的启发，将原始数据分成正常数据和噪声、异常数据两部分，然后进行交替训练。2.3创新之处除了使用传统的L1正则化去约束噪声部分之外
[Python] 什么是KMeans聚类算法以及scikit-learn中的KMeans使用案例老狼IT工作室 python 机器学习 python scikit-learn
什么是无监督学习？无监督学习是机器学习中的一种方法，其主要目的是从无标签的数据集中发现隐藏的模式、结构或者规律。在无监督学习中，算法不依赖于任何先验的标签信息，而是根据数据本身的特征和规律进行学习和推断。无监督学习通常用于聚类、降维、异常检测等任务。在聚类中，算法会将相似的数据点归为一类；在降维中，算法会将高维数据映射到低维空间；在异常检测中，算法会发现与其他数据不同的离群点。无监督学习是与有监督
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include