smile-yan

《异常检测——从经典算法到深度学习》8 Donut: 基于 VAE 的 Web 应用周期性 KPI 无监督异常检测

《异常检测——从经典算法到深度学习》

0 概论
1 基于隔离森林的异常检测算法
2 基于LOF的异常检测算法
3 基于One-Class SVM的异常检测算法
4 基于高斯概率密度异常检测算法
5 Opprentice——异常检测经典算法最终篇
6 基于重构概率的 VAE 异常检测
7 基于条件VAE异常检测
8 Donut: 基于 VAE 的 Web 应用周期性 KPI 无监督异常检测
9 异常检测资料汇总（持续更新&抛砖引玉）
10 基于条件 VAE 的鲁棒无监督KPI异常检测
11 针对大量出现的KPI流快速部署异常检测模型

8. Donut: 基于 VAE 的 Web 应用周期性 KPI 无监督异常检测

2018 Unsupervised Anomaly Detection via Variational Auto-Encoder for Seasonal KPIs in Web Applications
下载地址

8.1 相关资源

8.1.1 论文翻译

为了避免篇幅过长，本文不提供论文翻译部分，如果希望能够读到翻译后的论文的话，请参考本人的个人博客网站 Donut 。

8.1.2 源码地址

这篇论文最大的亮点对于大多数人而言首先就是提供源码，读论文的时候可以找到源码对应地方的实现本身就是非常大的一个亮点。但是并不提供论文使用到的数据集。

源码地址为：https://github.com/NetManAIOps/donut

使用方法也比较简单，需要注意的是，首先确保 tensorflow 版本为 1.x ，如果是 2.x 的话需要重新安装。

8.1.3 源码依赖安装

安装tensorflow 1.15

$ pip install tensorflow==1.15.4 -i https://pypi.tuna.tsinghua.edu.cn/simple

安装依赖 zhusuan

$ pip install git+https://github.com/thu-ml/zhusuan.git

安装依赖 tfsnippet

$ pip install git+https://github.com/haowen-xu/[email protected]

安装 donut

 $ pip install git+https://github.com/NetManAIOps/donut

8.1.4 运行源码注意事项

1 需要注意的是，测试数据总共 5270，然后测试输出数据个数为 5151 。

因为对于每个窗口的检测实际返回的是最后一个窗口的 score，也就是说第一个窗口的前面 119 的点都没有检测，默认为正常数据。因此需要在检测结果前面添加 119 个 0 或者测试数据的真实 label。

2 关于检测结果

并且根据源码对于 get_score 函数的解释，其中提到：

Get the `reconstruction probability` of specified KPI observations.

The larger `reconstruction probability`, the less likely a point
is anomaly.  You may take the negative of the score, if you want
something to directly indicate the severity of anomaly.

这里直接把负数当做异常，处理方法如下：

results = []
for temp in test_score:
    if(temp >= 0):
        results.append(0)
    else:
        results.append(1)

8.2 论文概述

挑选论文几张图片，对论文核心部分进行简单介绍。

8.2.1 时间序列数据集

数据集是单 KPI 时间序列数据，每条数据具有四个属性，KPI，timestamp，value，label。比如说：

timestamp	value	label
0	1469376000	0.847300	0
1	1469376300	-0.036137	0
2	1469376600	0.074292	0
3	1469376900	0.074292	0
4	1469377200	-0.036137	0
…	…	…	…

但是论文具体用的是什么时间序列数据集并不清楚。

另外注意论文提到的数据的特点，如下图所示：

8.2.2 Donut 结构

相对于 VAE， Donut 把两个网络拆开展示，并且针对于时间序列数据使用了滑动窗口将序列数据转换成多组数据。然后根据把整个窗口数据进行重构。

8.2.3 缺失数据填充

论文使用 MCMC 与已进训练的 VAE 进行缺失数据填充，具体操作可以参考后面的内容。

8.2.4 对比实验

这些实验都使用了 VAE 、滑动窗口与重构概率。然后再添加其他技术，进行实验对比。值得一提的是，如果希望做这些对比实验的话，可以对 Donut 源码进行修改。

M-ELBO 对 VAE-baseline 的大部分改善作了贡献。它通过训练 Donut 来适应 $x$ 中可能的异常点，并在这种情况下产生期望的输出。虽然我们期望 M-ELBO 能够发挥作用，但我们并没有期望它能发挥这么好的作用。总之，虽然对于生成模型来说这是很自然的，但是仅仅使用正常数据来训练V AE进行异常检测并不是一个好的做法(§5.2)。据我们所知，M-ELBO 及其重要性在以前的工作中从未提到过，因此是我们的一项重大贡献。

Missing data injection （缺失的数据注入）是为了提高 M-ELBO 的效果而设计的，实际上也可以看作数据优化的一种方法。事实上，如果我们在训练时同时注入缺失数据和综合生成的异常数据，那效果将会更好。然而，生成与真实异常数据足够相似的数据比较困难，这应该是一个大主题，超出了本文的涉及范围。因此，我们只是注入缺失的点。缺失数据的注入对最优F-score的提高不是很明显，并且当 $\mathcal{B,C}$ 无标注时，效果只比只使用 M-ELBO 差一点点。这可能是因为注入给训练带来了额外的随机性，因此它需要更大的训练周期，与M-ELBO的情况相比。我们不确定在采用注入时要运行多少个epoch，为了得到一个客观的比较，因此我们在所有情况下都使用相同的epoch，而保持结果不变。我们仍然建议使用缺失数据注入，即使要花费更大的训练周期，因为它预计有很大的工作机会。

MCMC imputation 也被设计用来帮助 Donut 处理异常点。虽然只是在一些情况下 Donut 通过使用 MCMC 让 F-score 值得到了很大的优化，但是它绝对不会降低检测结果。根据文献[32]，这应该是预期的结果。因此，我们建议在检测中始终采用 MCMC。

8.3 论文与源码

本部分将结合源码进行分析论文。

8.3.1 损失函数

论文提出了不同于标准的 ELBO 的损失函数。

VAE 的标准损失函数 ELBO 公式如下：

而本文提出来的计算损失的函数公式为：

论文对此的解释在 3.2 节，总共有两个参数 $\alpha$ 与 $\beta$ ，为指示符， $\alpha_w = 1$ 表明 $x_w$ 不是异常，也不是缺失值。 $\beta$ 被定义为 $(\sum_{w=1}^{W}\alpha_w)/W$ 。通过 $\alpha_w$ 去除标记为异常或缺失值的 $p_\theta{(x_w|z)}$ 的影响，然后缩放因子 $\beta$ 根据 $x$ 中正常点所占的比重缩小 $p_\theta{(z)}$ 的贡献。

对应的源码部分在 model.py 文件中，具体地址为 https://github.com/NetManAIOps/donut/blob/master/donut/model.py

def get_training_loss(self, x, y, n_z=None):
    """
    Get the training loss for `x` and `y`.
    Args:
        x (tf.Tensor): 2-D `float32` :class:`tf.Tensor`, the windows of
            KPI observations in a mini-batch.
        y (tf.Tensor): 2-D `int32` :class:`tf.Tensor`, the windows of
            ``(label | missing)`` in a mini-batch.
        n_z (int or None): Number of `z` samples to take for each `x`.
            (default :obj:`None`, one sample without explicit sampling
            dimension)
    Returns:
        tf.Tensor: 0-d tensor, the training loss, which can be optimized
            by gradient descent algorithms.
    """
    with tf.name_scope('Donut.training_loss'):
        chain = self.vae.chain(x, n_z=n_z)
        x_log_prob = chain.model['x'].log_prob(group_ndims=0)
        alpha = tf.cast(1 - y, dtype=tf.float32)
        beta = tf.reduce_mean(alpha, axis=-1)
        log_joint = (
            tf.reduce_sum(alpha * x_log_prob, axis=-1) +
            beta * chain.model['z'].log_prob()
        )
        vi = VariationalInference(
            log_joint=log_joint,
            latent_log_probs=chain.vi.latent_log_probs,
            axis=chain.vi.axis
        )
        loss = tf.reduce_mean(vi.training.sgvb())
        return loss

其中，alpha 的计算就是得到 [0. 1. 0. 1. 1.] 这样的数列。

然后 tf.reduce_mean 用来计算异常的比重。beta 等于这个比重。特别值得一提的是，如果是无监督学习的话，也就是说把所有的 labels 设置为 0 的时候，那么很明显此时的代码中的 y = [0 0 …]，此时的 $\alpha$ =[1,1,1,1…]，而 $\beta$ 也等于1，也就是说，如果是无监督学习的话，那么整个 M-ELBO 就等于VAE的标准 ELBO。

另外特别需要注意的，如同源码注释一样，函数参数 $x$ 是一个二维数据，因为是一个 mini-batch 的训练方法，每次传入的数据都是若干批次数据，比如说如果每个批次传入 32 条数据，也就是 32 个窗口数据并且窗口大小为 120 的话，那么输入的 $x$ 的 shape 为 (32, 120)。当然，同样地，返回结果也是 32 组数据。

8.3.2 缺失数据填充

Donut 对数据的预处理包括两方面，一个是对 KPI value 的标准化，另外一个是缺失数据填充。都可以在 preprocessing.py 文件中找到源码。

缺失数据填充包括两部分，一个是时间戳，一个是 values。首先填充时间戳是非常容易的，根据顺序填充即可。而 values 的填充论文在 3.3 节解释了——即 基于 MCMC 和训练好的 VAE 的缺失数据填充技术 。关于这个技术的代码在后面重构概率的计算中介绍。

8.3.3 重构概率计算

重构概率计算关系到如何判定异常，或者说给数据进行异常值打分，然后再根据设定好的阈值判定异常。

1 首先查看一下 donut 的使用方法源码。

from donut import DonutTrainer, DonutPredictor

trainer = DonutTrainer(model=model, model_vs=model_vs)
predictor = DonutPredictor(model)

with tf.Session().as_default():
    trainer.fit(train_values, train_labels, train_missing, mean, std)
    test_score = predictor.get_score(test_values, test_missing)

特别关注最后一行，test_score = predictor.get_score(test_values, test_missing).

查看 model.py 文件，查看其中的 get_score 函数。

2 接着查看donut 的 prediction.py 文件，这里的 get_score 函数直接用于计算异常值。

def get_score(self, values, missing=None):
        """
        Get the `reconstruction probability` of specified KPI observations.
        The larger `reconstruction probability`, the less likely a point
        is anomaly.  You may take the negative of the score, if you want
        something to directly indicate the severity of anomaly.
        Args:
            values (np.ndarray): 1-D float32 array, the KPI observations.
            missing (np.ndarray): 1-D int32 array, the indicator of missing
                points.  If :obj:`None`, the MCMC missing data imputation
                will be disabled. (default :obj:`None`)
        Returns:
            np.ndarray: The `reconstruction probability`,
                1-D array if `last_point_only` is :obj:`True`,
                or 2-D array if `last_point_only` is :obj:`False`.
        """
        with tf.name_scope('DonutPredictor.get_score'):
            sess = get_default_session_or_error()
            collector = []

            # validate the arguments
            values = np.asarray(values, dtype=np.float32)
            if len(values.shape) != 1:
                raise ValueError('`values` must be a 1-D array')

            # run the prediction in mini-batches
            sliding_window = BatchSlidingWindow(
                array_size=len(values),
                window_size=self.model.x_dims,
                batch_size=self._batch_size,
            )
            if missing is not None:
                missing = np.asarray(missing, dtype=np.int32)
                if missing.shape != values.shape:
                    raise ValueError('The shape of `missing` does not agree '
                                     'with the shape of `values` ({} vs {})'.
                                     format(missing.shape, values.shape))
                for b_x, b_y in sliding_window.get_iterator([values, missing]):
                    feed_dict = dict(six.iteritems(self._feed_dict))
                    feed_dict[self._input_x] = b_x
                    feed_dict[self._input_y] = b_y
                    b_r = sess.run(self._get_score(), feed_dict=feed_dict)
                    collector.append(b_r)
            else:
                for b_x, in sliding_window.get_iterator([values]):
                    feed_dict = dict(six.iteritems(self._feed_dict))
                    feed_dict[self._input_x] = b_x
                    b_r = sess.run(self._get_score_without_y(),
                                   feed_dict=feed_dict)
                    collector.append(b_r)

            # merge the results of mini-batches
            result = np.concatenate(collector, axis=0)
            return result

需要注意的是，当查看源码的时候，发现其真真正正用于计算每个窗口数据的重构概率的也并不在这个文件中，而是在 model.py 文件中。这里只是对流数据进行窗口化处理。

3 查看 model.py 文件，关注其中的 get_score 函数。函数用于计算单个窗口的重构概率，可以选择返回窗口中每个数据的重构概率，也可以选择返回窗口中最后一个点的重构概率。

这个作为重中之重，我添加了一些注释。

def get_score(self, x, y=None, n_z=None, mcmc_iteration=None,
                  last_point_only=True):
        """
        Get the reconstruction probability for `x` and `y`.
        The larger `reconstruction probability`, the less likely a point
        is anomaly.  You may take the negative of the score, if you want
        something to directly indicate the severity of anomaly.
        Args:
            x (tf.Tensor): 2-D `float32` :class:`tf.Tensor`, the windows of
                KPI observations in a mini-batch.
            y (tf.Tensor): 2-D `int32` :class:`tf.Tensor`, the windows of
                missing point indicators in a mini-batch.
            n_z (int or None): Number of `z` samples to take for each `x`.
                (default :obj:`None`, one sample without explicit sampling
                dimension)
            mcmc_iteration (int or tf.Tensor): Iteration count for MCMC
                missing data imputation. (default :obj:`None`, no iteration)
            last_point_only (bool): Whether to obtain the reconstruction
                probability of only the last point in each window?
                (default :obj:`True`)
        Returns:
            tf.Tensor: The reconstruction probability, with the shape
                ``(len(x) - self.x_dims + 1,)`` if `last_point_only` is
                :obj:`True`, or ``(len(x) - self.x_dims + 1, self.x_dims)``
                if `last_point_only` is :obj:`False`.  This is because the
                first ``self.x_dims - 1`` points are not the last point of
                any window.
        """
        with tf.name_scope('Donut.get_score'):
            # MCMC missing data imputation
            ## 如果存在缺失值，并且选择使用 mcmc 填充
            ## x_r 即对数据 x 的重构数据
            if y is not None and mcmc_iteration:
                x_r = iterative_masked_reconstruct(
                    reconstruct=self.vae.reconstruct,
                    x=x,
                    mask=y,
                    iter_count=mcmc_iteration,
                    back_prop=False,
                )
            else:
                x_r = x

            # get the reconstruction probability
            ## 传入 x_r 到 变分网络 q_net
            q_net = self.vae.variational(x=x_r, n_z=n_z)  # notice: x=x_r
            ## 传入隐变量 z 和 x 到生成网络 p_net
            p_net = self.vae.model(z=q_net['z'], x=x, n_z=n_z)  # notice: x=x
            # 计算重构概率
            r_prob = p_net['x'].log_prob(group_ndims=0)
            
            if n_z is not None:
                n_z = validate_n_samples(n_z, 'n_z')
                assert_shape_op = tf.assert_equal(
                    tf.shape(r_prob),
                    tf.stack([n_z, tf.shape(x)[0], self.x_dims]),
                    message='Unexpected shape of reconstruction prob'
                )
                with tf.control_dependencies([assert_shape_op]):
                    r_prob = tf.reduce_mean(r_prob, axis=0)
            if last_point_only:
                r_prob = r_prob[:, -1]
            return r_prob

4 最后看一下重构函数，也就是 reconstruction.py 文件，这个文件其他地方都比较容易理解，重点关注最后的几行。

其中的 iter_count 是传入的整数，迭代次数，masked_reconstruct 是定义在该 py 文件的函数，

# do the masked reconstructions
x_r, _ = tf.while_loop(
    lambda x_i, i: i < iter_count,
    lambda x_i, i: (masked_reconstruct(reconstruct, x_i, mask), i + 1),
    [x, tf.constant(0, dtype=tf.int32)],
    back_prop=back_prop
)

可以把那两行 lambda 理解为：

while(i < iter_count):
    x_i = masked_reconstruct(reconstruct, x_i, mask)
    i = i + 1
return x_i,i

tf.while_loop 执行的也就是上面的这些代码的意思。

8.3.4 训练

训练相关代码都在 training.py 文件中，内容比较多，这里不附加所有源码了，请自行查看。

特别需要介绍的是这个 DonutTrainer 类的参数，因为在实际使用的时候可以考虑调参优化的时候，可以参考这些内容。

model：比如 Donut 模型，总之是训练对象，是一种 VAE 模型。
model_vs：其中的 vs 可以认为是 variables space 的缩写，即模型相关的可优化参数空间。如果指定了，将会只在这个空间内收集可优化参数；如果为空的话，将会收集训练过程中所有的可优化参数。
n_z：即 Donut 模型隐变量的个数。

8.4 论文勘误

论文存在几个小小问题，当然，也有可能是因为我是从 arxiv 网站上下载的有关，论文中提到的图片与实际图片不符。在 4.5 节的时候，提到的图9 和图10 弄反了。

8.5 总结

论文还有更多内容这里都没有提到，希望伙伴们都可以去看一下。这里主要是基于源码进行简单的分析，把最容易困扰的地方说明一下，既作为自己论文阅读与实验的笔记，也希望能帮助到更多人。如果有任何疑问或者觉得本文应该补充的地方，请留言说明，感谢！

Smileyan
2021.1.10 21:50
最后更新：2021.1.28 10:41

感谢您的点赞、收藏、评论与关注

pytorch正向传播没问题，loss.backward()使定义的神经网络中权重参数变为nan 加速却甩不掉伤悲 pytorch 神经网络人工智能
记录一个非常坑爹的bug:loss回传导致神经网络中一个linear层的权重参数变为nan1.首先loss值是正常数值；2.查了好多网上的解决办法：检查原始输入神经网络数据有没有nan值，初始化权重参数，使用relu激活函数，梯度裁剪，降低优化器的学习率等等都没解决，个人认为这些应该影响不大，一般不会出问题；3.最后是使用如下异常检测：检测在loss回传过程中哪一块出现了问题torch.autog
工信教考 | AI智能体应用工程师（模拟试题）人工智能-猫猫人工智能开源自然语言处理语言模型架构
关于AI智能体工程师的模拟试题，下面根据AI智能体工程师所需掌握的知识和技能，设计一些模拟题型的示例。这些题目旨在考察应试者在人工智能、机器学习、深度学习、算法设计、系统开发等方面的能力。一、选择题无监督学习常用于哪些任务？（单选）A.回归分析B.聚类分析C.分类预测D.序列预测答案：B解析：无监督学习常用于聚类、降维、异常检测等任务，如市场分割、数据可视化等。以下哪种激活函数常用于分类问题的输出
数据分析-13-时间序列异常值检测的类型及常见的检测方法皮皮冰燃数据分析数据分析
参考时间序列异常值的分类及检测参考异常值数据预警分析1时间序列异常的类型时间序列异常检测是数据处理和分析的重要环节，广泛应用于量化交易、网络安全检测、自动驾驶汽车和大型工业设备日常维护等领域。在时间序列数据中，异常通常指的是与正常数据模式显著不同的数据点，可能由系统故障、错误或外部干扰引起。异常数据，也称为离群点，是指在数据集中与其他数据点明显不同的样本。这些数据点往往不符合预期的模式或行为，可能
【大数据】孤立森林算法大雨淅淅大数据算法 python 大数据人工智能
目录一、孤立森林算法概述二、孤立森林算法优缺点和改进2.1孤立森林算法优点2.2孤立森林算法缺点2.3孤立森林算法改进三、孤立森林算法代码实现3.1孤立森林算法python实现3.2孤立森林算法JAVA实现3.3孤立森林算法C++实现四、孤立森林算法应用一、孤立森林算法概述孤立森林算法是一种用于异常检测的机器学习算法。它基于这样的直觉：异常点是数据中的少数派，它们在特征空间中的分布与正常数据点不同
基于STM32的工厂安全监测系统：采用FreeRTOS、MQTT协议、InfluxDB存储与Grafana可视化，实现实时数据监测与异常检测算法优化的综合解决方案（代码示例）极客小张 stm32 安全 grafana 算法物联网 c++异常检测算法
一、项目概述项目目标与用途随着工业自动化的不断推进，工厂的安全问题成为了企业管理者关注的重点。工厂中的温度、湿度、气体浓度、烟雾、压力等环境参数直接影响着生产的安全性和产品的质量。本项目旨在设计并实现一个嵌入式工厂安全监测系统，实时监测工厂环境中的关键安全参数，通过无线通信模块将数据传输到云端进行存储和分析，从而实现对工厂环境的智能化监控和预警。项目解决的问题与价值实时监测：实时采集工厂内的温度、
电力行业电气领域相关数据集下载地址汇总输电线路变电站电网应用数据集汇总(全网最全) FL1623863129 数据集目标检测
在电力行业电气领域，数据集扮演着至关重要的角色。这些数据集涵盖了从发电到用电的各个环节，包括输电线路图像、变电站监测、电力负荷预测等多样化内容。例如，输电线路图像数据集通过无人机或直升机拍摄，包含了杆塔、绝缘子、导线等详细图像，为目标检测、分类和异常检测提供了丰富的素材。此外，还有针对变电站烟火检测、导线破损检测等特定任务的数据集，这些数据集通过收集实际场景中的图像和视频，帮助研究人员训练更加精准
周报 | 24.8.12-24.8.18文章汇总双木的木深度学习拓展阅读深度学习人工智能 transformer 算法 python stable diffusion llama
为了更好地整理文章和发表接下来的文章，以后每周都汇总一份周报。周报|24.8.5-24.8.11文章汇总-CSDN博客OpenCV与AI深度学习|实战|使用YoloV8实例分割识别猪的姿态（含数据集）-CSDN博客极市平台|异常检测开源数据集汇总-CSDN博客程序员学长|快速学习一个算法，集成学习-CSDN博客Coggle数据科学|行业落地分享：大模型RAG汽车应用实践_rag中的意图识别-CSD
异常GPT：使用LVLMs检测工业异常 DUT_LYH gpt 人工智能算法
AnomalyGPT：利用LVLMs进行工业异常检测摘要本文介绍了一种名为AnomalyGPT的新型工业异常检测方法，该方法基于大型视觉语言模型(LVLMs)。AnomalyGPT能够检测并定位图像中的异常，无需手动设置阈值。此外，AnomalyGPT还可以提供与图像相关的详细信息，以交互方式与用户进行交流。本文详细阐述了AnomalyGPT的模型架构、解码器、提示学习器以及异常模拟方法，并在Vi
基于极限树特征递归消除和LightGBM的异常检测模型宋罗世家技术屋信息资源管理与发展专栏算法 python
摘要入侵检测数据维数大、数据样本不均衡、数据集分散性大的问题严重影响分类性能,为了解决该问题,文章提出基于极限随机树的特征递归消除（ExtraTrees-RecursiveFeatureElimination,ET-RFE）和LightGBM（LGBM）的入侵检测方法。首先对网络数据进行独热编码重构,在数据级层面均衡少量样本的攻击类别;其次,使用基于ET-RFE对流量特征进行降维处理,寻找含有信息
探索LightGBM：监督式聚类与异常检测 Echo_Wish Python 笔记 Python算法聚类数据挖掘机器学习
导言监督式聚类和异常检测是在监督学习框架下进行的一种特殊形式的数据分析技术。在Python中，LightGBM提供了一些功能来执行监督式聚类和异常检测任务。本教程将详细介绍如何使用LightGBM进行监督式聚类和异常检测，并提供相应的代码示例。监督式聚类监督式聚类是一种将聚类任务结合到监督学习框架中的技术。LightGBM提供了一种基于决策树的监督式聚类方法。以下是一个简单的示例：importli
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试 deephub llama 深度学习时间序列基础模型
2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源基础模型:laglllama。在原论文《Lag-Llama:TowardsFoundationMo
基于UI交互意图理解的异常检测方法美团测试
美团到店平台技术部/质量工程部与复旦大学周扬帆教授团队开展了科研合作，基于业务实际场景，自主研发了多模态UI交互意图识别模型以及配套的UI交互框架。本文从大前端质量保障领域的痛点出发，介绍了UI交互意图识别的方法设计与实现。基于UI交互意图编写的测试用例在实际业务中展现出了可以跨端、跨App的泛化能力，希望可以为从事相关工作的同学带来一些启发或帮助。1.背景近年来，随着美团多种业务线的扩充和迭代，
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试人工智能深度学习python
2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源基础模型:laglllama。在原论文《Lag-Llama:TowardsFoundationMo
异常检测-基于统计学的方法-学习笔记-2 Rank_Fan007
异常检测的学习笔记并非原创，而是搜索各位大佬的帖子整理而得。如有冒犯，请联系我。1.概述统计学⽅法对数据的正常性做出假定。它们假定正常的数据对象由⼀个统计模型产⽣，而不遵守该模型的数据是异常点。异常检测的统计学⽅法的⼀般思想是：学习⼀个拟合给定数据集的⽣成模型，然后识别该模型低概率区域中的对象，把它们作为异常点。根据如何指定和学习模型，异常检测的统计学⽅法可以划分为两个主要类型：参数⽅法和⾮参数⽅
Deep Learning for Anomaly Detection: A Review（翻译） appron 入侵检测异常检测网络攻击检测
前言一、引言二、异常检测：问题的复杂性和挑战1.主要问题复杂性2.深度异常检测所面临的主要挑战三、用深度异常检测应对挑战1.预备工作2.深度异常检测方法的分类四.深度学习的特征提取1.预训练模型2.特定的特征提取模型五.学习常态的特征表征(特征提取器即分类器，即时连接同步训练的特征提取器和分类器)1.通用规范特征学习1.1自动编码器。(特征提取器即分类器）1.2生成对抗网络。(AnoGAN,f-A
ICCV 2023 | 腾讯优图16篇论文入选！轻量级主干、异常检测和扩散模型等方向 Amusi（CVer）
点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>【计算机视觉和论文写作】交流群来源：腾讯优图实验室作为全球计算机领域顶级的学术会议之一，ICCV2023（InternationalConferenceonComputerVision）国际计算机视觉大会将于今年10月在法国巴黎举行。近日，ICCV公布了论文录用结果，本届会议共有8068篇投稿，接收率为26.8%。今年
ICCV 2023 | 8篇论文看扩散模型diffusion用于图像检测任务：动作检测、目标检测、异常检测、deepfake检测... 机器学习与AI生成创作目标检测人工智能计算机视觉
1、动作检测DiffTAD:TemporalActionDetectionwithProposalDenoisingDiffusion基于扩散方法提出一种新的时序动作检测（TAD）算法，简称DiffTAD。以随机时序proposals作为输入，可以在未修剪的长视频中准确生成动作proposals。从生成建模的视角，与先前的判别学习方法不同。首先将真实proposals从正向扩散到随机proposa
智能运维哪些算法？智能运维包含哪些云呐AIOps 智能运维 AIOps 运维管理系统运维
在智能运维领域，详细介绍一些关键的算法，并阐述这些算法是如何被应用于智能运维系统中的。此外，关于智能运维中包含的主要组成部分或功能模块，以及它们各自的作用和重要性。如何应用再场景中应用在智能运维行业，一些关键算法包括：机器学习算法：如决策树、随机森林、svm算法等，从历史数据中学习方法和规律，预测未来的特点和故障。在智能操作和维护系统中，这些算法被应用于故障预测、异常检测、资源调度等方面，以帮助操
NeurIPS 2023 时间序列相关论文总结 STLearner 大数据智慧城市 pytorch 数据挖掘论文阅读深度学习
祝大家中秋国庆双节快乐！NeurIPS2023将于11月28日到12月9日在美国路易斯安那州新奥尔良举行。根据官方公布的邮件显示，今年共有12343篇投稿，接受率为26.1%，官网显示一共有3564篇论文。本文总结了NeurIPS23时间序列（不含时空数据，已经另外总结）的相关论文。包括时间序列预测，分类，异常检测，因果发现，交通，医疗等领域时间序列应用和大模型在时间序列问题建模的探索等方向。1.
WWW 2024 | 时间序列（Time Series）和时空数据（Spatial-Temporal）论文总结 STLearner 时空数据人工智能机器学习深度学习数据挖掘智慧城市论文阅读
WWW2024已经放榜，本次会议共提交了2008篇文章，researchtracks共录用约400多篇论文，录用率为20.2%。本次会议将于2024年5月13日-17日在新加坡举办。本文总结了WWW2024有关时间序列（TimeSeries）和时空数据（Spatial-Temporal）的相关文章，部分挂在了arXiv上。时间序列Topic：时序预测，异常检测，时域频域，大模型等时空数据Topic
梯度提升树系列6——GBDT在异常检测领域的应用 theskylife 数据挖掘机器学习数据挖掘 GBDT 分类 python
目录写在开头1异常检测的基本概念1.1定义和目标1.2GBDT在异常检测中的适用性2信用卡欺诈检测案例分析2.1场景介绍2.2收集数据和特征工程2.3进行异常值识别2.4模型效果评估2.5模型优化3策略和技巧4面临的挑战和解决方案4.1数据不平衡4.2过拟合4.3模型解释性写在最后在如今数据驱动的时代，异常检测成为了保障系统安全的关键技术，尤其在金融安全、网络安全等领域中扮演着至关重要的角色。梯度
时间序列异常检测论文TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate Time Series Data 蛐蛐蛐 transformer 深度学习人工智能
由于工作需要，想用一下这篇论文的方法，但感觉其代码还是有很多不清除的地方，简单总结一下。关于论文的内容介绍，可以参考：【VLDB】融合transformer和对抗学习的多变量时间序列异常检测算法TranAD论文和代码解读-知乎说得比较清楚了，我就不重复了。但是读代码的时候还是有很多不明白的地方。这里以Data文件夹下的SWaT数据集为例进行分析。首先，打开train.xlsx，可以看到就是两个me
Python报No such file or directory: ‘science‘的解决方法蛐蛐蛐 Python技巧论文点评 python 开发语言
接上一篇博文：时间序列异常检测论文TranAD:DeepTransformerNetworksforAnomalyDetectioninMultivariateTimeSeriesData-CSDN博客还是想看看这篇论文的可视化结果。但是当我重新运行原版代码的时候，会报错：FileNotFoundError:[Errno2]Nosuchfileordirectory:'science'Theabo
Wazuh功能——异常和恶意软件检测 Threathunter
异常检测是指在系统中发现与预期行为不匹配的模式的行为。一旦恶意软件(例如rootkit)安装在系统上，它就会修改系统以隐藏自己，不让用户看到。尽管恶意软件使用多种技术来实现这一点，Wazuh却使用了一种广谱的方法来发现异常模式，表明可能存在入侵者。负责这项任务的主要组件是rootcheck，然而，Syscheck也扮演着重要的角色。一、怎样工作1、文件完整性监测恶意软件可以替换其主机系统上的文件、
【人工智能】神奇的Embedding：文本变向量，大语言模型智慧密码解析(10) 魔道不误砍柴功 AI 大模型人工智能 embedding 语言模型
什么是嵌入？OpenAI的文本嵌入衡量文本字符串的相关性。嵌入通常用于：Search搜索（结果按与查询字符串的相关性排序）Clustering聚类（文本字符串按相似性分组）Recommendations推荐（推荐具有相关文本字符串的条目）Anomalydetection异常检测（识别出相关性很小的异常值）Diversitymeasurement多样性测量（分析相似性分布）Classificatio
Arxiv网络科学论文摘要15篇(2020-10-21) ComplexLY
考虑拓扑的图池化网络;因果网络模体：识别A/B测试中的异构溢出效应;关系事件模型与逆强化学习之间的联系，用于表征群体互动序列;不能通过外表来判断用户：了解社交媒体研究中多模式处理中的危害;气候讨论中推文的传播;目标路网中断导致的级联故障;通过基于订阅的频道嵌入来理解YouTube社区;鲁棒的异步和独立于网络的合作学习;通过学习和预测行为进行早期异常检测;Heider与协同演化平衡：从离散到连续相变
基于LLM的数据漂移和异常检测新缸中之脑 LLM
大型语言模型(LLM)的最新进展被证明是许多领域的颠覆性力量（请参阅：通用人工智能的火花：GPT-4的早期实验）。和许多人一样，我们非常感兴趣地关注这些发展，并探索LLM影响数据科学和机器学习领域的工作流程和常见实践的潜力。在我们之前的文章中，我们展示了LLM使用Kaggle竞赛中的表格数据提供预测的潜力。只需很少的努力（即数据清理和/或功能开发），我们基于LLM的模型就可以在几个竞赛参赛作品中获
京东数据分析岗面试题目整理 Data地平线
1，怎么做恶意刷单检验分类问题用机器学习方法建模解决，特征有：1）商家特征：商家历史销量、信用、产品类别、发货快递公司等2）用户行为特征：用户信用、下单量、转化率、下单路径、浏览店铺行为、支付账号3）环境特征（主要是避免机器刷单）：地区、ip、手机型号等4）异常检测：ip地址经常变动、经常清空cookie信息、账号近期交易成功率上升等5）评论文本检测：刷单的评论文本可能套路较为一致，计算与已标注评
2-5 异常检测 Anomaly detection with robust deep autoencoders 笔记 Siberia_
一、基本信息题目：Anomalydetectionwithrobustdeepautoencoders 期刊/会议：ACMSIGKDD 发表时间：2017年引用次数：26二、论文总结2.1研究方向提高自编码模型的抗噪声能力2.2写作动机受鲁棒PCA的启发，将原始数据分成正常数据和噪声、异常数据两部分，然后进行交替训练。2.3创新之处除了使用传统的L1正则化去约束噪声部分之外
[Python] 什么是KMeans聚类算法以及scikit-learn中的KMeans使用案例老狼IT工作室 python 机器学习 python scikit-learn
什么是无监督学习？无监督学习是机器学习中的一种方法，其主要目的是从无标签的数据集中发现隐藏的模式、结构或者规律。在无监督学习中，算法不依赖于任何先验的标签信息，而是根据数据本身的特征和规律进行学习和推断。无监督学习通常用于聚类、降维、异常检测等任务。在聚类中，算法会将相似的数据点归为一类；在降维中，算法会将高维数据映射到低维空间；在异常检测中，算法会发现与其他数据不同的离群点。无监督学习是与有监督
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class