樱花的浪漫

Learning Normal Dynamics in Videos with Meta Prototype Network详解及论文精读

论文地址:https://openaccess.thecvf.com/content/CVPR2021/html/Lv_Learning_Normal_Dynamics_in_Videos_With_Meta_Prototype_Network_CVPR_2021_paper.html

1.视频异常行为检测任务简介

什么是异常行为呢？

除了正常的，其他都是异常（并不对异常做明确规定），例如：校园里突然开出一辆车，马路上窜出个野猪（但凡不常规的都是异常）

数据集介绍

Avenue，UCSD Ped等，异常主要是跑，车等行为。

特点：

通常数据集中都是正样本，负样本（异常）很少

基本都是固定位置的，背景相对不变，前景（人）变化差异较大

标注信息很少，导致了这行很多任务都得靠无监督方法来做

跨域任务很难，场景基本定死了，拓展比较费劲

基本套路

无监督方法多一些，训练样本都是正常情况

将视频数据切帧，构建成序列（x1,x2,x3,x4），预测下一帧(x5)

如果下一帧是正常情况，那应该预测的不错（训练数据都是正常的）

如果下一帧是异常情况，那它应该预测的不咋地（没见到，整不出来）

基本思想

输入的是一个序列，预测下一帧的图像，正常的做的和GT很像，异常的做的就开始模糊。

通过预测和GT的差异来描述异常（PSNR，信噪比越高表示越正常）

如何预测呢？

其实就是生成下一帧图像，基于GAN的，AE的都可以，融入注意机制的，各种模块都可以

Learning Normal Dynamics in Videos with Meta Prototype Network详解及论文精读_第5张图片

但是最大的问题是，无论是CNN还是transformer等现在主流模块都能力太强了！太强就是，即便是异常的行为，也能预测的非常好（泛化能力太强），而我们需要的是对于异常行为不能预测出下一帧的图像，最少不能预测得特别好。（因为训练样本全是正样本）。

论文部分

Abstract

基于自动编码器（AE）的帧重构（当前或未来帧）是一种常用的视频异常检测方法。在正常数据上训练模型时，异常场景的重构误差通常比正常场景大得多。以往的方法将记忆库引入AE，用于在训练视频中编码不同的正常模式。然而，它们会消耗内存，并且无法处理测试数据中看不到的新场景。在这项工作中，我们提出了一个动态原型单元（DPU）来编码正常的动态为实时的原型，没有额外的内存成本。此外，我们在DPU中引入了元学习，以形成一个新的少样本学习器，即元原型单元（MPU）。它只消耗几次更新，就可以在新场景上实现快速适应能力。在各种基准上进行了广泛的实验。优于最先进的性能证明了我们的方法的有效性。

1. Introduction

视频异常检测（VAD）是指识别不符合期望[2,3,5,28]的行为或外观模式。然而，“异常”在概念上是无限的，而且往往是模棱两可的，因此无法收集各种可能的异常的数据。因此，异常检测通常被表述为一个无监督的学习问题，目的是学习一个模型，以只利用正常数据的规则模式。在推理过程中，与编码的规则模式不一致的模式被认为是异常模式。

深度Auto-Encoder（AE）[38]是一种流行的视频异常检测方法。研究人员通常采用AEs用历史帧建模正常模式，重建当前帧[11,31,39,4,40,1]或预测即将到来的帧[22,34,24,26,10]。为简单起见，我们将这两种情况称为帧预测。由于模型只用正常数据进行训练，因此对异常（看不见的模式）输入的预测误差预计会比正常对应的数据更高。以前，许多方法都是基于这一假设进行异常检测的。然而，这个假设并不总是正确的。

一方面，现有的方法依赖于大量的正常训练数据来模拟共享的正常模式。这些模型容易面临“过度泛化”的困境，由于卷积神经网络（CNNs）[37,10]具有强大的表征能力，所有的视频帧无论是正常还是不正常，都可以很好地预测。[37,10]提出的方法是用记忆库明确地模拟正常训练视频的共享正常模式，以在抑制非正常区域的同时增强帧内正常区域的预测。然而，将正常模式作为存储在整个训练集上的记忆项目是非常消耗内存的。

为了解决这一限制，我们建议以一种注意的方式来编码正常的动态，这被证明在表示学习和增强[46,20,13]中是有效的。一个正常的学习器，被称为Dynamic Prototype Unit（DPU），被开发成很容易地并入AE主干。它以连续的正常帧的编码作为输入，然后学习挖掘不同的正常动态作为紧凑的原型。更具体地说，我们在AE encoding map上应用了一种新的注意操作，它为每个像素位置分配一个正态权值，形成一个正态映射。然后，在正态权值的指导下，得到原型作为局部编码向量的集合。应用多个并行注意操作来生成一个原型池化。利用所提出的紧凑性和发散性特征重构损失函数，训练原型项目以端到端方式表示共享的正常模式的多样性和紧凑的动态。最后，将AE编码映射与原型重构的规范化编码进行聚合，用于后一帧预测。

另一方面，在不同场景中出现的正常模式是不同的。作者使用元学习来解决这个问题。在少样本设置中，在训练过程中可以访问来自多个场景的视频，并且在推理过程中可以访问一些来自目标场景的视频帧。解决这个问题的一个方法是使用元学习。在这个元训练阶段，训练少样本目标模型，以几帧和参数更新迭代适应新的场景。使用来自不同场景的视频数据重复进行该过程，以获得模型初始化，作为快速适应新场景的良好起点。因此，我们将DPU模块表示为一个少样本正态学习器，即元原型单元（MPU），目的是学习目标场景中的常态。我们没有通过调整整个网络的[25]来大致转移到新的场景，这可能会导致“过度泛化”的问题，我们建议冻结预先训练的AE，只更新我们的MPU的参数。我们的元学习模型只需要少量参数和更新迭代，具有快速有效地适应未知场景常态的能力。我们的方法的概述如图1所示。

我们总结了我们的贡献如下： i)我们开发了一个Dynamic Prototype Unit (DPU) （DPU），用于学习将正常数据的不同和动态模式表示为原型。因此，设计了一个注意力操作来聚合正常的动态，以形成原型item。整个过程是可区分的和端到端训练的。ii)我们将元学习引入我们的DPU，并将其作为少样本正态学习器（MPU）进行改进。通过只消耗少量参数和更新迭代，有效地赋予了模型快速自适应能力。iii)我们的基于DPU的AE在各种无监督异常检测基准上实现了新的最先进的（SOTA）性能。此外，实验结果验证了我们的MPU在少样本设置下的自适应能力。

2. Related Work

Anomaly Detection. 由于缺乏异常数据和昂贵的注释成本，视频异常检测已被制定为几种类型的学习问题。例如，无监督设置假设只有正常的训练数据[19,27,23]，而弱监督设置可以访问带有视频级标签[43,53,28]的视频。

近年来，许多方法利用深度自动编码器（AE）对规则模式进行建模和重建视频帧[11,31,39,4,40,1]。这方面有许多优异的工作。然而，这种方法存在“过度泛化”的问题，有时异常帧也可以很好地预测正常（即小的预测误差）。

为了适应测试场景，Park等人[37]通过使用阈值进一步扩展了内存库的更新规则，以区分异常帧并记录正常模式。然而，在不同情况下，不可能找到统一的最优阈值来区分正常和异常帧。相反，我们在DPU模块中引入了元学习技术，使其能够快速适应新的场景

Attention Mechanisms. 注意机制在许多计算机视觉任务中被广泛应用。目前的方法大致可以分为两类，即通道注意和空间注意。大多数先前的注意力模块都集中于优化特征学习和增强的主干。我们提出利用注意机制来度量空间局部编码向量的正一性，并利用它们来生成编码正常行为部分的原型item。

Few-Shot and Meta-learning. 在少样本学习中，研究人员的目标是模仿人类的快速和灵活的学习能力，这可以快速适应一个新的场景，只有少数数据例子[18]。一般来说，元学习技术都是为了解决这个问题而开发出来的。方法主要分为三类：基于指标的[17,47,44]、基于模型的[41,33]和基于优化的方法[8]。这些方法可以在参数优化过程中通过多个任务之间的元更新方案快速适应新任务。然而，上述的大多数方法都是为图像分类等简单的任务而设计的。最近，Lu等人[25]遵循了基于优化的元学习方法[8]，并将其应用于训练一个场景自适应异常检测的模型。他们简单地将整个网络设置为元学习的少量目标模型，用于学习整个模型的初始化参数集。然而，在这项工作中，我们学习了两组初始参数，并分别更新步长，以详细的更新以更少的参数设计的模块和更新迭代。

3. Method

3.1. Dynamic Prototype Unit

基于DPU-based AE的框架如图2所示。DPU被训练学习和压缩实时序列信息的正常动态作为多个原型，并用正常动态信息丰富输入AE编码。注意，DPU可以插入AE的不同位置（不同的分辨率）。

让我们首先考虑一个AE模型，将T个观察到的视频帧作为输入，简化为 $x_{k}$ 。然后将所选择的AE隐藏编码前馈到我们的DPU 。最后，DPU的输出编码通过剩余的AE层（在DPU之后）运行，以预测即将到来的地面真实帧。我们将帧序列表示为第k个矩的输入和输出对。

DPU的前向传递是通过以完全可微的注意方式生成一个动态原型池，然后通过检索原型重构一个规范化编码，最终将输入编码聚合为规范化编码作为输出。整个过程可以分为3个子过程，即Attention, Ensemble 和 Retrieving。

具体地说，首先从AE中提取第t个输入编码映射，进行维度变换，调整为通道数为c,序列长度为N=h*w的向量。在Attention（注意）的子过程中，使用大量的注意映射函数对编码向量分配归一化权值。在每个像素位置上，归一化权值测量编码向量的正态范围。这里，表示由第m个注意函数生成的第m个归一化函数特征图。然后在Ensemble（集合）进行对N个编码向量经过归一化的权重加权，推导出唯一的原型向量。

类似地，M个原型由多个注意函数衍生出来，形成一个原型池。

最后，在Retrieving（检索）子过程中，取自AE编码特征图中的输入编码向量作为查询，检索原型池中的相关项，重构归一化编码。对于每个获得的编码向量，这为：

其中，表示第n个编码向量与第m个原型item之间的相关得分。将得到的归一化特征图与原始编码X聚合作为最终输出。其关键思想是利用正常信息丰富AE编码，在抑制异常部分的同时，提高对视频帧正常部分的预测。DPU的输出编码通过剩余的AE层进行以后的帧预测。

3.2. VAD Objective Functions

在本节中，我们将介绍管道中的目标函数，它使用于规一化动态表示的原型学习，用于规范化增强编码的特征重构，以及用于异常检测的帧预测。为了训练我们的模型，总体损失函数L由一个特征重建项和一个帧预测项组成。这两个项由权重λ1平衡如下：

帧预测损失表示为地面真实 $y_{t}$ 与网络预测 $\hat{y_{t}}$ 之间的L2距离：

特征重构损失是为了使学习到的正常原型具有紧凑性和多样性的特性。它有两个术语 $L_{c}$ 和 $L_{d}$ ，分别针对这两个属性，并被写成：

其中，λ2为权重参数。紧性项 $L_{c}$ 是用于用紧性原型重构规范编码。它测量输入编码向量及其最相关的原型的平均l2距离为：

其中，为等式中提到的相关分数，argmax仅用于获取最相关向量的索引，而不参与反向传播。我们通过将学习到的原型相互远离，进一步促进了原型item之间的多样性。多样性术语Ld表示为：

在这里，γ控制原型之间的期望的边际。利用上述两个术语的好处，鼓励原型项目编码紧凑和多样的正常动态的正常帧预测

3.3. Meta-learning in Few-shot VAD

一般情况下，AEs以连续的视频帧作为输入，重建当前帧或预测后续帧。在这项工作中，我们将重点关注后一种范式。我们首先考虑一个表示为的VAD架构，其中η，δ分别表示AE编码/解码函数E，D的参数。所设计的模型以一系列帧样本x作为输入。然后将AE编码的输入DPU模块Pτ。DPU在参数集τ下对连续视频帧中的归一化动态信息进行编码。我们的少样本目标模型，即元原型单元（MPU），包括主模块DPU和AE解码器，参数集为θ = τ∪δ。以后续的帧样本y为地面真实值，根据上面定义的目标函数对目标模型进行更新。该过程被表示为具有帧对（x，y）的更新函数U。

在推理过程中，测试视频的普通短片段可以在VAD的少样本设置中调整模型到新的场景。为了模拟这种适应过程，在训练阶段实施了元训练策略。在元训练中，采用良好的初始化θ0，使目标模型从θ0开始，应用一次或几次更新函数U的迭代，能够在有限的情况下快速适应数据样本的新场景。我们采用了由α参数化的梯度下降式更新函数[21,36]。然后将函数U表述为：

L是设计的损失函数，对于目标模型。⊙表示元素级的乘积。α是控制一个更新迭代的步长的参数，它被设置为与参数集θ相同的大小。

为了保证场景自适应的鲁棒性，在元演演过程中，根据一个场景中不同输入输出对的误差信号对目标模型进行更新和监督。关键的思想是，目标模型也应该推广到同一场景中的其他帧，而不仅仅是模型被训练过的几个帧。给定一个正常视频的随机输入输出对，初始化θ0的目标模型的一个更新步骤为：

经过T更新迭代，得到了场景适应的模型参数θˆ。我们将T一轮更新迭代表示为一个插曲。将一集中的迭代次数T设置为1，以保证快速适应能力。然后，我们使用θˆ评估模型，通过在与相同的场景中通过随机采样的输入输出对运行网络，以最小化场景误差信号。

应用梯度函数的梯度算法计算上述目标函数的梯度，得到良好的初始化模型θ0∗，并将步长α∗更新为：

3.4. Video Anomaly Detection Pipeline

我们首先解释整个网络架构的细节，以及异常分数是如何产生的。然后，我们描述了我们的框架的训练和测试阶段。

Network Architecture Details. 我们的框架被实现为一个单个的端到端网络，如图2所示。我们在[22,37]中采用相同的网络架构作为AE的主干，以方便一个公平的比较。在DPU模块中，M注意映射函数实现为全连接层，生成一系列规范化映射，并进一步形成动态原型池。通过AE解码器提出DPU的输出编码进行帧预测。此外，DPU模块是作为几个镜头学习者的元训练，即元原型单元（MPU）。详情请解释如下。

Anomaly Score. 为了更好地量化推理过程中视频帧的异常程度，我们研究了特征重建和帧预测的两种线索。因为动态原型池中的正常动态项目被学习来编码正常编码的紧凑表示，如在等式中5、在推理过程中，通过测量特征重构项的紧性误差为：，可以自然地得到异常得分。Xt和Pt分别表示第t次矩的输入编码图和动态原型池。与以前的方法[22,10,37]一样，帧预测误差也被用作异常描述符：。因此，我们得到了以上两种异常得分，并将其与平衡权重λs组合为：。

Training Phase. 在元训练之前，首先只使用帧预测损失.然后，在一个元训练事件中，我们从一个视频中随机抽取K个双输入输出对的元组，用于的参数更新.从不同视频中采样的k-shot数据被构建为训练小批。从不同场景的视频中采样帧对进行多次训练，得到初始化参数集θ0∗，为场景适应做好了准备。

Testing Phase. 在测试阶段，给定一个新的测试序列，我们简单地使用序列的前几个帧来构造K-shot输入和输出帧对来更新模型参数。在元训练阶段也使用了相同的程序。更新后的模型用于事后的异常检测。

4. Experiments

4.1. Problem Settings, Datasets and Setups

Problem Settings. 为了更好地评估我们的方法的有效性，我们遵循了两个异常检测问题设置，即无监督设置和少镜头设置。第一个在现有的文献[37,10,22,19,23,27]中被广泛采用，在培训期间只有正常的视频。训练后的模型用于检测测试视频中的异常情况。请注意，在训练过程中可以看到测试视频的场景。第二种方法，用于元学习评估，是基于从不同的数据集收集训练和测试视频，以确保在训练和测试过程中场景的多样性。这个设置在[25]中也被称为“跨数据集”测试。总之，第一种设置挑战了它们在一个固定相机下的性能如何的方法，而后一种设置则检查了它们在给定一个新相机时的自适应能力。我们认为，上述设置对于评估一个健壮和实用的异常检测方法是必要的。

Datasets UCSD Ped1 & Ped2，CUHK Avenue，ShanghaiTech，UCF-Crime

Evaluation Metrics. ROC(AUC）curve

Implementation Details.

4.2. Comparisons with SOTA Methods

Evaluation under the unsupervised setting.

Evaluation under the few-shot setting.

4.3. Model Complexity and Inference Speed

这种方法推理速度更快

4.4. Ablation Studies

Model Component Analysis. 我们首先分析了DPU的有效性。我们将M = 10设置为DPU中注意映射函数的默认数。结果列于表4中。很明显，我们的DPU在各种基准上的整体表现得到了很大的提高。

DPU Resolution Analysis. 性能会随着分辨率的提高而提高。

Prototype Quantity Analysis. 根据这些结果，M = 10是一个适当数量的所需原型。随着数量数量的增加，涉及到更多的噪声信息，并且无法保证原型项目的多样性，导致了性能的急剧下降。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交