wujiekd

后门防御阅读笔记，GangSweep: Sweep out Neural Backdoors by GAN

论文标题：GangSweep: Sweep out Neural Backdoors by GAN

论文单位：Old Dominion University,Norfolk, VA, USA

论文作者：Liuwan Zhu,Rui Ning,Cong Wang

收录会议：ACM MULTIMEDIA 2020

开源代码：https://github.com/nicholasbennet/neural-network-backdoor-removal

GangSweep：通过GAN去“扫出“神经后门（防御）

简单总结

第一篇使用GAN去检测和识别后门攻击的防御算法

先前的防御只能检测和识别带有一个后门的中毒模型，即当一个模型存在着多个后门，只能检测出其中一个。
场景：后门模型可能存在多个触发器的场景，并且只能通过查询访问模型（类似黑盒场景）和一小组清洁标签验证数据
针对防御的攻击方法：BadNets,Trojaning Attack, Hidden Trigger Backdoor
==核心：利用GAN去重构每个可能的目标类对应的扰动掩码（逆向触发器）。==具体方法是，使用需要判断是否存在后门的模型作为判别器，生成器为生成一个扰动掩码（触发器）的自动编码器，判别器的参数固定，更新生成器的参数即可，使用了判别器的输出对生成器的训练进行干预（体现在生成器的损失函数上）。对于每一个可疑的标签，都要训练一个生成器，因此N个标签，即有N个生成器。
本文其他方法都是在重构得到的触发器基础上，结合NC进行推广，该论文的核心就是GAN构造的逆向触发器效果非常好，作者用了两个角度进行切入分析了GAN为什么比NC的方法效果好。
- 数据流形的角度
  
  基于梯度的方法（指NC所用的BIM）在高维的数据流形和 $L 2$ 范数边界的限制扰动下自然地追求一个对抗的方向，但由于真实数据(以及触发器)仍然保持在低维流形上，GAN通过对抗性学习直接恢复了这些artifacts。换句话说，因为GangSweep中的生成器类似于自动编码器，所以它提取输入图像的特征并将其压缩为低维。由此，GAN可以在接近干净数据流形的小潜在空间中产生扰动掩模，从而更好的代表的触发特性。
- 误差曲面的局部or全局最小值
  
  通过对生成的误差曲面进行分析，NC得到一个很大的平面极小值。因此，给定一个随机起点，基于梯度的方法将快速收敛到平面上的一个随机点。当只有一个触发器时，它可以工作，但在处理多触发器场景时性能很差，在多触发器场景中，触发器被映射到大平面上的不同区域。一旦它到达平面，损失接近于零，梯度下降消失，从而停止优化。因此，恢复的触发器很可能只有一个，而不是全部。相反，GangSweep会导致一个形状良好的损失景观，特别是在多触发场景中，因此更有可能在训练期间达到全局最小值。
检测后门和缓解后门
- 检测后门
  - 揭示了GAN产生的扰动掩码（逆向触发器）是具有持久性，并且在特征空间中表现出具有小转换方差和大转换距离的有趣统计特性。
    1. 持久性指的是一张图片生成的扰动掩码应该在另外一张同一个类别的图片上也可以触发后门。
    2. 小转换方差指的是输入图片和加上扰动掩码（某标签对应的生成器）的图片分别在后门模型输出的logits的方差，越小说明该标签越可能是恶意的。
    3. 大转换距离指的是输入图片和加上扰动掩码（某标签对应的生成器）的图片分别在后门模型输出的logits的最大值的差，越大说明该标签可能是恶意的。
  - 利用上面的特性设计了检测后门的算法
- 缓解后门
  - 利用构造的触发器和一小部分干净的验证集微调原模型

值得做的点（仅从本文出发）

参考之前的动态感知的后门攻击，那里的自动编码器类似于本文的生成器，然后可以尝试设计一个特别的判别器，简单来说，是否可以借助GAN的特性去训练一个生成更加鲁棒的触发器的生成器呢？
该方法的检测机制里面，有一个持久性的定义，即一张图片生成的扰动掩码应该在同类的另外一张图片上也可以触发后门，但显然，这个检测是防御不了动态感知的后门攻击，我们可以重新迭代升级该方法去防御目前最新型的攻击手段。

abstract

这项工作提出了GangSweep，一个新的后门检测框架，利用生成对抗性网络(GAN)的超级重建能力来检测和“扫出”神经后门。
揭示了GAN产生的扰动掩码是持久的，并且在特征空间中表现出具有小移位方差和大移位距离的有趣统计特性。
与以前的解决方案相比，所提出的方法消除了对训练数据访问的依赖，并显示出高度的鲁棒性和效率，以检测和减轻大部分的各种设置下的后门模型。

1.introduction

对于开发人员和最终用户来说，大规模训练自己的模型往往是负担不起的。相反，大多数用户求助于第三方例如“机器学习作为一种服务”(MLaaS)或重新使用线上免费开放的模型。因此，这带来了种种安全问题，例如后门攻击。
攻击的隐身源于模型权重的不透明和无法解释的性质，这使得通过简单地窥视数百万浮点权重参数来识别是不可行的。但是，已经有部分相关工作开展了对这一系列后门攻击的检测和识别。
为了建立一个稳健的防御，作者提出了一种新的方法，称为GangSweep。不是使用掩码通过梯度优化捕获后门触发器，而是利用生成对抗性网络(GAN)的超级重建能力检测并“扫出”所有的神经后门。

主要贡献

使用生成网络通过有效地重建目标类周围的流形来挖掘神经后门的基本弱点，并揭露攻击者为成功攻击而植入的所有artifacts。
作者发现目标标签的触发器在特征空间中表现出一些具有低移位方差和大移位距离的有趣统计特性。提出了一种有效的离群点检测机制，可以明确区分触发器和普通对抗性扰动。
作者进行了广泛的实验，以表明该防御是有效的。对3种最先进的后门木马攻击，通过不同数量、不同模式和不同大小的触发器，跨越5个数据集，进行了防御测试。这个机制可以检测和减缓所有这样的触发器组合，而不仅仅只对检测单个、小尺寸和不变触发器有效。

2.related work

三种后门攻击

后面测试防御需要使用

BadNets
Trojaning Attack
Hidden Trigger Backdoor Attacks

一些先前的防御手段

这些防御手段存在着一些弊端，目标函数过于复杂，收敛慢；需要访问干净的训练数据。

Neural Cleanse
Activation Clustering
Fine-Pruning

3.threat model

作者考虑了后门模型可能存在多个触发器的场景，后门可以通过以下两种设置被激活：（1)多个触发器中的任何一个(2）多个触发器的任意组合。后门模型将带有触发器的输入错误地分类到目标标签上，同时在干净的输入上正常执行。
防御者只能访问模型和一小组干净的验证数据（不能访问训练数据或训练过程）。防御者的目标首先是检测后门标签，然后根据恢复的触发图像来减缓后门。

4.GANGSWEEP

GangSweep主要包括下面3个阶段

Perturbation Mask Generation

设计了一个生成网络，它可以为输入图像生成一个扰动掩码，从而将其错误地分类为目标标签。对于给定的DNN，我们假设模型被回溯，并枚举每个标签作为一个假设的目标标签来生成扰动掩码。
Malicious Model Detection

采取扰动掩码的特征，并使用离群点检测算法来判断是否有一个持久的、通用的扰动掩码（触发器）导致将所有图像错误分类为目标标签。如果存在这样的掩码，模型被认为是恶意的，并且掩码本质上恢复了用于训练后门的原始触发器。
Backdoor Mitigation

利用恢复的触发器来移除后门，而不影响干净数据的性能。

4.1 扰动掩码生成器

触发器和目标类周围流形的关系

后门的攻击是通过在干净的图像印上一个触发器激活后门来构造的。触发器通常很小，以使攻击隐身。对抗样本通常将样本从数据流形上推出，然而，后门植入过程被纳入训练中，因此目标类周围的流形是从触发图像中学习的。
GAN的原理

GAN企图找到一个未知的数据分布。判别器的目的是将真实数据与生成器生成的（伪造的）数据分开，而生成器则试图通过生成真实数据来欺骗判别器。随着游戏的进行，生成器隐式地学习未知分布。
作者提出的方法和Neural Cleanse的区别

因为防御者不知道攻击者攻击的目标标签是什么，因此目标标签周围的分布也是未知的。Neural Cleanse最小化损失函数，以匹配生成的掩码与假定的触发器。虽然它可以暴露一个单一的触发器，但它探索其余的大多数未知分布是无效的，仍可能存在着其他触发器。为此，作者扩展了GAN的生成能力来学习这种未知分布，从而完全恢复攻击者植入的所有后门。

(1)提出的GAN结构

$G$ 是生成器（基于ResNet结构）， $f$ 是后门模型

可以看到 $f$ 模型的参数是固定的，只需要更新生成器 $G$ 的参数，这里使用了判别器的输出 $L_{adv}$ 对生成器的训练进行干预，下面给出了新定义的目标函数：

其中 $Font metrics not found for font: .$ 是超参数，平衡了扰动的大小和对抗性攻击成功率之间的重要性。 $_{}$ 控制了扰动的可感知性，而 $_{}$ 用于优化所生成的对抗性扰动的攻击成功率。在生成器训练的第一次迭代中，作者根据经验让 $Font metrics not found for font: .$ = 2来鼓励错误分类。在下一个迭代中，将根据和进行动态更新:

训练

对于一个给定DNN $f$ 和一个图像验证集，假设每个标签都可能是目标标签，因此使用该图像验证集对每个标签分别训练一个生成器 $G$ 。
测试

将验证集的图片分别输入各个标签对应的生成器，可以看到输出的mask的效果，如下图所示，真正目标标签对应的生成器输出的mask和真实的触发器几乎非常相似。

(2)深入了解基于GAN的mask生成

深入了解GAN体系结构产生的扰动掩码与传统的优化或基于梯度的方法之间的区别，例如L-BFGS， Carlini and Wagner Attack (C&W)，用于Neural Cleanse的基于迭代梯度的方法(BIM)。

使用以上的方法在一个提前构建好的后门模型上进行，可以看到当使用传统的方法时，为两幅图像生成的mask由随机像素扰动组成，并且有很大的不同，但GAN生成了类似真实触发器的mask。

从数据流形的角度进行深入了解

实验表明，虽然所有的方法都是针对后门模型上的“鹿”标签，但基于梯度的方法在高维的数据流形和0.1的 $L 2$ 范数边界的限制扰动下自然地追求一个对抗的方向。

由于真实数据(以及触发器)仍然保存在低维流形上，GAN通过对抗性学习直接恢复了这些artifacts。换句话说，因为GangSweep中的生成器类似于自动编码器，所以它提取输入图像的特征并将其压缩为低维。由此，GAN可以在接近干净数据流形的小潜在空间中产生扰动掩模，从而更好的代表的触发特性。这也部分地解释了为什么这种神经元木马(在流形上)不能单独工作。它通过调整模型权重来共同发挥作用。

从误差曲面的局部or全局最小值进行深入了解

为了对GangSweep (GS)和Neural Cleanse (NC)之间的掩模生成有更深入的了解，我们采用引入的方法来近似误差曲面，而反向工程通过不同的方法触发误差曲面。如上图所示，NC得到一个很大的平面极小值。因此，给定一个随机起点，基于梯度的方法将快速收敛到平面上的一个随机点。当只有一个触发器时，它可以工作，但在处理多触发器场景时性能很差，在多触发器场景中，触发器被映射到大平面上的不同区域。一旦它到达平面，损失接近于零，梯度下降消失，从而停止优化。因此，恢复的触发器很可能只有一个，而不是全部。相反，GangSweep会导致一个形状良好的损失景观，特别是在多触发场景中，因此更有可能在训练期间达到全局最小值。

对比了单触发和多触发场景下的GangSweep和NC，如下图所示，跟上述描述一致。图7©显示了一个更复杂的触发器场景，其中攻击者将攻击过程多样化，为图像均匀地随机放置左下角或右下角的触发器。事实上，这是一个更强大的攻击，攻击成功只需要预先放置一个触发器即可攻击成功。正如我们所看到的，只要在培训过程中内置了触发因素，GangSweep就可以完全暴露这两者。另一方面，NC被多样化的触发器产生严重误导，在完全不同的位置只产生一个单一的掩模。

4.2后门模型检测

两个Observation

上面的讨论已经证明了基于Gan的a方法可以基于输入图像生成(恢复)扰动掩码，这样它就会被错误地分类到后门模型的目标类中。那么其他的图像呢?生成的扰动掩模是保持不变还是完全不同?为此，作者提出以下几点看法。

Observation 1

Persistence: 后门模型中目标标签的扰动掩码(触发器)在不同的输入图像中保持持久

作者提出了一种评价是否持久的方法：

一张干净图像 $x \in X$ ，加上同类其它干净图像 $x_{c}$ 生成的扰动掩模，输入后门模型，如果输出目标标签 $t$ 对应的概率很高，就表明该扰动掩码很可能是一个触发器。（这里在本文中规定了同一类，同一个类别的图片可以导致一个等价的转换，这其实在GAN的生成器的训练可以体现，我认为也可以从不同原始类所处的流形位置不一样去解释）

Observation 2

在后门模型中，目标标签的扰动掩码(触发器)在特征空间中表现出较低的shifting variance和较大的shifting distance。

shifting variance

将()定义为干净图像的logits向量，并将(+())定义为生成的对抗样本的logits向量。对于一个干净的标签，产生的扰动掩码在其输出特征向量上表现出更多的多样性。这一发现与以往的研究表明，虽然扰动是偏离流形的，但它们的模式依赖于数据流形来优化，并将“欺骗性特征”用于误分类（我的理解是这里生成的扰动偏离了原图像的数据流形，但目标标签对应的数据流形和触发器对应的数据流形会更加相近）这激励作者推导出shift variance of the logits: $Font metrics not found for font: .$ ，其中 $x^{'} = x + G (x)$ 和 $v a r (\cdot)$ 表示 $x 和 x^{'}$ 的logits向量之间的方差。
shifting distance

干净标签和目标标签的扰动掩模在特征空间中表现出不同的移动距离。具体地说，我们将定义shifting distance: $Font metrics not found for font: .$ ，中 $m a x (\cdot)$ 表示logits向量的最大值。从后门生成的扰动掩模显示了向目标标签的强烈移动(即)，而干净标签的掩模移动距离通常很小，仅仅是为了确保错误分类。
下图显示了一个基于GTSRB基准的示例。图8(a)中右下角的红点表示目标标签的扰动掩模(移动方差较小，移动距离较大)，与干净标签的扰动掩模有明显区别。

后门检测算法

Persistence

给定一个DNN模型及其验证数据集，我们从每个类中随机选择一组图像。基于每幅图像，我们生成它的微扰掩码，目标是所有可能的输出标签，除了图像的实际标签。对于每个目标标签，图像用来自同一类的其他图像生成的不同扰动掩码印章，然后输入DNN模型，以评估攻击是否成功，即错误分类到目标标签。我们将攻击成功率定义为“持久性”。如果它高于阈值，作者认为它是一个潜在的恶意标签。在作者的实现中，阈值是90%，接下来将讨论。
Anomaly Index

如果识别出潜在的恶意模型，我们使用图像和先前生成的掩码来测量shifting variance和shifting distance。然后运行离群点检测算法（这个离群点算法和NC里面提到的MAD算法一致），以检测特定标签的扰动掩码是否具有强的和相似的shifting patterns。如果结果是阳性，即判断该标签被感染。
给出完整算法伪代码

4.3后门缓解

一旦检测到后门模型，可以通过模型修补来缓解后门，即使用一个新数据集来微调后门DNN模型，该数据集包括一小部分(小于10%)的验证数据和(10%)的对抗数据。注意，对抗数据是通过将生成的扰动掩码印在干净的验证图像上并将其标记为原始的、正确的标签来获得的。相对于使用Neural Cleanse的原始训练数据集，该方法不需要访问原始训练数据，也不需要访问实际对抗数据。

5.EVALUATION

实验数据集：: MNIST, GTSRB, CIFAR10, VGG-FACE, Mini ImageNet
测试的后门攻击： BadNets,TrojanNN, and Hidden Trigger Backdoor
比较的防御方法：Neural Cleanse (NC)

前面的方法已经介绍的非常详细，如若复现，再具体察看实现细节～

【Flask】在Flask应用中使用Flask-Limiter进行简单CC攻击防御 SmallBambooCode flask python 后端
前提条件已经有一个Flask应用。已经安装了Flask和redis服务。步骤1：安装Redis和Flask-Limiter首先，需要安装redis和Flask-Limiter库。推荐在生产环境中使用Redis存储限流信息。pipinstallredisFlask-LimiterFlask-Limiter会通过redis存储限流信息，确保应用不会在高并发的情况下发生性能瓶颈。步骤2：配置Redis连
（3-5）文生图模型架构：扩散模型码农三叔训练 RAG 多模态)人工智能 python 深度学习大模型文生图多模态
3.5扩散模型扩散模型（DiffusionModels）是一类用于生成图像的深度学习模型，近年来在图像生成任务中取得了显著的进展。扩散模型的基本思想是通过逐步添加噪声到数据中，然后学习从噪声中恢复原始数据的过程。3.5.1扩散模型的基本概念扩散模型是一种基于随机过程的生成模型，通过逐步添加和去除噪声，实现从随机噪声到高质量数据的转化，其独特的训练和生成机制使其在图像生成领域表现出色。1.扩散过程扩
Python从0到100（八十六）：神经网络-ShuffleNet通道混合轻量级网络的深入介绍是Dream呀 Python python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
毕业设计项目深度学习人体目标检测 bee_dc 毕业设计毕设大数据
1简介今天学长向大家介绍一个机器视觉的毕设项目，基于深度学习的人体目标检测算法研究与实现项目运行效果：毕业设计深度学习行人目标检测系统项目分享:见文末!2目标检测概念普通的深度学习监督算法主要是用来做分类，如图1所示，分类的目标是要识别出图中所示是一只猫。在ILSVRC（ImageNetLargeScaleVisualRecognitionChallenge)竞赛以及实际的应用中，还包括目标定位和
【人工智能】基于Python的机器翻译系统，从RNN到Transformer的演进与实现蒙娜丽宁 Python杂谈人工智能人工智能 python 机器翻译
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界机器翻译（MachineTranslation,MT）作为自然语言处理领域的重要应用之一，近年来受到了广泛的关注。在本篇文章中，我们将详细探讨如何使用Python实现从传统的循环神经网络（RNN）到现代Transformer模型的机器翻译系统。文章将从机
python 求导实现_python – NumPy中的Softmax导数接近0(实现) 非凡运营笔记 python 求导实现
这是如何以更加矢量化的numpy方式计算softmax函数的导数的答案.然而,偏导数逼近零的事实可能不是数学问题,并且只是学习率或复杂深度神经网络的已知死亡权重问题.像ReLU这样的图层有助于防止后一问题.首先,我使用了以下信号(仅复制您的上一个条目),使其成为4个样本x3个特征,因此更容易看到尺寸发生了什么.>>>signal=[[0.3394572666491664,0.30890680539
19、智能驾驶信息安全要求 OEM的牛马DRE 智能驾驶控制器硬件介绍网络服务器运维人工智能
信息安全要求：1.不应存在后门或隐蔽接口要求：系统或设备的设计、开发和生产过程中，应确保不存在任何未经授权或未公开的接口（即后门或隐蔽接口）。这些接口可能会被恶意用户或攻击者利用，绕过正常的安全机制，对系统或设备造成损害或窃取敏感信息。建议：在系统或设备的设计阶段，应进行全面的安全审查，确保所有接口都是明确且文档化的。在开发和测试过程中，应使用专业的安全工具和技术来检测和识别任何潜在的后门或隐蔽接
跨平台物联网漏洞挖掘算法评估框架设计与实现文献综述之GMN XLYcmy 漏洞挖掘物联网网络安全漏洞挖掘跨架构静态检测图神经网络项目报告
2.4Gemini和GMN我们采用了两种方式：Gemini和GMN。2.4.2GMN图神经网络（GraphNeuralNetworks-GNNs）是一种用于学习结构化数据及相关预测问题的方法。节点的表示被用于节点分类或生成图向量再用于分类。GMN模型针对图的相似性学习问题，提出了一种使用GNNs将图嵌入到向量空间，并通过交叉图注意机制来计算相似度分数以关联图之间的相似性的模型。GMN模型不是独立地
【TVM教程】为 Mobile GPU 自动调优卷积网络 HyperAI超神经 TVM 人工智能机器学习 TVM 编程编译器 GPU CPU
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：LianminZheng,EddieYan针对特定设备的自动调优对于获得最佳性能至关重要。本文介绍如何调优整个卷积网络。TVM中MobileGPU的算子实现是以template形式编写的。该template有许多可调参数（tile因子
深度学习篇---数据存储类型 Ronin-Lotus 深度学习篇深度学习人工智能学习笔记 C Python 数据类型
文章目录前言第一部分：C语言中的数据存储类型1.char（通常是8位）优点缺点2.short（通常是16位）优点缺点3.int（通常是32位）优点缺点4.long（通常是32位或64位）优点缺点5.longlong（通常是64位）优点缺点6.float（通常是32位）优点缺点7.double（通常是64位）优点缺点第二部分：Python中的数据存储类型1.int（整数类型）优点缺点2.float（
Mac系统安装 deepxde +VS code + pytorch 积分酱 pytorch python 人工智能机器学习
deepxde在Mac系统安装和学习笔记系列因为换了苹果电脑MacBookPro，所以软件都需要重新安装，记录一下安装过程。我的配置是python+VSCode。打开终端，直接按住command+空格键，输入终端就可以打开了。1.deepxde安装首先输入python3--version查看python版本，我的是Python3.9.13然后输入python3-mpip-V查看自己的pip版本，我
深度学习篇---深度学习框架 Ronin-Lotus 深度学习篇深度学习人工智能 python Pytorch TensorFlow paddlepaddle
文章目录前言第一部分：框架简介1.PyTorch简介特点动态计算图易于上手强大的社区支持与Python的集成度高核心组件2.TensorFlow简介特点静态计算图跨平台强大的生态系统Keras集成核心组件3.PaddlePaddle简介特点易于使用高性能工业级应用丰富的预训练模型核心组件第二部分：基本操作PyTorch基本操作TensorFlow基本操作PaddlePaddle基本操作总结前言以上
Paddle和pytorch不可以同时引用饮马长城窟 paddle pytorch 人工智能
importpaddleprint(paddle.utils.run_check())importtorchprint(torch.version.cuda)print(torch.backends.cudnn.version())报错：OSError:[WinError127]找不到指定的程序。Errorloading"C:\ProgramFiles\Python311\Lib\site-pac
YOLO系列之训练环境（GPU）搭建篇 w94ghz YOLO改进系列 YOLOv8改进系列 YOLO 深度学习人工智能 python 目标检测
YOLOv8专栏导航：点击此处跳转Pytorch环境配置（Windows）Anaconda安装此处下载安装即可⭐温馨提示：安装路径
讯飞绘镜（ai生成视频）技术浅析（三）：自然语言处理（NLP）爱研究的小牛 AIGC—视频 AIGC—自然语言处理自然语言处理人工智能自然语言处理 AIGC 深度学习
1.技术架构概述讯飞绘镜的NLP技术架构可以分为以下几个核心模块：语义分析：理解用户输入的文本，提取关键信息（如实体、事件、情感等）。情节理解：分析文本中的故事情节，识别事件序列和逻辑关系。人物关系建模：识别文本中的人物及其关系，构建人物关系图。场景生成：根据情节和人物关系生成场景描述。每个模块都依赖于先进的深度学习模型和算法，以下将逐一详细讲解。2.语义分析语义分析的目标是从用户输入的文本中提取
讯飞智作 AI 配音技术浅析（一）爱研究的小牛 AIGC—技术综述 AIGC—概述 AIGC—音频人工智能 AIGC 机器学习深度学习
一、核心技术讯飞智作AI配音技术作为科大讯飞在人工智能领域的重要成果，融合了多项前沿技术，为用户提供了高质量的语音合成服务。其核心技术主要涵盖以下几个方面：1.深度学习与神经网络讯飞智作AI配音技术以深度学习为核心驱动力，通过以下关键模型实现语音合成：Tacotron模型：该模型采用端到端的编码器-解码器架构，将输入文本直接转换为梅尔频谱（Mel-spectrogram），再通过声码器生成语音信号
利用去雾算法实现低光增强 mytzs123 图像增强算法 opencv 人工智能
[论文阅读](11)ACE算法和暗通道先验图像去雾算法（Rizzi|何恺明老师）_暗通道去雾算法-CSDN博客//https://zhuanlan.zhihu.com/p/500023711?utm_id=0#include#include#include#include#include#includeusingnamespacecv;usingnamespacestd;namespace{voi
简述Caffe、TensorFlow、TensorFlow Lite、ONNX、DarkNet、PyTorch 等模型科学的发展-只不过是读大自然写的代码断纱检测 caffe tensorflow pytorch
以下是对Caffe、TensorFlow、TensorFlowLite、ONNX、DarkNet和PyTorch等模型的简述：Caffe：Caffe（ConvolutionArchitectureForFeatureExtraction）是一个用于特征抽取的卷积框架，它是一个清晰、可读性高且快速的深度学习框架。Caffe由加州伯克利大学的贾扬清开发，起初是一个用于深度卷积网络的Python框架（无
超实用的Python深度学习教程 - 基于TensorFlow和Keras框架（含实例及完整代码） AI_DL_CODE 人工智能 python 深度学习 tensorflow
一、深度学习概述（一）深度学习的定义与发展历程深度学习在当今的科技领域占据着极为重要的地位。它是人工智能的一个重要分支，其定义为通过构建具有很多层的神经网络模型，让计算机自动从大量数据中学习复杂模式的一种技术。深度学习的发展历程可谓波澜壮阔，早期它源于对人工神经网络的研究，从简单的感知机模型开始。在发展初期，由于计算资源的限制以及数据量的不足等因素，发展较为缓慢。然而，随着计算机技术的飞速发展，尤
2025年美赛数学建模2025 MCM Problem A: Testing Time: The Constant Wear On Stairs A题测试时间：楼梯上的持续磨损代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 2025年数学建模美赛 2025数学建模美赛 A题 2025 楼梯上的持续磨损 matlab代码
目录Python1.数据预处理与特征工程数据标准化与特征构建2.行进方向偏好分析深度神经网络（DNN）用于方向性分析3.多人同时使用分析卷积神经网络（CNN）用于磨损模式识别4.时间序列分析LSTM模型用于时间序列预测matlab代码Python我们将采用更多的机器学习和深度学习技术，例如图像处理、深度神经网络（DNN）、卷积神经网络（CNN）等，并结合不同的算法进行更深入的分析。1.数据预处理与
Llama大型语言模型原理详解摆烂大大王 llama llama 语言模型人工智能
Llama大型语言模型是一种基于深度学习的自然语言处理模型，它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。本文将详细解析Llama模型的原理，包括其结构、训练过程以及工作机制，帮助读者深入理解这一先进的模型。一、模型结构Llama模型采用了一种基于Transformer的架构，这是一种由多个自注意力机制和前馈神经网络组成的深度神经网络结构。Transformer架构通过自注意力机制捕
利用ChatGPT阅读文献：指南与技巧摆烂大大王 chatgpt MathorCup数学建模 chatgpt 论文阅读人工智能学习
阅读文献对于学术研究和深度学习至关重要。ChatGPT作为一款高级人工智能聊天机器人，可以帮助用户更高效地阅读和理解文献。以下是如何利用ChatGPT阅读文献的一些指南和技巧。1.文献检索在你阅读文献之前，首先需要找到相关文献。可以使用如下命令让ChatGPT帮助你进行文献检索：/findpapers关键词或主题例如，如果你需要寻找关于人工智能在医疗领域应用的文献，可以输入：/findpapers
目标检测入门教程：使用Python实现目标检测算法晨曦之光，优美芝麻目标检测 python 算法机器学习-深度学习
目标检测是计算机视觉领域中的重要任务，它旨在识别和定位图像或视频中的特定对象。本教程将介绍如何使用Python编程语言实现目标检测算法。我们将使用一种广泛应用的目标检测算法——基于深度学习的单阶段检测器YOLO（YouOnlyLookOnce）的最新版本YOLOv4作为示例。在开始之前，请确保您已经安装了Python和以下必要的库：NumPy、OpenCV和PyTorch。您可以使用pip命令来安
基于Transformer的多通道肌电信号序列分类咖啡百怪 transformer 深度学习人工智能
表面肌电信号(sEMG)为十分重要的人体感官信号，不同的动作和状态对应不同的肌电信号，利用肌电信号的表征能力，我们可以实现对NAO机器人的控制。本项目基于Transformer实现对表面肌电信号的分类，数据使用excel进行保存，使用Pytorch架构建立模型并训练，利用基于Paramiko库的SSH连接来实现对NAO机器人的远程控制。在这里贴上该项目的github仓库连接，大家用得到的可以点个星
PyTorch 快速入门無量空所深度学习机器学习 pytorch 开源
我们将通过一个简单的示例，快速了解如何使用PyTorch进行机器学习任务。PyTorch是一个开源的机器学习库，它提供了丰富的工具和库，帮助我们轻松地构建、训练和测试神经网络模型。以下是本教程的主要内容：一、数据处理PyTorch提供了两个基本的数据处理工具：torch.utils.data.DataLoader和torch.utils.data.Dataset。Dataset用于存储样本及其对应
【Java】已解决：`java.lang.NoClassDefFoundError` 屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
【Java】已解决java.lang.NoSuchMethodException异常屿小夏 java python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的开源库（一）由数入道深度学习开源人工智能
在开发中，有一些开源库可以实现不同类型的推理，包括逻辑推理、概率推理、图推理、基于深度学习的推理等。以下是五类推理（逻辑推理、概率推理、图推理、基于深度学习的推理）的现成开源库，它们各自的功能、特点和适用场景的详细介绍，并进行对比分析。1.逻辑推理推理：PyDatalog库介绍：PyDatalog是一个Python的逻辑编程库，它将逻辑编程的功能引入到Python中，提供了在Python中进行规则
杨立昆退休？中国Deepseek超Llama 4触发Meta 极道Jdon javascript reactjs
[昨天，人工智能领域发生了一些事情：杨立昆领导的Meta生成式人工智能部门（Metagenaiorg）陷入了恐慌模式。杨立昆是Meta（原Facebook）的首席人工智能科学家，同时也是纽约大学的教授。杨立昆因其在深度学习领域的开创性工作而获得了图灵奖（TuringAward），这是计算机科学领域的最高荣誉之一。恐慌模式始于DeepseekV3，它在性能测试中已经超过了Llama4。更让人尴尬的是
GGUF 大模型文件格式香菜烤面包 AI 系统与算法部署语言模型
1.基础原理GGUF简介当前的大模型的参数规模较大，数以千亿的参数导致了它们的预训练结果文件都在几十GB甚至是几百GB，这不仅导致其使用成本很高，在不同平台进行交换也非常困难。因此，大模型预训练结果文件的保存格式对于模型的使用和生态的发展来说极其重要。大语言模型的开发通常使用PyTorch等框架，其预训练结果通常也会保存为相应的二进制格式，如pt后缀的文件通常就是PyTorch框架保存的二进制预训
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb