超自信面包QTQ

CW Attack论文阅读与总结

论文链接：https://arxiv.org/abs/1709.03842

在阅读《Towards Evaluating the Robustness of Neural Networks》这篇基于优化的CW攻击方法过程中，本文提取了原文中各小节的主要观点，并附有自己对原文公式的解释，以便于后续对CW攻击方法的回顾，也相当于是对自己的阅读论文笔记。后续将不断更新记录自己在对抗攻击方面的学习成果。

1 引言

现有的神经网络容易受到攻击。Szegedy等人首先注意到图像分类领域中存在对抗性的例子：可以对原始图像添加扰动使得分类器分类出错。防御蒸馏可以应用于任何前馈神经网络，只需要一个简单的重新训练步骤，便使得攻击成功概率从95%降低到0.5%。

本文创建了一组可用于构造神经网络鲁棒性上界的攻击，防御蒸馏方法无法抵抗我们的攻击。在普遍的模型上与其他攻击进行比较时，本文的方法生成了对抗样本在每种情况下总失真都较小。此攻击方法是评估防御性能的最佳基准。

可转移性在我们的攻击方法中也存在，并且被我们证明可以从非安全模型转移到防御提炼（安全）模型。

使用的数据集：MNIST，一个数字识别任务（0-9）；CIFAR-10，一个小型图像识别任务，10个类；以及ImageNet，一项包含1000个类的大型图像识别任务。值得注意的是:在ImageNet分类任务的一个极端示例中，我们可以通过仅更改每个像素的最低阶位，导致Inception v3网络对图像进行错误分类。

贡献：（1）基于三种距离度量L0、 L2 和L $\propto$ 设计了三种攻击方法；

（2）防御蒸馏抵抗不住我们；

（3）提出利用高置信度的攻击样本来进行迁移攻击，作为测试模型鲁棒性的手段，同时这种方法也成功攻破了防御性蒸馏；

（4）系统性地评估了不同损失函数对攻击效果的影响，发现损失函数的选择影响巨大。

2 背景

A 威胁模型

机器学习模型的安全特性变得十分重要，语音识别领域可以生成与人类不同的音频来恶意控制用户设备，这项工作的重点是传统高斯混合模型与隐马尔科夫模型；恶意软件分类领域的对抗样本可以使其保持恶意软件状态但被归类为良性软件从而攻击了软件分类器；

距离度量在每个领域是不同的，在本文所关注的图像空间中，我们发现各种Lp规范是人类感知距离的合理近似值。

白盒攻击：本文实验假设对手可访问神经网络的结构和所有参数。可转移性：前有证明如果有黑盒访问权限则可以训练替代模型而攻击目标模型。

B 神经网络与符号

在我们实验中，模型固定所以不依赖参数 $\theta$ ；输出向量y满足softmax输出，被视为概率分布；公式符号定义如下：

$y_{i}$ ：输入属于类别的概率；

标签分配： $C\left ( x \right )=argmax_{i}F\left ( x \right )_{i}$ ;

其中， $F(\cdot )$ 为包含softmax函数的完整网络，

$Z\left ( x \right )=z$ 为是除softmax之外的所有层的输出（z为logits）。

有以下公式

$\theta _{i}$ 表示模型weights， $\hat{\theta }_{i}$ 表示biases，本文关注使用ReLU激活函数的网络，因为其广泛。

C 对抗样本

非目标攻击比目标攻击更强大，我们仅考虑目标攻击。我们考虑了以下三种不同的方法选择目标类：

1Average 在不正确的标签中随机均匀地选择目标类；2Best 对所有不正确的类执行攻击，并报告最容易攻击的目标类； 3 Worst 并报告最难攻击的目标类。

D 距离度量

$L_{0}$ : 测量距离坐标的数量， $x_{i}\neq x_{i}^{'}$ ,对应于图像中已改变的像素数

$L_{2}$ : $x_{i}$ 与 $x_{i}^{'}$ 的欧几里得距离，当许多像素发生许多微小变化时，L2距离可以保持很小。

$L_{\oe }$ ：测量任何坐标的最大变化。可想象有一个最大的预算，每个像素可以被修改到这个限制，而不受修改像素数量的限制。

我们相信，构建和评估一个良好的距离度量是我们留给未来工作的一个重要研究问题。全文在[0,1]范围内进行报告而不是[0，255]

E 防御蒸馏

首先以标准方式在训练数据上训练具有相同结构的网络。当我们在训练这个网络的同时计算softmax时，用一个更平滑的softmax版本替换它（通过将logits除以某个常数T）。在训练结束时，通过在每个训练实例上评估该网络并获取网络的输出标签，生成软训练标签。然后，扔掉第一个网络，只使用软训练标签。有了这些，就可以训练第二个网络，而不是在原来的训练标签上训练，而是使用软标签。这会训练第二个模型的行为与第一个模型类似，软标签传递第一个模型学习到的额外隐藏知识。

这里的关键观点是，通过训练匹配第一个网络，可避免对任何训练数据进行过度拟合。如果神经网络的存在是因为神经网络是高度非线性的，并且有“盲点”，而这些盲点存在于对立的例子中，那么防止这种类型的过度拟合可能会消除这些盲点。事实上，正如我们将在后面看到的，防御性的升华并不能消除对抗性的例子。可能出现这种情况的一个潜在原因是，存在对抗性示例的原因不是由于高度非线性神经网络中的盲点，而是由于神经网络的局部线性性质。这种所谓的线性假设似乎是正确的。

3 攻击算法（回顾之前的方法）

A L-BFGS

图像 $x^{'}$ 在L2距离下与相似。我们针对c的多个值重复解决这个优化问题，使用对分搜索或任何其他一维优化方法自适应更新c。

B FGSM

与L-BFGS相比，fgsm方法使用了无穷范数距离度量，设计重点放在“快速”而非“近似”。（为什么是-号？）

迭代方式的FGSM方法，

C JSMA（学完再补）

D Deepfool（学完再补）

4 实验

先描述如何训练模型评估我们的攻击：

5 方法（***）

核心思想：CW是一种基于优化的攻击方式，它同时兼顾高攻击准去率和低对抗扰动的两个方面，达到真正意义上对抗样本的效果，即在模型分类出错的情况下，人眼不可查觉（FGSM，PGD攻击生成的图片非常模糊，人眼可以察觉到）。首先对抗样本需要用优化的参数来表示，其次在优化的过程中，需要达到两个目标，目标1 是对抗样本和对应的干净样本应该差距越小越好；目标2是对抗样本应该使得模型分类错，且错的那一类的概率越高越好。

原始形式：其中x是固定的，目标是找到使D（x，x+δ）最小的δ。也就是说，我们想找到一些小的变化δ，我们可以对图像x进行一些小的改变，改变其分类，但结果仍然是有效的图像。这里D是一些距离度量；D包括 L0 L2 L $\propto$ 。

A 目标函数：约束 $C\left ( x+\delta \right )=t$ 是高度非线性的，很难求解，所以要关于分类的函数 ,

使得当且仅当 $f\left ( x+\delta \right )\leq 0$ 时 $C\left ( x+\delta \right )=t$ 成立，从而联立与形成可解的优化函数形

式。有如下七种选择，代表交叉熵损失函数：

（七个函数的意义）

添加常数是为了调整公式来适应我们的定义，不会影响结果只会缩放最小化函数，现在我们不使用问题一，而转化为求解问题二：

这里的c是一个可选择的常数，图中两者是等价的，因为一定存在c,这样问题一的最优解跟问题二的最优解是相匹配的。个人理解：上图中转换后的式子最优解一定是 $f\left ( x+\delta \right )$ 是最小化后的，既然最优，也就是对抗样本对应的目标类别的softmax值是最大的，那么也一定满足 $f\left ( x+\delta \right )\leq 0$ ，反过来推导也是成立的。所以原文作者说两个形式所产生的最优解是等价的，转换之后也就能够同时优化两部分！

对于常数c的选择，原文说选择c的最佳方法是使用c 的最小值（？），作者的结论是在满足解 $f\left ( x^{'} \right )\leq 0$ 成立的前提下，选用最小的c值，因为这样可以使得训练过程中，梯度下降算法同时优化函数里的两个项，而不是做“有偏”的优化。针对这一点，作者利用损失函数 $f_{6}\left ( x^{'} \right )$ 进行了实验，将变量c在0.01到100的log空间内均匀地取值，统计攻击成功率及扰动的 $L_{2}$ 距离，结果如下图所示，可以发现，当时，增大c几乎不会再提高攻击的成功率，但是扰动的 $L_{2}$ 距离会不断增大，这就说明在保证攻击成功的前提下，应尽可能选择c的最小值。

图1 超参数c取值对攻击成功率和扰动距离的影响

B Box constraints（像素上下界问题）

【本小节的理解参照博文：https://blog.csdn.net/weixin_37627840/article/details/114270525】

之所以存在上下界，是因为数字图像能表示的像素值范围是有限的，在经过归一化之后，像素值应该在[0,1]的范围内，为了确保添加扰动后的图像有效，我们要对 $\delta$ 有一个限制，即： $0\leq x_{i}+\delta _{i}\leq 1$ （box constraint），如果在攻击生成之后，直接把像素值裁剪到[0,1]的范围内，这样会破坏形成的攻击效果。那么如何在优化的过程中引入限制，又能保障攻击的效果呢？作者研究三种不同的方法来解决这个问题：

（1） PGD 投影梯度下降：在攻击的每一步迭代完成之后，将所有坐标剪辑到[0,1]。

（2）剪辑梯度下降：并不在每次迭代中都 $clip\left ( x_{i} \right )$ ，而是将剪辑合并到目标函数中以最小化。也就是用 $f\left ( min\left ( max\left ( x+\delta ,0 \right ),1 \right ) \right )$ 代替 $f\left ( x+\delta \right )$ ,取得最小和最大分量。

但是这样又会带来另一个问题，设想这样一个场景：假如在某个迭代步中， $x+\delta$ 的范围超出了1的限制，但是在下一个迭代步中，该处的像素值回调到[0,1]之间并且攻击效果提升了，那么由于损失函数的限制，在第一个迭代步中，梯度为0，因此实际上没有任何攻击扰动的变化，那么后一个迭代步的攻击效果提升也就自然无法被找到了。

（3）换元法：通过引入新的变量 $\omega$ 使得扰动的表达式变为 $\delta _{i}=\frac{1}{2}\left ( tanh\left ( \omega _{i} \right )+1 \right )-x_{i}$
这样对抗样本就变成 $x^{'}=\frac{1}{2}\left ( tanh\left ( \omega \right ) +1\right )$

由于tanh函数本身的值域范围为[-1,1]，这样就保证了 $x+\delta$ 的范围在[0,1]之间，同时，因为tanh函数在全定义域内导数均不为0，也就克服了Clipped gradient descent方法的缺点。这样做还有另一个好处，由于像素值的限制靠的是损失函数本身的值域而非人工截断，那么就可以引入一些不支持人工截断的优化器，例如Adam。作者通过实验对比标准梯度下降法、动量梯度下降法和Adam，发现Adam在保证攻击效果的前提下实现了更快的收敛速度。

C 评估方法

为了选择最优的c，我们执行20次二进制搜索迭代。对于每个选定的c，使用Adam优化器运行10000次梯度下降迭代。

表3是对于七种目标函数（）与三个框约束方法一一组合，测试攻击的成功率以及扰动的 $L_{2}$ 距离。通过表3可得到的结论是：对于最佳的最小化函数（ $f_{6}$ ），处理框约束的方法的选择不会对结果的质量产生显著影响。（..........理解...........）

D 离散化

经过归一化后的像素值是在[0,1]范围内的连续值，而数字图像的像素值是[0,255]范围内的离散整数值，当把攻击图像映射回[0,255]范围时，原文直接按 $255*\left ( x_{i}+\delta _{i} \right )$ 此公式四舍五入到最接近的[0,255]范围内的整数。这样就会在一定程度上破坏攻击的质量。为了解决这个问题，作者采用了贪心搜索的策略来完成这个映射，最大限度地保障攻击的质量。

6 攻击方法

A $L_{2}$ 攻击：

基于 $L_{2}$ 距离的攻击就是优化如下的目标函数:

函数是之前得到的最佳目标函数，稍微修改添加了，使得我们通过可以调整错误分类得到的置信度。若 $x^{'}$ 被分类为目标类别，则 $max\left \{ Z\left ( x^{'} \right ) _{i}:i\neq t\right \}-Z\left ( x^{'} \right )_{t}$ 是负值，若设置，则 $f\left ( x^{'} \right )=0$ ，意味着该函数不会被惩罚，否则如果被识别为非目标类别，则该函数一定会受到惩罚。所以原文说通过改变 k 值可以得到预期的置信度，k 值越大模型越容易分错，并且错的那一类概率越大。

多起点梯度下降：为了解决梯度下降容易陷入“次优解”的问题，作者在原始图像的r rr领域（r rr对应已发现的扰动最小的攻击样本）里采样多个点作为初始图像，在多个初始图像的基础上进行攻击扰动的生成。

B $L_{0}$ 攻击

由于 $L_{0}$ 距离是不可导的，因此不可以像基于 $L_{2}$ 的攻击一样直接使用梯度下降进行优化，从 $L_{0}$ 距离的含义来看，是在修改的像素数量上做文章。基于此，作者设计了一套在每个迭代轮次里去掉一个像素点的方案。具体操作是，在每个迭代步中，

基于 $L_{2}$ 距离来生成攻击样本

计算损失函数值，获得扰动对应的梯度 $g=\bigtriangledown f\left ( x+\delta \right )$

随后基于梯度来找到对目标函数值影响最小的像素点 $i=argmin_{i}g_{i}*\delta _{i}$ ，

${\color{Orchid} g_{i}*\delta _{i}}$ 表示图片第i个像素在 ${\color{Orchid}f\left ( \cdot \right ) }$ 的减少量，

当 ${\color{Orchid} x\rightarrow x+\delta }$ ， ${\color{Orchid} g_{i}}$ 表示每单位改变到第i个像素时 f 的减少量，乘以 ${\color{Orchid} \delta _{i}}$ 表示第 i 个像素改变了多少。也就是

将该像素点排除在外，对其他像素进行梯度反传更新。

不断迭代，直到获得一个最小的像素子集合（终止条件是 $L_{2}$ 的攻击方式无法再找到有效的攻击样本）。

在每次迭代时不再从原始图像开始，而是从上次迭代后的图像开始梯度下降（热启动），这大大减少了每次迭代中所需梯度下降的轮数，作者解释这是因为保持k像素不变的解决方案通常与保持k+1像素不变的解决方案非常相似。（修改k个像素与修改k+1个像素在生成对抗样本的方式上是非常接近的)

C $L_{\infty }$ 攻击

因为 $L_{\infty }$ 距离不是完全可导的，作者尝试过优化以下的目标函数，但是发现效果非常不理想，原因可想而知，按照无穷范数距离含义，这样的优化只会去惩罚扰动量最大的像素。那么就有可能出现这样一种情况：有两个像素点，分别是 $\delta _{i}=0.5$ 和 $\delta _{j}=0.5-\varepsilon$ ，那么
正则化就会惩罚 $\delta _{i}$ 点，而正则化项在 $\delta _{j}$ 点处的梯度 $\frac{\partial }{\partial \delta _{i}} \left \| \delta \right \|_{\infty }$ 将会是0，该点即便扰动量很大也不会被惩罚。因此，在后续的迭代步中，
可能会慢慢大于，如此反复，两个点会在的基线附近来回波动，不会有任何有效的更新。

为了解决这个问题，作者优化正则化项：

正则化项将会惩罚所有超过τ 的像素点，在每个迭代轮次完成后，如果所有像素的像素值均小于τ ，那么就会对τ 进行衰减，衰减因子是0.9。否则，就停止攻击样本的搜索过程。同时，迭代过程中使用与 $L_{0}$ 相同的“热启动”。对于c初始值，先设置c取极小的值，若失败则c*=2，继续搜索直至成功，若c超过阈值，则终止。实验发现跟L2算法一样快。

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
《从依赖纠缠到接口协作：ASP.NET Core注入式开发指南》后端
在C#的ASP.NETCore开发中，依赖注入绝非简单的技术技巧，而是重构代码关系的底层逻辑。它像一套隐形的神经网络，让程序模块摆脱硬编码的束缚，在运行时实现动态连接，从而为系统注入可测试、可进化的核心生命力。理解其深层价值，需要穿透"服务注册与获取"的表层操作，触及它对软件设计哲学的重塑。依赖注入的本质，是对"依赖关系"的去中心化治理。传统开发中，模块间的依赖如同藤蔓缠绕的树木，一个组件直接创建
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。