鬼道2022

基于梯度的黑盒迁移对抗攻击（附代码）

1 引言

黑盒迁移攻击是对抗攻击中非常热门的一个研究方向，基于动量梯度的方法又是黑盒迁移攻击的一个主流方向。当前大部分研究主要通过在数据样本的尺寸，分布，规模，时序等方面来丰富梯度的多样性，使得生成的对抗样本在迁移到其它的模型攻击时，能够有更高的攻击成功率。本文会介绍最近几年有代表性的黑盒迁移攻击的论文，这些论文的方法经常会被当成论文比较的baseline。我对论文中涉及到一些数学结论进行补充证明，大部分论文中给出的源码是tensorflow的，我又根据论文的算法流程图用pytorch对论文的核心方法重新编程了一下，代码实例在文末所示。

2 注意力攻击（AOA）

2.1 论文简介

在该论文中作者提出一种注意力攻击 (AoA)，注意显著图是深度学习模型共享的语义属性。作者发现当交叉熵损失被注意力损失取代时，AoA方法生成对抗样本的可迁移性会显着提高。除此之外由于AoA方法只改变了损失函数，它可以很容易地与其它对抗样本可迁移性增强技术相结合，从而实现更好的 SOTA 性能。作者应用AoA方法从ImageNet验证集中生成 50000个对抗样本并攻击成功许多神经网络模型，并将数据集命名为DAmageNet，该数据及是第一个通用对抗数据集。

论文链接：https://arxiv.org/abs/2001.06325
数据集链接：http://www.pami.sjtu.edu.cn/Show/56/122

2.2 论文方法

令 $h (x, y)$ 表示输入 $x$ 和指定类 $y$ 的注意力热力图。 $h(x,y_{\mathrm{ori}})$ 是一个与输入 $x$ 维度一致的张量。

抑制损失函数 $L_{\mathrm{supp}}$ ： 其目的是抑制正确类别 $y_{\mathrm{ori}})$ 的注意力热力图的大小。当正确类的网络注意力降低时，其他类的注意力会增加并最终超过正确的类，从而导致模型寻求获取有关其它类别的信息而不是正确类别的信息，从而做出不正确的预测，具体的损失函数如下所示： $L_{\mathrm{supp}}=\|h(x,y_{\mathrm{ori}})\|_1$ 其中 $\|\cdot\|$ 表示 $\ell_1$ 范数。
分散损失函数 $L_{\mathrm{dstc}}$ ： 当注意力从原始感兴趣区域分散时，模型可能会失去预测能力。在这种情况下，不需要网络关注任何不正确类别的信息，而是引导它关注图像的不相关区域，具体的损失可以表示为以下形式： $L_{\mathrm{dstc}}(x)=-\left\|\frac{h(x,y_{\mathrm{ori}})}{\max(h(x,y_{\mathrm{ori}}))}-\frac{h(x_{\mathrm{ori}},y_{\mathrm{ori}})}{\max(h(x_{\mathrm{ori}},y_{\mathrm{ori}}))}\right\|_1$ 其中通过进行自归一化以消除注意力大小的影响。
边界损失函数 $L_{\mathrm{bdry}}$ ： 其目的是减小 $y_{\mathrm{ori}})$ 和 $y_{\mathrm{sec}}(x))$ （即第二大概率的热力图）之间的距离。如果第二类的注意力大小超过正确类的注意力大小，网络将更加关注关于错误预测的信息，具体形式如下所示： $L_{\mathrm{bdry}}(x)=\|h(x,y_{\mathrm{ori}})\|_1 - \|h(x,y_{\mathrm{sec}}(x))\|_1$ 不同模型的注意力热力图值差异很大，因此自归一化可以提高对抗样本的可迁移性。除此之外还可以考虑 $y_{\mathrm{ori}})$ 和 $y_{\mathrm{sec}}(x))$ 之间的比率，从而得到以下对数边界损失： $L_{\mathrm{log}}(x)=\log(\|h(x,y_{\mathrm{ori}})\|_1)-\log(\|h(x,y_{\mathrm{sec}}(x))\|_1)$

经实验可知，对数边界损失是迁移攻击效果最好的，因此该损失函数被选为目标函数的中的一项。此外，注意力攻击可以很容易地与交叉熵损失函数 $L_{\mathrm{CE}}$ 相结合，则有AoA损失函数如下所示： $L_{\mathrm{AoA}}(x)=L_{\mathrm{log}}(x)-\lambda L_{\mathrm{ce}}(x,y_{\mathrm{ori}})$ 其中 $\lambda$ 是注意力攻击和交叉熵之间的权衡系数。
通过最小化损失函数 $L_{\mathrm{AoA}}$ 来生成对抗样本，令 $x_{\mathrm{adv}}^0=x_{\mathrm{ori}}$ ，则具体的更新过程如下所示： $\begin{aligned}x_{\mathrm{adv}}^{k+1}&=\mathrm{clip}_{\varepsilon}\left(x_{\mathrm{adv}}^k-\alpha \frac{g(x_{\mathrm{adv}}^k)}{\|g(x^k_{\mathrm{adv}})\ \|_1/N}\right)\\g(x)&=\frac{\partial L_{\mathrm{AoA}}(x)}{\partial x}\end{aligned}$ 其中梯度 $g$ 进行 $\ell_1$ 范数正则化，其中 $N$ 表示的是图像像素数量。为了使得对抗扰动不可见，作者通过与原始干净样本的距离来限制对抗攻击的强度。 AoA也可以直接运用到对抗样本的可迁移攻击中，通过输入修改，AoA的可迁移性能得到进一步提高。AoA算法的算法流程图如下所示：

当为有目标攻击时，且攻击目标类别为 $y_{\mathrm{tar}}$ ，则AoA损失函数如下所示： $\begin{aligned}L_{\mathrm{AoA}}(x)&=L_{\mathrm{log}}(x)+\lambda L_{\mathrm{ce}}(x,y_{\mathrm{tar}})\\&=\log(\|h(x,\max\limits_{i \ne \mathrm{tar}}y_{i}(x))\|_1)-\log(\|h(x,y_{\mathrm{tar}})\|_1)+\lambda L_{\mathrm{ce}}(x,y_{\mathrm{tar}})\end{aligned}$

3 线性反向传播（LinBP）

3.1 论文简介

在该论文中，作者重新审视了Goodfellow等人之前提出了一个深度学习模型线性假设，在此基础上作者提出一种增强对抗样本可迁移性的方法线性反向传播（LinBP），这是一种使用梯度的现成攻击以更线性的方式执行反向传播的方法，该方法在神经网络中正常计算前向传播过程，但在计算反向传播损失时，就好像在前向传播中没有遇到一些非线性激活函数一样。

论文链接：https://arxiv.org/abs/2012.03528
代码链接：https://github.com/qizhangli/linbp-attack

3.2 论文方法

Goodfellow等人曾提出一个假设，即对抗样本的可迁移性其主要原因在于深度学习模型其内在的近似线性特征，类似于在同一数据集上训练的线性模型。如下图所示，每个方格表示CIFAR数据集的一个样本，每个方格里的颜色中白色表示该样本经过模型分类为正确的类别，其它的颜色表示模型分类出错为其它类别。可以发现样本沿着某个方向扰动，分类边界呈现线性特征。

尽管该假设在小数据集模型中的实验里得到了验证，但在大数据集中的大型网络上几乎没有经验证据可以验证它，更不用说在实践中使用该假设。所以，在该论文中，作者首先需要验证大数据集中的大型网络上对抗样本的可迁移性根植于模型的近似线性特征。
给定一个源模型 $f:\mathbb{R}^n\rightarrow \mathbb{R}^c$ ，将输入实例分类输出 $c$ 类。在该论文中作者比较基于迁移攻击在模型 $f$ 和更线性的模型 $f^\prime$ （或更非线性的模型 $f^{\prime\prime}$ ）上的成功率。为简单起见，考虑由一系列权重矩阵 $W_1\in \mathbb{R}^{n_0\times n_1}\cdots,W_d \in \mathbb{R}^{n_{d-1}\times n_d}$ 参数化的源模型，其中 $n_0 = n$ 和 $n_d = c$ ，其输出可以写为 $f({\bf{x}})=W_d^{\top}\sigma(W_{d-1}^{\top}\cdots\sigma(W^{\top}_1{\bf{x}}))$ 其中 $\sigma(\cdot)$ 是非线性激活函数，一般情况下激活函数会选择ReLU激活函数。由于模型 $f$ 的非线性仅来自于 $\sigma(\cdot)$ 函数，作者通过简单地删除其中一些 $\sigma(\cdot)$ 函数来获得所需的 $f^{\prime}$ ，从而得到一个与模型 $f$ 共享相同数量的参数和核心架构的模型。与使用泰勒展开并在局部获得线性化的某些工作不同，论文作者的方法（称为线性替换，LinS）会导致全局近似。

证明： 令 ${\bf{z}}_h=h({\bf{x}})$ ， $g$ 是分类器 $f$ 的由第 $k$ 层到第 $d$ 层的子网络，激活函数为 $\mathrm{ReLU}$ 激活函数，即 ${\bf{z}}_g=g({\bf{z}}_h)=W^{\top}_d \sigma(W_{d-1}^\top\cdots \sigma(W^\top_k {\bf{z}}_h))=f({\bf{x}})$ 由矩阵的微分定理可知 $L({\bf{x}},y)=\left(\frac{\partial L({\bf{x}},y)}{\partial {\bf{x}}}\right)^{\top}d {\bf{x}},\quad d L({\bf{x}},y)=\left(\frac{\partial L({\bf{x}},y)}{\partial {\bf{z}}_g}\right)^{\top}d {\bf{z}}_g$ 对 ${\bf{z}}_g$ 求微分可知 ${\bf{z}}_g=W^{\top}_dM_{d-1}W^{\top}_{d-1}M_{d-2}\cdots W^{\top}_{k+1}M_{k}W^{\top}_k d{\bf{z}}_h$ 对 ${\bf{z}}_h$ 求微分 $d{\bf{z}}_h=\left(\frac{\partial {\bf{z}}_h}{\partial {\bf{x}}}\right)^{\top}d({\bf{x}})$ 将以上公式进行整理可得 $L({\bf{x}},y)=\left(\frac{\partial L({\bf{x}},y)}{\partial {\bf{z}}_g}\right)^{\top}W^{\top}_dM_{d-1}W^{\top}_{d-1}M_{d-2}\cdots W^{\top}_{k+1}M_{k}W^{\top}_k\left(\frac{\partial {\bf{z}}_h}{\partial {\bf{x}}}\right)^{\top}d{\bf{x}}$ 进而可推知 $\nabla_{\bf{x}}L({\bf{x}},y)=\frac{\partial L({\bf{x}},y)}{\partial {\bf{x}}}=\frac{\partial {\bf{z}}_h}{\partial {\bf{x}}}W_k M_k \cdots M_{d-1} W_d\frac{\partial L({\bf{x}},y)}{\partial {\bf{z}}_g}\in \mathbb{R}^{n \times 1}$ 当除去激活函数时，此时则有 $M_k=M_{k+1}=\cdots=M_{d-1}$ ，进而则有 $\nabla_{\bf{x}}L({\bf{x}},y)=\frac{\partial L({\bf{x}},y)}{\partial {\bf{x}}}=\frac{\partial {\bf{z}}_h}{\partial {\bf{x}}}W_k \cdots W_d\frac{\partial L({\bf{x}},y)}{\partial {\bf{z}}_g}\in \mathbb{R}^{n \times 1}$ 论文中采用的是行向量，以上证明是用列向量，所以结论得证。
实验是在 CIFAR-10数据集上使用VGG-19网络和批量归一化得到源模型 $f$ 进行的。作者移除最后两个 VGG 块中的所有非线性单元以产生初始模型 $f^{\prime}$ ，即表示为 $f^{\prime}_0$ 。它可以写成两个子网的组合，即 $f^{\prime}_0=g^{\prime} \circ h$ ，所以可知自网络 $g^{\prime}_0$ 是纯线性的。由于这种简单的“线性化”会导致网络在预测干净样本时的准确性下降，因此作者尝试微调 LinS模型 $f^{\prime}$ 。作者评估由模型 $f^{\prime}_0,\cdots,f^{\prime}_m\cdots$ 在第 $0,\cdots,m$ 轮后生成对抗样本的可迁移性。实验结果如下图所示，这表明LinS方法确实可以提高对抗样本的可迁移性，而且在短期微调的情况下，它大大提高了网络的预测精度。当迭代轮数 $\ge 1$ ， $f^{\prime}_m$ 总是有助于生成比模型 $f$ 更多的可迁移对抗样本，在 $f_0^{\prime}$ 上由I-FGSM生成的对抗样本也实现了不错的可迁移性。当迭代轮数 $m = 80$ 时，由于过度拟合，进一步的训练会导致可迁移性降低。还能够发现当模型没有ReLU激活函数时，这两个模型都产生了更多可迁移的对抗样本，因此该假设得到了部分验证。

以上实验已经证实，通过直接去除 ReLU层可以获得提高的对抗样本的可转移性，但是删除越多的 ReLU层并不总是意味着更好的性能，因为直接修改架构不可避免地会降低预测精度。如何在线性和准确性之间寻求合理的权衡是一个论文作者接下来要解决的问题。在该论文中作者提出了线性反向传播LinBP方法，其具体的计算公式如下所示： $\nabla_{{\bf{x}}}L({\bf{x}},y)=\frac{d L({\bf{x}},y)}{d {\bf{z}}_g} W_d\cdots W_k \frac{d {\bf{z}}_h}{d {\bf{x}}}$ 其中 ${\bf{z}}_h=h({\bf{x}})$ ， $g$ 是由 $f$ 的第 $k$ 层到第 $d$ 层组成的子网络，则有 ${\bf{z}}_g=g({ \bf{z}}_h)=W^{\top}_d\sigma(W^{\top}_{d-1}\cdots(W^{\top}_k{\bf{z}}_h))=f({\bf{x}})$ LinBP方法不需要微调，因为它前向计算并做出预测，就像训练有素的源模型 $f$ 一样。如下表可知，与或没有微调的LinS模型相比，LinBP的表现良好，实现了在线性和精度之间进行更合理的权衡。由于（部分）没有 ReLU，它们都显示出比基线更高的计算效率。

对于残差块 ${\bf{z}}_{i+1}={\bf{z}}_i+W^{\top}_{i+1}\sigma(W^{\top}_i{\bf{z}}_i)$ ，标准反向传播计算导数为 $d{\bf{z}}_{i+1}/d{\bf{z}_i} = 1 + W_iM_iW_{i+1}$ ，而“线性化”计算导数为 $\Omega_i = 1 + W_iW_{i+1}$ ，其中 $M_i$ 是一个对角矩阵。作者将梯度进行归一化即在反向传播期间计算 $\alpha_iW_iW_{i+1}$ ，其中 $\alpha_i =\| d{\bf{z}}_{i+1}/d{\bf{z}}_i-1\|/\|\Omega_i-1\|$ ，标量 $\alpha_i$ 是由梯度自动确定。

4 方差调整动量攻击（VMI-FGSM）

4.1 论文简介

在该论文中，作者提出了一种梯度方差调整的对抗攻击的方法，其目的是增强基于迭代梯度的攻击方法生成对抗样本的可迁移性。在每次迭代进行梯度计算时，不再直接使用当前梯度进行动量累积，而是进一步考虑上一次迭代的梯度方差来调整当前梯度，从而稳定更新方向，避免不良局部最优。

论文链接：https://arxiv.org/abs/2103.15571
代码链接：https://github.com/JHL-HUST/VT

4.2 论文方法

给定目标参数为 $\theta$ 的分类器 $f$ 和初始干净对抗样本 $x\in\mathcal{X}$ ，其中 $x$ 是 $d$ 维， $\mathcal{X}$ 表示所有的样本。对抗攻击的形式函数如下所示： $f(x;\theta)\ne f(x^{\mathrm{adv}};\theta)\quad \mathrm{s.t.}\quad \|x-x^{\mathrm{adv}}\|<\epsilon$ 对于白盒攻击，可以把对抗攻击看作是一个优化问题，在 $x$ 的邻域中搜索一个样本，从而最大化目标分类器 $f$ 的损失函数 $J$ ： $x^{\mathrm{adv}}=\arg\max\limits_{x^{\prime}} J(x^{\prime},y;\theta)$

定义（梯度方差）： 给定具有参数 $\theta$ 和损失函数 $\theta)$ 的分类器 $f$ ，任意图像 $x\in\mathcal{X}$ 和邻域的上限 $\epsilon^\prime$ ，梯度方差可以定义为： $V^g_{\epsilon^{\prime}}=\mathbb{E}_{\|x^{\prime}-x\|_p < \epsilon^{\prime}} [\nabla_{x^{\prime}}J(x^\prime,y;\theta)]-\nabla_x J(x,y;\theta)$

令 $V (x)$ 来表示 $V^g_{\epsilon^\prime}(x)$ ，由于输入空间的连续性，不能直接计算 $\mathbb{E}_{\|x^\prime-x\|_p<\epsilon^\prime}[\nabla_{x^\prime}J(x^\prime,y;\theta)]$ 。因此，通过在 $x$ 的邻域采样 $N$ 个样本来近似其值，计算 $V (x)$ 具体形式如下所示：
$V(x)=\frac{1}{N}\sum\limits_{i=1}^N \nabla_{x^i}J(x^i,y;\theta)-\nabla_x J(x,y;\theta)$ 其中 $x^i=x+r_i$ ， $r_i\sim U[-(\beta\cdot \epsilon)^d,(\beta\cdot \epsilon)^d]$ ， $U[a^d,b^d]$ 表示 $d$ 维均匀分布。得到梯度方差后，可以用第 $(t - 1)$ 次迭代的梯度方差 $V(x^{\mathrm{adv}}_{t-1})$ 调整第 $t$ 次迭代的 $x^{\mathrm{adv}}_t$ 的梯度，以稳定更新方向。论文具体的算法流程图如下所示：

5 梯度加速和尺度不变对抗攻击

5.1 论文简介

在该论文中，作者从将对抗样本生成视为优化过程的角度，提出了两种新的方法来提高对抗样本的可迁移性，即Nesterov迭代快速梯度符号方法（NI-FGSM）和尺度不变攻击方法（SIM）。 NI-FGSM旨在将Nesterov加速梯度适应于迭代攻击中，从而有效地预见并提高对抗样本的可迁移性。SIM方法是基于对深度学习模型的尺度不变特性，利用它来优化输入图像尺度副本上的对抗扰动，以避免对白盒模型的过拟合被攻击并产生更多可转移的对抗样本。 NI-FGSM和SIM可以自然地集成以构建强大的基于梯度的攻击，从而针对防御模型生成更多可转移的对抗样本。

论文链接：https://arxiv.org/abs/1908.06281
代码链接：https://github.com/JHL-HUST/SI-NI-FGSM

5.2 论文方法

NAG是在标准梯度下降法中引入一些轻微的改变，它可以加快训练过程并显着提高收敛性。 NAG可以看作是一种改进的动量方法，其可以表示为：
$\begin{aligned}v_{t+1}&=\mu\cdot v_t +\nabla_{\theta_t}J(\theta_t-\alpha\cdot \mu\cdot v_t)\\\theta_{t+1}&=\theta_t-\alpha\cdot v_{t+1}\end{aligned}$ 典型的基于梯度的迭代攻击在每次迭代时贪婪地扰乱梯度符号方向的图像，通常陷入较差的局部最大值，并且比单步攻击表现出弱的可迁移性。但有研究表明在攻击中采用动量可以稳定其更新方向，这有助于摆脱陷入不良的局部最大值并提高可迁移性。与动量相比，除了稳定更新方向之外，NAG的预期更新对先前累积的梯度进行了修正， NAG 的这种前瞻性特性可以帮助更轻松、更快地摆脱不良的局部最大值，从而提高可迁移性。在该论文中作者将 NAG 集成到基于迭代梯度的攻击中，以利用 NAG 的前瞻性属性并构建强大的对抗性攻击，作者将其称为 NI-FGSM。具体来说，在每次迭代中计算梯度之前，会在先前累积梯度的方向上进行一次跳跃。以 $g_0 = 0$ 开始，NI-FGSM的更新过程可以形式化为如下所示： $\begin{aligned}x^{\mathrm{nes}}_t&=x^{\mathrm{adv}}_t+\alpha\cdot \mu \cdot g_t,\\g_{t+1}&=\mu\cdot g_t+\frac{\nabla_x J(x^{\mathrm{nes}}_t,y^{\mathrm{true}})}{\|\nabla_x J(x^{\mathrm{nes}}_t,y^{\mathrm{true}})\|_1}\\x^{\mathrm{adv}}_{t+1}&=\mathrm{Clip}_x^\epsilon\left\{x^{\mathrm{adv}}+\alpha\cdot \mathrm{sign}(g_{t+1})\right\}\end{aligned}$ 其中 $g_t$ 表示迭代 $t$ 处的累积梯度， $\mu$ 表示 $g_t$ 的衰减因子。

除了为对抗攻击考虑更好的优化算法外，作者还通过模型增强来提高对抗样本的可迁移性。作者介绍了保损变换和模型增强的正式定义如下所示：

定义（保损变换）: 给定一个输入 $x$ 及其对应的真实标签 $y^{\mathrm{true}}$ 和一个分类器 $x\in\mathcal{X}\rightarrow y \in \mathcal{Y}$ 和交叉熵损失 $J (x, y)$ ，如果存在输入变换 $\mathcal{T}(\cdot)$ 对于任意 $\in\mathcal{X}$ 满足 $J(\mathcal{T}(x), y^{\mathrm{true}}) \approx J(x, y^{\mathrm{true}})$ ，则此时 $\mathcal{T}(\cdot)$ 是一个保损变换。

定义（模型增强）: 给定一个输入 $x$ 及其对应的真实标签 $y^{\mathrm{true}}$ 和一个分类器 $x\in\mathcal{X}\rightarrow y \in \mathcal{Y}$ 和交叉熵损失 $J (x, y)$ ，如果存在保损变换 $\mathcal{T}(\cdot)$ ，使得 $f^(x)=f(\mathcal{T}(x))$ ，则此时新的模型为原始模型的模型增强。

在该论文中，作者通过模型增强从原始模型中推导出一组模型，这是一种通过保损变换获得多个模型的简单方法。为了获得保损变换，作者发现深度神经网络除了平移不变性外，还可能具有尺度不变性。具体来说，同一模型上的原始图像和缩放图像的损失值相似。因此，尺度变换可以作为一种模型增强的方法。由上述分析，作者提出了一种尺度不变攻击方法（SIM），它优化了输入图像尺度副本上的对抗扰动： $\begin{aligned}\arg\max\limits_{x^{\mathrm{adv}}}&\frac{1}{m}\sum\limits_{i=0}J(S_i(x^{\mathrm{adv}}),y^{\mathrm{true}})\\\mathrm{s.t.}\text{ }&\|x^{\mathrm{adv}}-x\|_{\infty}\le \epsilon\end{aligned}$ 其中 $S_i(x) = x/2^i$ 表示输入图像 $x$ 的比例副本，比例因子为 $1/2^i$ ， $m$ 表示比例副本的数量。使用SIM攻击，作者可以通过模型增强有效地实现对多个模型的集成攻击，而不是训练一组模型进行攻击。更重要的是，它可以帮助避免对白盒模型的“过拟合”被攻击并生成更具可转移性的对抗样本。
对于生成对抗样本的梯度处理，NI-FGSM引入了更好的优化算法来稳定和纠正每次迭代的更新方向。对于生成对抗样本的集成攻击，SIM 引入了模型增强以从单个模型中派生多个模型进行攻击。因此，NI-FGSM和SIM可以自然地结合起来构建更强的攻击，在论文将其称为 SI-NI-FGSM。 SI-NI-FGSM攻击算法的流程图如下所示：

6 代码实例

以下为本文介绍的相关论文算法的pytorch的代码实现，为方便调用将每个算法都定义成一个函数。尤其需要注意的是，在注意力攻击AoA算法时，会涉及到pytorch对损失函数的二次求导操作，并不能简单的用backward()函数进行实现。

from torchvision import datasets, transforms
from torch.utils.data import DataLoader, Dataset
import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.optim as optim
import torch.nn.functional as F
import os

class CNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.Sq1 = nn.Sequential(         
            nn.Conv2d(in_channels=1, out_channels=16, kernel_size=5, stride=1, padding=2),   # (16, 28, 28)                           #  output: (16, 28, 28)
            nn.ReLU(),                    
            nn.MaxPool2d(kernel_size=2),    # (16, 14, 14)
        )
        self.Sq2 = nn.Sequential(
            nn.Conv2d(in_channels=16, out_channels=32, kernel_size=5, stride=1, padding=2),  # (32, 14, 14)
            nn.ReLU(),                      
            nn.MaxPool2d(2),                # (32, 7, 7)
        )
        self.out = nn.Linear(32 * 7 * 7, 10)   

    def forward(self, x):
        x = self.Sq1(x)
        x = self.Sq2(x)
        x = x.view(x.size(0), -1)          
        output = self.out(x)
        return output

epsilon 和 torch.sign()都会影响扰动大小
def AOA_attack(model, input_x, labels, beta, alpha, epsilon):
	input_x.requires_grad = True 
	# Compute CrossEntropyLoss
	outputs = model(input_x)
	loss1 = nn.CrossEntropyLoss()(outputs, labels)
	grad1 = torch.autograd.grad(outputs[0][labels], input_x, retain_graph = True, create_graph=True) # source map、
	one_hot_labels = torch.eye(len(outputs[0]))[labels]
	sec_labels = torch.argmax((1-one_hot_labels)*outputs)
	grad2 = torch.autograd.grad(outputs[0][sec_labels], input_x, retain_graph = True, create_graph=True) # second map 
 	# Compute Log Loss
	loss2 = torch.log(torch.norm(grad1[0],p=1)) - torch.log(torch.norm(grad2[0], p=1)) 
	# AOA loss
	loss = loss1 - beta * loss2
	delta = torch.autograd.grad(loss, input_x, retain_graph = True)
	grad = delta[0]
	return input_x + 0.2 * torch.sign(grad)

def AOA_attack(model, input_x, labels, beta, alpha, epsilon):
	delta = torch.zeros_like(input_x)
	input_x.requires_grad = True 
	# Compute CrossEntropyLoss
	outputs = model(input_x)
	loss1 = nn.CrossEntropyLoss()(outputs, labels)
	grad1 = torch.autograd.grad(outputs[0][labels], input_x, retain_graph = True, create_graph=True) # source map
	one_hot_labels = torch.eye(len(outputs[0]))[labels]
	sec_labels = torch.argmax((1-one_hot_labels)*outputs)
	grad2 = torch.autograd.grad(outputs[0][sec_labels], input_x, retain_graph = True, create_graph=True) # second map 
	# Compute Log Loss
	loss2 = torch.log(torch.norm(grad1[0],p=1)) - torch.log(torch.norm(grad2[0], p=1)) 
	# AOA loss
	loss = loss1 - beta * loss2
	delta = torch.autograd.grad(loss, input_x, retain_graph = True)
	return input_x + alpha * torch.sign(delta[0])



        
def FGM_attack(inputs, targets, net, alpha, epsilon, attack_type):
	delta = torch.zeros_like(inputs)
	delta.requires_grad = True
	outputs = net(inputs + delta)
	loss = nn.CrossEntropyLoss()(outputs, targets)
	loss.backward()
	grad = delta.grad.detach()
	if type == 'FGSN':
		zeta = (torch.norm(inputs, p=0, dim=(2,3), keepdim=True) / torch.norm(inputs, p=2, dim=(2,3), keepdim=True)) * torch.ones(inputs.shape)
		delta.data = torch.clamp(delta + alpha * zeta * grad, -epsilon, epsilon)
	else:
		delta.data = torch.clamp(delta + alpha * torch.sign(grad), -epsilon, epsilon)
	delta = delta.detach()
	return delta


class SIM_NI(object):
	def __init__(self, epsilon, T, mu, m):
		self.epsilon = epsilon
		self.mu = mu
		self.T = T
		self.m = m

	def attack(self, model, images, labels):
		x_adv = images.detach()
		g_t = torch.zeros_like(images)
		loss_fn = nn.CrossEntropyLoss()
		alpha = self.epsilon / self.T
		for t in range(self.T):
			g = torch.zeros_like(x_adv)
			x_nes = x_adv + alpha * self.mu * g_t
			for i in range(self.m):
				x_temp = (x_nes / (2**i)).detach()
				x_temp.requires_grad = True
				outputs_temp = model(x_temp)
				loss_temp = loss_fn(outputs_temp, labels) 
				loss_temp.backward()
				g += x_temp.grad.detach()
			g = g / self.m
			g_t = self.mu * g_t + g / torch.norm(g, p=1, dim=(1,2,3), keepdim = True)
			x_adv = torch.clamp(x_adv + alpha * torch.sign(g_t), -self.epsilon, self.epsilon).detach()
		return x_adv


def SIM_NI_attack(model, images, labels, alpha, mu, m, T):
	x_adv = images.detach()
	g_t = torch.zeros_like(images)
	loss_fn = nn.CrossEntropyLoss()
	epsilon = alpha / T
	for t in range(T):
		g = torch.zeros_like(x_adv)
		x_nes = x_adv + alpha * mu * g_t
		for i in range(m):
			x_temp = (x_nes / (2**i)).detach()
			x_temp.requires_grad = True
			outputs_temp = model(x_temp)
			loss_temp = loss_fn(outputs_temp, labels) 
			loss_temp.backward()
			g += x_temp.grad.detach()
		g = g / m
		g_t = mu * g_t + g / torch.norm(g, p=1, dim=(1,2,3))
		x_adv = torch.clamp(x_adv + alpha * torch.sign(g_t), -0.3, 0.3).detach()
	return x_adv



class VMI(object):
	def __init__(self, epsilon, beta, N, T, mu):
		self.epsilon = epsilon
		self.beta = beta
		self.mu = mu
		self.N = N
		self.T = T

	def attack(self, model, images, lables):
		g = torch.zeros_like(images)
		v = torch.zeros_like(images)
		x_adv = images.detach()
		loss_fn = nn.CrossEntropyLoss()
		alpha = self.epsilon / self.T
		for i in range(self.T):
			x_adv.requires_grad = True
			outputs = model(x_adv)
			loss = loss_fn(outputs, lables)
			loss.backward()
			g_prime = x_adv.grad.detach()
			g = self.mu * g + (g_prime + v) / torch.norm(g_prime + v, p = 2, dim = (1, 2, 3), keepdim = True)
			grad_temp = torch.zeros_like(x_adv)
			for k in range(self.N):
				x_temp = x_adv.detach() + (torch.randn(x_adv.shape)-0.5) * 2 * self.beta
				x_temp.requires_grad = True
				output_temp = model(x_temp)
				loss_temp  = loss_fn(output_temp, lables)
				loss_temp.backward()
				grad_temp += x_temp.detach()
			v = grad_temp / self.N  - g_prime
			x_adv = torch.clamp(x_adv + alpha * torch.sign(g), 0, 1)
			x_adv = x_adv.detach()
		return x_adv

def VMI_attack(model, images, lables, iteration, mu, number, epsilon, alpha):
	g = torch.zeros_like(images)
	v = torch.zeros_like(images)
	x_adv = images.detach()
	loss_fn = nn.CrossEntropyLoss()
	for i in range(iteration):
		x_adv.requires_grad = True
		outputs = model(x_adv)
		loss = loss_fn(outputs, lables)
		loss.backward()
		g_prime = x_adv.grad.detach()
		g = mu * g + (g_prime + v) / torch.unsqueeze(torch.norm(g_prime + v, p=1 , dim=1),1)
		grad_temp = torch.zeros_like(x_adv)
		for k in range(number):
			x_temp = x_adv.detach() + (torch.randn(x_adv.shape)-0.5) * 2 * epsilon
			x_temp.requires_grad = True
			output_temp = model(x_temp)
			loss_temp  = loss_fn(output_temp, lables)
			loss_temp.backward()
			grad_temp += x_temp.detach()
		v = grad_temp / number  - g_prime
		x_adv = x_adv + alpha * torch.sign(g)
		x_adv = x_adv.detach()
	return x_adv




class AoA(object):
	def __init__(self, epsilon, eta, alpha, lambda_, T):
		self.epsilon = epsilon
		self.eta = eta
		self.alpha = alpha
		self.lambda_ = lambda_
		self.T = T

	def attack(self, model, inputs, labels):
		x_ori = inputs.detach()
		x_adv = inputs.detach()
		x_shape = x_ori.shape
		N = float(x_shape[0] * x_shape[1] * x_shape[2] * x_shape[3])
		k = 0
		while torch.sqrt(torch.norm(x_adv-x_ori, p=2)) < self.eta and k < self.T:  ## 3.3591
			x_adv.requires_grad = True  # shape: [1,1,28,28]
			outputs = model(x_adv)
			loss1 = nn.CrossEntropyLoss()(outputs, labels)
			outputs_max, _ = torch.max(outputs, dim=1)
			grad1 = torch.autograd.grad(outputs_max, x_adv, grad_outputs = torch.ones_like(outputs_max), retain_graph = True, create_graph=True) # source map
			one_hot_labels = torch.eye(len(outputs[0]))[labels]
			outputs_sec, _ = torch.max((1-one_hot_labels)*outputs, dim=1)
			grad2 = torch.autograd.grad(outputs_sec, x_adv, grad_outputs = torch.ones_like(outputs_sec), retain_graph = True, create_graph=True) # second map 
			# Compute Log Loss
			loss2 = (torch.log(torch.norm(grad1[0], p=1, dim=[1,2,3])) - torch.log(torch.norm(grad2[0], p=1,dim=(1,2,3)))).sum() / x_shape[0]
			# AOA loss
			loss = loss2 - self.lambda_ * loss1
			delta = torch.autograd.grad(loss, x_adv, retain_graph = True)
			x_adv = torch.clamp(x_adv -  self.alpha * delta[0]/(torch.norm(delta[0], p=1)/N), 0,1).detach()
			k = k + 1
		return x_adv


def main():
	alpha = 0.2
	epsilon = 0.5
	total = 0
	correct1 = 0
	correct2 = 0
	# model = CNN()
	# model.load_state_dict(torch.load('model/model.pt'))
	model = torch.load('model_test.pkl')
	use_cuda = torch.cuda.is_available()
	mnist_train = datasets.MNIST("mnist-data", train=False, download=True, transform=transforms.ToTensor())
	train_loader = torch.utils.data.DataLoader(mnist_train, batch_size= 5, shuffle=True)

	for batch_idx, (inputs, targets) in enumerate(train_loader):
		if use_cuda:
			inputs, targets = inputs.cuda(), targets.cuda()
		inputs, targets = Variable(inputs), Variable(targets)
		total += targets.size(0)
		# print(inputs.shape)

		outputs = model(inputs)
		_, predicted = torch.max(outputs.data, 1)
		print('Original:',predicted[1])

		# image = torch.unsqueeze(inputs[0],0)
		# image = torch.unsqueeze(batch_x[idx],0)
		# label = torch.unsqueeze(targets[0],0)


		# delta1 = FGM_attack(inputs, targets, model, alpha, epsilon, 'FGNM')
		# adv_image1 = torch.clamp(inputs + delta1, 0, 1)
		# adv_image1 = VMI_attack(model, inputs, targets, 10, 0.9, 5, 0.2, 0.2) # successful
		# adv_image1 = SIM_NI_attack(model, inputs, targets, 0.1, 0.9, 5, 10) #successful
		# adv_image1 = AOA_attack(model, image, label, 0.1, 0.2, 0.3)
		# adv_type = AoA(epsilon = 0.5, eta = 0.8, alpha = 0.3, lambda_ = 0.8, T = 10)
		# adv_image1 = adv_type.attack(model, inputs, targets)
		adv_type = VMI(epsilon = 10, beta = 0.3,  N = 10, T = 10, mu = 0.9)  # epsilon太小了
		adv_image1 = adv_type.attack(model, inputs, targets)
		# adv_type = SIM_NI(epsilon=0.5, T=10, mu=0.9, m=4)
		# adv_image1 = adv_type.attack(model, inputs, targets)

		outputs1 = model(adv_image1)
		_, predicted1 = torch.max(outputs1.data, 1)
		correct1 += predicted1.eq(targets.data).cpu().sum().item()
		# print('The FGNM accuracy:', correct1, total, correct1/total)
		print('AOA_attack:', predicted1[1])


		delta2 = FGM_attack(inputs, targets, model, alpha, epsilon, 'FGSM')
		adv_images2 = torch.clamp(inputs + delta2, 0, 1)
		outputs2 = model(adv_images2)
		_, predicted2 = torch.max(outputs2.data, 1)
		correct2 += predicted2.eq(targets.data).cpu().sum().item()
		# print('The FGSM accuracy:', correct2, total, correct2/total)
		print('FGSM:', predicted2[1])
	# print('The FGNM accuracy:', correct1)
	# print('The FGSM accuracy:', correct2)

if __name__ == '__main__':
	main()

你可能感兴趣的:(论文解读,深度学习,人工智能,机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户