Generating Adversarial Images in Quantized Domains

本文提出了一种有效量化对抗样本的方法,以便在空间域或者JPEG域中生成对抗样本,是以最小量化误差为目标,同时保持量化后图像的对抗性,以及最小化失真。本文提出了拉格朗日公式,并对拉格朗日乘数进行了适当的搜索,从而提高了成功率。本文只针对白盒攻击的有目标和无目标攻击。

符号:

x_o:\left [ \left [ 0,255 \right ] \right ]^N内的原始图像。在进入DNN前经过预处理       N:像素的数量  

预处理:从\left [ 0,255 \right ]\rightarrow [0,1]和规范化

 白盒攻击是将t_o\rightarrow t_a,预处理后x\in [0,255]^N

分类模型

p:[0,255]^N\rightarrow [0,1]^C是将一个图像映射到C类的类概率向量p的分类器

预测的类:

 m范数的优化可以写为:、

 文章采用2范数

白盒设置中的攻击是由对抗性损失驱动的,以制造扰动:

 前面一项是预测x为真实类c(xo)的概率,后面一项为对抗类别的概率

损失函数<0代表预测错误,此时x是对抗样本

a:在有目标攻击时:代表一个参数

      在无目标攻击中:

 Best-Effort Model

本文提出了best-effort模式的概念,实现了攻击和分类器的公平比较,这包含自动攻击设置,这能保证使其在给定的迭代预算中尽可能更好地执行。

通过这种模式,可以找到:攻击是成功的,并且扰动的2范数最小

失真测量在像素域:

 也就是说,如果任何像素i,x_{a,i}=x_{o,i}\pm \epsilon \: then\:d(x_a,x_o)=\epsilon

 问题重述

目标是在附加积分约束的情况下,解决等式4中的定义的优化问题

本文提出了两种弱信号:

 q:代表量化噪声

重新定义失真损失函数

 这二者之间是存在一个权衡的。

例如消去了扰动,x_q=x_o不再是对抗性的

最小失真的对抗图像

 Q代表可接受的解决方案

x_q-x_o=q+u\in \mathbb{Z}^N\Rightarrow q\in Q\subset \mathbb{Z}^N-u,即将\mathbb{Z}^N平移-u

对扰动进行四舍五入的量化:

 增加另一个约束q是有限振幅,引入d \in N_*称为自由度,反映每个分量的选择数量

Generating Adversarial Images in Quantized Domains_第1张图片

 d=0相当于取四舍五入的扰动

无穷范数的量化噪声\left \| q \right \|_\infty \leq 1/2;一般情况下\left \| q \right \|_\infty \leq (1+d)/2

d=\infty扰动被量化为整数。

用积空间Q=\otimes _{i=1}^{N}\mathbb{Q}_i定义可容许量化噪声集

Generating Adversarial Images in Quantized Domains_第2张图片

 容许解的个数是N的指数次方:N:\left | Q \right |=(d+1)^N

假设\forall q\in Q ,q足够小,可以对损失进行一阶近似:

Generating Adversarial Images in Quantized Domains_第3张图片

 对于d足够大,可以确保L (q)< 0x_{q}是对抗性的,但是失真很大

解决

等式21的解由拉格朗日公式给出,

定义函数:

 \lambda \in R_+是拉格朗日乘子,平衡对抗性和失真量

通过q_{\lambda }^{*}:=min_QJ_\lambda (q)有效最小化函数

对于For\:L(q_{\lambda}^{*})\:decrease \:while\:D(q_{\lambda}^{*})\:increase

\lambda =0:所有重要性给失真量D,这导致了期间的量化q\dotplus,消除了20中的u

   =\infty:所有重要性给损失量L,这导致了25中的梯度量化q

失真随着\lambda严格增加,问题21的最优解为q_{\lambda^*}^{*}其中\lambda^*=min\left \{ \lambda:L(q_\lambda^*)<0\right \}

用两步法计算最优解:

 step1:最小化函数

 是一个凸函数,

Generating Adversarial Images in Quantized Domains_第4张图片

 此解不属于先验Q,不可以接受。

等式27可以改写为:

Q上的最小值就是最接近\widetilde{q_\lambda}的元素。这相当于首先量化\widetilde{q_\lambda}\mathbb{Z}^N-u上,然后进行裁剪

  step2,求解最优\lambda^*

 将28带到24中有:

通过观察λc来找到λ *的值。在区间[0.01λc, 100λc]内进行直线搜索。对于每个测试值,我们计算最佳扰动(30),将其与xa相加,并提交给分类器。如果是对抗性的,则λ的值减小。否则会增加。
换句话说,最佳量化噪声q λ给定λ的计算依赖于线性逼近(24),但λ 的发现意味着对分类器进行评估。

JPEG域中的智能量化

Generating Adversarial Images in Quantized Domains_第5张图片

 JPEG域中转换表示为X_a=Jx_a+C

量化

由于x_q=J^{-1}(X_q-C),等式24可以写为:

 对于欧氏距离公式可以写为:

 最后,拉格朗日函数写为:

 根据与空间域相同的推理,当放宽量化约束时,该函数的最小值等于设J^{-1}Q为(28)所给的\lambda
也就是:

 然而,这次舍入是关于Xa的因为我们需要Xa + Q是一个积分向量

 就像在空间域中一样,这个值被裁剪为属于集合Q,定义在(23)用U替换u。
注意,如果原始图像是具有相同质量因子的JPEG格式,因此Xo是一个整数向量,

那么 ,我们恢复一个类似于(30)的量化。

设置

对于空间域

如果原始图像已经分类错误,则x_q=x_o,否则BP生成x_a,本文方法将其量化为x_q

对于JPEG域

x_o首先转换为JPEG格式,如果出发了错误分类,此JPEG版本的x_o就是对抗图像x_q,否则BP将从我们的方法量化到x_q的JPEG原始文件生成x_a

 

 

 

 

你可能感兴趣的:(对抗攻击,人工智能,深度学习)