2019-01-25 探索攻击逻辑回归图像多分类

盘一下多分类逻辑回归的攻击方案。

#修改label分布, 对于non-target

#还是梯度下降那一套

#求偏导数

 \frac {\partial y_{k}}{\partial x} = \frac{\Sigma \cdot \partial_{x} \exp(a_{k}) - \exp(a_{k}) \partial_{x} \Sigma}{\Sigma^{2}} = \frac {\sum_{c=1}^{K} \exp(a_{c}) \cdot \vec{w}_{k} \exp(a_{k}) - \exp(a_{k}) \sum_{c=1}^{K} \vec{w}_{c} \exp(a_{c})} {\sum_{c=1}^{K}\exp(a_{c}) \cdot \sum_{c=1}^{K}\exp(a_{c})}

结果为

上式展开

#攻击经验总结

在不定向攻击里,得到fooltaget存在着 随着攻击参数变化的分布。可以用混淆矩阵描述这种攻击分布地图,在大部分的攻击里,尽量给图片造成微小的扰动,同时保证安全的区域。

攻击完后的fooledtaget样本,自然可以进行更强防御性模型的训练,有可能需要整整一层来进行防止。

#攻击的通用化,思考向GAN演化可能性

你可能感兴趣的:(2019-01-25 探索攻击逻辑回归图像多分类)