使用对抗样本的攻击过程

参考文献:针对恶意代码分类模型的对抗技术研究

1、首次提出了一种基于灰度图像的对抗样本攻击算法,生成可执行的对抗样本,用以攻击基于机器学习的以灰度图像为分类依据的恶意代码分类模型。本文首先以灰度图像为依据,修改了One Pixel Attack算法用以生成图像对抗样本,然后将图像对抗样本映射回代码形式,打包成为Android可运行程序,即生成的对抗样本可以通过程序的形式安装、运行。传播,具有现实的攻击意义。对上述算法进行实验验证。首先在Derbin样本集上进行以灰度图像为分类依据的恶意代码分类训练,以得到的模型为对抗样本的攻击目标。然后生成基于灰度图像的可执行对抗样本,实验验证其可执行性和有效性,并提出可能的防御手段。

2、提出了一种基于代码注入的对抗样本制作方法,同样用于攻击以灰度图像为分类依据的恶意代码分类模型。借鉴了基于选择的遗传算法思想提出了一种对抗样本生成算法,将冗余代码注入APK文件反汇编后得到的Smali文件中,经过算法多次迭代,并且经过一系列的处理后得到可执行的对抗样本程序。同样以训练好的分类模型作为攻击目标,实验验证基于代码注入的可执行对抗样本的可执行性和有效性,并分析可能的防御手段。

你可能感兴趣的:(网络安全与人工智能)