2019-05-12强化学习

1.普通恶意软件攻击--------------->普通恶意软件检测模型 -————>使用强化学习技术对 恶意软件进行升级以此来免杀—————>使用升级版的软件再次来训练恶意软件检测模型
2.XSS脚本攻击 --------------------->xss脚本防御模型-------->使用强化学习对xss脚本进行升级以此来绕过脚本防御----->使用升级版的脚本再次来训练xss脚本防御模型

3.如何从恶意软件(PE)中提取特征:

  • 字节直方图
  • 字节熵直方图
  • 文件头信息
  • 输出文件

4.强化学习算法有哪些

  • sasha(萨沙)算法(状态,动作空间都有限)
  • Q learning(状态和动作空间都有限)
  • DQN(状态空间是连续的无限的,动作空间是离散的有限的 用网络来表示一个近似函数表示,输入是状态,输出使各个动作的Q值)

5.keras-rl算法对上面提到的的强化学习算法进行封装为一个智力体对象,智力体对象的常用api 有

  • fit(训练)
  • test(测试)
  • compile(编译)

6.对深度学习模型的攻击
深度学习的训练过程是在迭代中不断调整模型的参数,深度学习的攻击是不断调整图像参数,以此来是深度学习模型判别失误,最终得到对抗图像。常见的深度学习模型攻击方法有:

  • 基于梯度上升的模型攻击
  • 基于FGSM(fast gradient sign method)的模型攻击

你可能感兴趣的:(2019-05-12强化学习)