生成对抗网络(GAN)在计算机视觉中的全面解析

在现代深度学习应用中,从计算机视觉到自然语言处理,数据生成方法多种多样。如今,我们已经能够生成几乎能以假乱真的生成数据。生成学习大致可分为两大类:变分自编码器(VAE)和生成对抗网络(GAN)。

为什么不只用自编码器

很多人疑惑,为什么研究人员要使用复杂的GAN,而不是简单地使用自编码器并最小化均方误差,让预测图像与目标图像匹配呢?原因在于,这类模型在图像生成方面效果不佳。仅仅最小化距离会因为平均化操作产生模糊的预测结果,因为L1或L2损失是一个标量,是所有像素的平均量,这就类似于应用了一个基于平均值对像素值进行平均的平滑滤波器。其次,这样的方式无法产生多样性,就像变分自编码器那样。这就是研究界关注GAN模型的原因。

什么是对抗学习

实验表明,深度学习模型在测试时对基于输入微小修改的攻击非常脆弱。比如,一个训练好的分类器能够正确识别图像中的物体并给出正确标签,但可以构造出视觉上几乎无法区分的对抗样本,通过噪声扰动构建的这些对抗图像可能会被错误分类。为解决这个问题,常见方法是将对抗样本注入训练集进行对抗训练,以提高神经网络的鲁棒性。不过,这些技术有些是手工制作的,总会有不同的扰动可以用来欺骗分类器。

换个角度思考,如果我们不关注构建鲁棒的分类器ÿ

你可能感兴趣的:(大数据与人工智能,生成对抗网络,计算机视觉,人工智能,个人开发)