AI技术持续进步 生成的图片真假难以辨识

人工智慧(AI)造假的技术已引起人们的关注。就目前来说,除了没有评断标准的绘画,人们还是非常轻易就能看出 AI 生成的造假图片,然而随着时间过去、AI 技术持续发展,未来要区分真实和虚假的东西将会变得越来越难。
AI技术持续进步 生成的图片真假难以辨识_第1张图片

最近 DeepMind 和英国赫瑞瓦特大学(Heriot-Watt University)研究团队运用对抗式神经网络(GAN)创造出的机器学习模型 BigGANs 便再度提高了 AI 生成图片的质量,创造出首图可见到的所有图片。

在视觉影像数据库 ImageNet 接受 128×128 分辨率的训练后,BigGANs 在衡量真实度的 Inception Score(IS)大幅超越以往最高得分 52.52,达到与真实影像分数 233 十分接近的 166.3。

单以数字来说可能有些难以体会,我们不妨从下面几张图片来感受一下 BigGANs 的实力。在下面几张组合图片中,分别都有一张 BigGANs 生成的图片混在其中,你看得出来哪些是由 AI 产生的图吗?

AI技术持续进步 生成的图片真假难以辨识_第2张图片

如果看图片久一点,你或许可以看到 BigGANs 创作的图片中有些轻微异常;像是狗狗的眼睛混浊,蝴蝶的翅膀上有奇怪的斑块等,然而以整体来说,这些图片仍旧是截至目前为止 AI 以假乱真的最好创作。

BigGANs 能获得更真实结果的诀窍之一,是让模型训练量变得更大。arXiv 上刊载论文显示,每个模型都需要 128~512 个 Google TPU 3.0 Pod 在 1~2 天内进行训练,训练参数大约是现有技术的 2~4 倍,批次(batch)大小则达到 8 倍。

Brock 强调,要创造令人信服的图片,神经网络必须学习构成人们视觉世界的复杂结构,「你必须『理解』事物才能描绘它。如果我们能够建立完全理解的模型,那么我们可以用它们学到的表现做很多有趣的事情。」

诀窍之二,则是将输出变量控制在更小的范内。由于生成器(generator)的输出是由输入的变化程度控制,透过减少输入的可变性,研究人员让 BigGANs 创造更类似训练数据的图片,质量更高并更真实。

在许多其他研究,我们都可以看到 GAN 技术用在人脸图或影像造假,除了让欧巴马(Barack Obama)、川普(Donald Trump)等政治家说出他们没有说过的话,一些人甚至将类似的技术应用于色情影片修改。

Brock 表示,他也担心恶意使用 GANs 技术的情况,这也是为什么团队选择专注在更一般的图片,而不是人脸建模。「比起人物图片,要把狗网球图片用于政治或不道德的目的要困难得多。」
文章出自:http://www.tsrt.org.tw/post.asp

你可能感兴趣的:(AI技术持续进步 生成的图片真假难以辨识)