谷歌AI发布Deepfake检测数据集,真人多场景拍摄,生成3000段假视频

点击我爱计算机视觉标星,更快获取CVML新技术


本文转载自新智元(AI_era) 。


  新智元报道  

来源:Google AI

编辑:大明

【新智元导读】Deepfake又添劲敌!这次出手的是谷歌。谷歌AI昨日发布Deepfake视频识别数据集,共包含3000多段视频,由真人演员现场多场景拍摄。利用这些数据可以开发Deepfake自动检测工具,更高效地识别Deepfake假视频。

深度学习的发展让一些在几年前看来完全不可能实现的技术变为可能。现代生成模型就是其中的一个例子,能够合成超现实主义的图片、语音、音乐甚至是视频。这些模型已经用在多个应用中,包括通过文本—语音转换,生成用于医学成像的训练数据等。

 

和其他任何颠覆性技术一样,这些技术也带来了新的挑战。“Deepfake”就是其中之一。自2017年底首次出现以来,已经出现了许多开源的Deepfake生成方法,导致合成媒体剪辑视频的数量不断增长。尽管许多人可能只是出于恶搞的目的,但仍可能对个人和社会产生负面影响。

 

Google认真对待这些问题。正如去年在《人工智能七原则》中所说的那样,我们致力于开发AI最佳实践,致力于减少AI技术滥用所带来的伤害和滥用。去年1月,我们发布了合成语音数据集,支持开发高性能合成音频检测器的国际挑战赛。作为该挑战赛的一部分,共有超过150个研究机构和行业组织下载了该数据集,这个数据集现在免费对公众开放。

 

现在,谷歌与Jigsaw合作,发布大型可视化Deepfake数据集,现已纳入Face Forensics视频基准测试。Face Forensics基准测试是德国慕尼黑工业大学和意大利那不勒斯腓特烈二世大学开发的图像测试。

本数据集是由包括Matthias Niessner教授,Luisa Verdoliva教授和FaceForensics团队在内的研究人员合作开发的,现在已经可以在FaceForensics的github页面上下载。

 

谷歌AI发布Deepfake检测数据集,真人多场景拍摄,生成3000段假视频_第1张图片

谷歌Google参与FaceForensics基准测试的视频样本的制作。为了生成这些样本随机选择了几对演员,利用深度神经网络将一个演员的脸换成了另一个演员的头。

 

为了制作这个数据集,在过去的一年中,谷歌与众多演员一起录制了数百个视频。然后使用公开可用的Deepfake生成方法,利用这些视频创建了数千个Deepfake假视频。这些由真实视频和虚假视频组成的数据集可以用于Deepfake的检测和识别。作为FaceForensics基准测试的一部分,该数据集现在已经开放供研究社区免费使用,用户可以用来开发合成视频检测的方法。

 

谷歌AI发布Deepfake检测数据集,真人多场景拍摄,生成3000段假视频_第2张图片

谷歌AI发布Deepfake检测数据集,真人多场景拍摄,生成3000段假视频_第3张图片

演员们在各种场景中拍摄视频。每张图中,上图为真实视频,下图为生成的Deepfake视频,二者之间可能存在着或微妙或明显的变化,具体取决拍视频的演员

 

由于Deepfake发展迅速,后续此数据集将随着Deepfake技术的发展而逐步添加更多内容,并将继续与该领域的合作伙伴合作。

我们坚信,要为蓬勃发展的AI研究社区提供支持,以减轻因滥用合成媒体而造成的潜在危害,本次发布的Face Forensics基准测试中的Deepfake数据集就是向着这个目标迈出的重要一步。

原文链接:

https://ai.googleblog.com/2019/09/contributing-data-to-deepfake-detection.html

GitHub页面(数据集下载):

https://github.com/ondyari/FaceForensics/


CV细分方向交流群

52CV已经建立多个CV专业交流群,包括:目标跟踪、目标检测、语义分割、姿态估计、人脸识别检测、医学影像处理、超分辨率、神经架构搜索、GAN、强化学习等,扫码添加CV君拉你入群,如已经为CV君其他账号好友请直接私信,

请务必注明相关方向,比如:目标检测

喜欢在QQ交流的童鞋,可以加52CV官方QQ群805388940

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

你可能感兴趣的:(谷歌AI发布Deepfake检测数据集,真人多场景拍摄,生成3000段假视频)