现在在网上做一些事情真是太容易了,这就是后真相时代的生活。但是最近机器学习(ML)和人工智能(AI)的进步使这个问题以指数方式复杂化了。问题已经不再是假新闻那么简单了,而是各种媒体和消费品现在都可以通过人工智能来仿制。从音频、视频剪辑到金融交易和假冒产品——甚至你自己的笔迹也能以惊人的准确度被模仿。那么我们是否能够利用制造这些假货的的计算机系统来轻易揭示它们呢?
人们一直以来都在不断地欺骗,人类历史上充斥着虚假的先知、煽动者、蛇油小贩、小偷和骗子。问题在于,如今任何带有阴谋论和补充品牌的“二小贩子”都能登上YouTube,并迅速吸引全球观众。虽然“事实”的定义取决于你和谁说话,但大多数人在今年1月20日前赞同的一件事是确凿证据的真实性。长期以来,视频和音频记录一直被认为是可靠的证据来源,但是由于人工智能的最新进展,这种情况正在改变。
2016年7月,华盛顿大学的研究人员开发了一种机器学习系统,该系统不仅能准确地合成一个人的声音和说话习惯,而且还能将他们的话语同步到视频上。基本上,你可以伪造任何人的声音并制作一个视频,让其说出任何你想要说的话。以该团队的演示视频为例,他们使用奥巴马总统时每周讲话的录像来训练ML系统。这个递归神经网络学会了把不同的声音特征和它们各自的嘴形联系起来。从那之后,该团队制作了CGI的嘴部动作,在3D姿势匹配的帮助下,将动画嘴唇移到总统的另一段视频上。基本上,只使用相关的音轨,他们就能生成一个逼真的视频。
虽然该团队对这种技术的潜在滥用进行了大量的反击,但在团队眼里该技术却有着更为普遍的用途。“从音频中生成高质量视频的能力可以大大减少视频编码/传输所需的带宽(这在当前的互联网带宽中占很大比例)”他们在研究中提到。合成奥巴马视频的例子说明了一个好处:从音频中学习唇音。“对于有听力障碍的人来说,视频合成可以通过电话音频来进行唇读。数字人类是娱乐应用的核心,比如电影特效和游戏。”
事实上,华盛顿大学并不是唯一一个研究这种技术的机构。去年,斯坦福大学的一个团队首次推出了Face2Face系统。与前者可以从音频生成视频的技术不同,Face2Face从其他视频中生成视频。它使用一个普通的网络摄像头来捕捉用户的脸部表情和嘴巴形状,然后使用这些信息改变YouTube的视频,以最好地匹配用户的表情和讲话——所有这一切都是实时的。
以音频为基础的音频视频转录是双向的。就在华盛顿大学的系统设法从音频流中生成视频的时候,麻省理工学院CSAIL团队想出了如何从无声视频短片中创建音频。而且效果显著,足以愚弄人类观众。
“当你用手指划过葡萄酒杯时,它发出的声音就能反映出里面有多少液体,”该论文的主要作者Andrew Owens在接受麻省理工学院的采访时表示。“模拟这种声音的算法可以揭示关于物体形状和材料类型的关键信息,以及它们与世界相互作用的力量和运动。”
麻省理工学院的深度学习系统经过了几个月的训练,使用了1000个视频,其中包含了46000个声音,这些声音来自不同的物体被戳、击打或用鼓槌进行刮擦。与华盛顿大学算法一样,麻省理工学院也学会了将不同的音频属性与特定的屏幕动作关联起来,并在视频播放时合成这些声音。当用真实声音进行在线测试时,人们实际上选择假音频的次数是真音频次数的两倍。
麻省理工学院的团队认为,他们可以利用这一技术来帮助机器人更好地感知环境。“机器人看到人行道,可以本能地知道水泥是硬的,草地是软的,所以知道如果踩到其中任何一个会发生什么事情。” Owens说,“能够预测声音,是能够预测机器人与世界物理互动产生怎样后果的重要第一步。”
当然了,音频合成的研究不仅仅限于大学, 一些大公司也在研究这项技术。例如谷歌开发了Wavenet,这是一种“原始音频波形的深度生成模型”。在计算机生成的文本到语音(TTS)系统的第一个迭代中,是“连接的”TTS。这是一个记录各种各样的语音片段的地方,这些片段被输入到数据库中,然后通过计算机进行重建以形成单词和句子。问题是,输出听起来更像电影里的某个人,而不是真实的人。
另一方面,波形被训练成人们说话的波形。然后该系统进行采样,系统采样数据点的记录每秒高达16000次。为了输出声音,基于之前发出的声音波形使用了一个模型来预测下一个声音。这一过程成本非常昂贵,但与传统的TTS方法相比,它的音频质量更高。
将来,如果这种基于人工智能的手写笔迹在伦敦大学学院被开发出来后被滥用,机器人可能会在官方文件中伪造你的签名。这个系统被称为“My Text in Your Handwriting”程序,只需一个段落的输入,它就可以精确地重现一个实验对象的笔迹。该程序基于“字形”,本质上是每个笔迹的独特特征。通过测量文字水平距和垂直间距、字母和书写纹理之间的连接等各个方面,程序可以很容易地复制样式。
“我们的软件有很多有价值的应用。例如,中风受害者能够编写信件,无需担心写的不清楚。或者送鲜花作为礼物的人,甚至可以在不去花店的情况下写一封手写的信。”伦敦大学大学学院的计算机科学和这项研究的主要作者Tom Haines博士说。“改程序也可以用在漫画书中,书中一段手写的文字可以被翻译成不同的语言,而不会有损作者的原创风格。”
虽然这项技术可以用来制造赝品,但也可以很容易地利用这些技术来发现赝品。“伪造和法医笔迹分析几乎完全是手工过程。” 伦敦大学大学学院计算机科学部门的Gabriel Brostow博士说,“但是,通过把书写的新方法看作是文本合成,我们就可以使用我们的软件来刻画手写的特征,以量化伪造的可能性。”
伪造和伪造产品不会只停留在互联网的边界。经济合作与发展组织最近的估计数字显示,全球假冒商品市场每年约为4600亿美元。这就是Entrupy认证系统的用武之地。(Enter Entrupy是纽约奢侈品认证服务商)
“在理想的世界里,我们不应该存在,”Entrupy首席执行官Vidyuth Srinivasan感叹道。“我们越能在市场上建立信誉,就越能让商业变得更美好。”
该公司首先拍摄了各种各样的奢侈品,并使用该数据库帮助其客户(通常是二手服装商店或eBay卖家等二级零售市场的客户)以大约98.5%的准确率验证产品。顾客会收到一个手持显微镜,并对产品的外观、商标或内衬等进行各种图像的拍摄。然后,这些照片输入到移动应用程序中,并传输到公司的服务器上。在服务器上分类算法开始工作,区分合法商品和假冒商品。如果产品是真实的,Entrupy将提供真实性证书给客户。
尽管该公司的产品数据库丰富多样,但系统的当前功能还是有限制的。像光学、反光或透明的物品判断效果就不太理想,它们没有表面的纹理,而有些东西就不适用该程序,包括瓷器、钻石和玻璃、纯塑料和裸金属。
与讨论的其他基于人工智能的系统不同, Entrupy系统被破坏或被玩弄的可能性很小。Srinivasan解释说:“我们曾模拟造假者假装成顾客和合法的企业来试图购买这个系统,结果也没问题。”这是因为系统并没有告诉用户他们所拍摄的图片实际上是用来验证产品真实性的。“我们要求客户对产品的不同部分进行图像处理,因为这不仅仅是用于验证的纯材料。”他继续说。“这是对物品不同方面的整体看法——从工艺到服装的材质。”以及其他许多元数据的相关内容。
此外,该系统还在不断地更新新数据。一方面来源于该公司,他们假扮成秘密买家来购买假冒商品,另一方面则来源于真正的用户。在认证过程中拍摄的图像——无论是真实还是不真实——都被纳入公司的数据库中,进一步提高了系统的准确性。
“在不久的将来,我认为人工智能和机器学习将成为一个对抗伪造的解决方案,肯定会提高伪造这个门槛,”他总结道。“这是一种间谍与间谍的游戏,猫与老鼠的游戏。”
提高我们辨别假货的能力将迫使造假者提高他们的“游戏水平”,用更好的质量材料和更好的工艺。然而,这将增加这些产品的生产成本。
“任何伪造者的MO都是制造一些他们可以卖得很多的东西,这些东西可以很容易地生产出来,而且不会花费太多的成本”Srinivasan sid说,“否则就没有利润。”
Paypal是互联网顶级金融服务提供商之一,对账户欺诈案件采取了类似的措施。Paypal公司全球风险科学高级总监王辉(Hui Wang)告诉Engadget:“假设我的帐号今天在旧金山被访问,明天又在纽约被访问,后续还显示有其他IP地址,”这种状况就表明了存在某种类型的帐户接管。“为了检测这些欺诈行为”她解释道,“我们追踪了我们跟踪机器的IP,并跟踪了网络。”
该公司创建了一种算法,可以查看IP的IP地址和地理位置信息,然后将其与你的账户历史记录进行比较,以查看这与以前的操作是否匹配。Paypal开发了一种专有技术,将这一IP位置与其他用户进行比较,看看人们在工作中是否对该算法有更大的影响,或者对IP变化有合理的解释——例如:也许你正在纽约出差,然后在机场礼品店买一件纪念品,然后继续旅行。
Paypal公司的AI系统还试图识别之前的每一个IP,无论是酒店的安全以太网连接还是机场的公共WiFi。Wang说:“算法从你的帐户历史记录中检索大量数据,然后查看你网络上的流量,就像其他人使用相同的IP一样。”从这些原始信息中,该算法选择特定的数据点,并使用这些数据点来估计交易是否合法。
大多数这些行为及其随后的决定——例如验证或拒绝支付——都是自动执行的。但是,如果该算法的信任值过低,操作中心的人工调查人员将手动对该事务进行调查。
她继续说道:“我们也正在确保将人工智能反馈到自动化系统中,以便机器学习系统不断学习,改进和提高准确性。”
这些系统,包括那些设计用于生产假货的系统,还有那些揭发假货的系统,目前还处于起步阶段。但是在未来的几十年里,人工智能和机器学习技术将会以我们想象不到方式继续改进。同时,在技术上有一个非常真实的危险,他们也可以制造出更多的难以置信的谎言、恶作剧和假冒产品—— 在我们眼前。
但是,就像之前的活字印刷术、无线电和互联网一样。像这样能够生成真实感内容的人工智能系统,只会和使用它的人的意图一样危险。这是一个可怕的想法。
作者:Andrew Tarantola
原创编译:梓色扬光
原文链接:https://www.engadget.com/2017/11/10/counterfeit-ai-machine-learning-forgery/
“本译文仅供个人研习、欣赏语言之用,不欢迎任何转载及用于任何商业用途。如需转载请注明作者和来源。(本译文所涉法律后果均由本人承担。本人同意平台在接获有关著作权人的通知后,删除文章。”)