通过使用两个神经网络的相互对抗,Ian Goodfellow创造了一个强大的AI工具。而现在,他以及我们所有人都必须开始面对其所带来的后果了。
*本文系mit technology review的人物特写,希望阅读英文原文的读者请拉至文末查看原文链接。
2014年的一晚,Ian Goodfellow和一个刚刚毕业的博士生一起喝酒庆祝。在蒙特利尔一个酒吧,一些朋友希望他能帮忙看看手头上一个棘手的项目:计算机如何自己生成图片。
研究人员已经使用了神经网络(模拟人脑的神经元网络的一种算法),作为生成模型来创造合理的新数据。但结果往往不尽人意。计算机生成的人脸图像通常不是模糊不清,就是缺耳少鼻。
Ian Goodfellow朋友们提出的方案是对那些组成图片的元素进行复杂的统计分析以帮助机器自己生成图片。这需要进行大量的数据运算,Ian Goodfellow告诉他们这根本行不通。
边喝啤酒边思考问题时,他突然有了一个想法。如果让两个神经网络相互对抗会出现什么结果呢?他的朋友对此持怀疑态度。
当他回到家,他女朋友已经熟睡,他决定马上实验自己的想法。那天他一直写代码写到凌晨,然后进行测试。第一次运行就成功了!
那天晚上他提出的方法现在叫做GAN,即生成对抗网络(generative adversarial network)。
该方法已经在机器学习领域产生了巨大的影响,也让他的创造者Goodfellow成为了人工智能界的重要人物。
在最近几年,通过深度学习技术,AI研究人员取得了令人瞩目的进展。向深度学习系统输入足够的图像,它就能进行学习,比如识别出一个将要过马路的行人。这一技术使得自动驾驶技术,Alexa、Siri等会话技术支持的虚拟助手成为可能。
我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。
这标志着无监督学习的一大飞跃
虽然使用深度学习的人工智能工具们能够学习如何识别事物,但它们并不擅长创造事物。而GANs的目标就是赋予计算机类似于想象力的东西。
要实现这一功能并不是简单的让它们能够画漂亮的图片或者谱优美的歌曲,而是要让它们尽量少的依赖人类来告诉它们世界该是什么样子以及它们该怎么工作。
如今,AI程序员通常需要明确告诉机器输入的训练数据是什么,即一百万张图片中哪些图片是过马路的行人以及哪些不是。而这样的过程不仅花费极大,需要大量人工参与,还限制了系统对于一些稍微偏离训练集的数据的处理。
未来,计算机将会更好地消化原始数据,并没有明确命令的情况下,从原始数据中找出它们需要从中学习的东西。
这将标志着 “无监督学习”的一大飞跃。无需离开车库,自动驾驶汽车就可以自学如何处理不同的路况;无需四处走动,机器人就能够预估到在一个忙碌的仓库中可能遇到的障碍。
我们能够想象和思考不同的场景,这是我们作为人的一部分。当未来技术方面的历史学家回过头来看时,可能会把GAN方法的提出看作是迈向创造具有类人意识机器的一大步。脸书的人工智能首席科学家Yann LeCun将GAN称之为‘近20年来深度学习领域最棒的想法’。
前百度大脑首席科学家吴恩达认为GAN代表着“一项重大而根本性的进步”,它鼓舞了全球越来越多的研究人员。
原文链接