【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)

(1) 引言

不知说到神经网络的应用案例,大家的头脑里最先会浮现出什么?

呵呵,相信不管回答是什么,都跳不出诸如人脸识别、车牌识别、手写字符识别这类思维定式。

其实神经网络的应用远不止这些,下面我会给大家带来一些最新最热的例子。

(2) 应用案例

  1. 游戏AI

不知道大家有没有关注过前一阵的那场比赛。
提到游戏AI,其实除了AlphaGo的DeepMind公司之外,在美国也存在一家名叫OpenAI的公司(也就是号称“硅谷钢铁侠”的埃隆·马斯克早期作为联合创始人之一,投资十万余美金的那个游戏AI公司)。该公司于北京时间2019年4月14日与一支DOTA2世界冠军战队展开了一场比赛,这也是继2018年8月的人机大战失败以来,OpenAI苦练8个月,卷土重来的一场比赛。(我们需要知道,游戏AI是在一个12.8万CPU核、以及256个Tesla P100 GPU并行运算的环境下进行的,其一天的训练时间相当于人类的180年)当然比赛结果也可以称为不枉一番努力,最终AI选手2:0完胜人类选手。在第二局甚至11分钟AI选手就推上了高地,最终人头数46:6。

行话不多说,下图是OpenAI的第一人称游戏视角。

该技术的原理是深度强化学习。通过对不同奖赏和惩罚因子的积累,游戏AI智能体能够在最恰当的时间内,做出最优的操作,完成胜利。

  1. 视频合成

大家知道DeepFeaks吗?

下面这张动图来源于前阵微博热搜上的一段视频。在视频中,网友运用这项技术将杨幂的脸合成到了94版《射雕英雄传》里朱茵的脸上,效果堪称惟妙惟肖。

同样地,在2019年愚人节当天,网友用相同的技术进行了这段直播,称“张国荣复活了”。

这项技术的原理是生成对抗网络,如图所示:
【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)_第1张图片
假设我们有G网络(generator)和D网络(discriminator),G负责从图片库中合成图片来“迷惑”D,D则负责鉴别网络的真伪。经过迭代,G网络的“造假”水平会越来越高,D网络的鉴别能力也会相应地水涨船高。久而久之,两者之间会达到一种平衡(在博弈论里我们称之为纳什均衡),在这种平衡下即使D网络已经具备相当高的鉴别能力,仍难以辨别出G网络传来的以假乱真的图片,这时我们的训练目的也就达成了。

  1. 图像处理

其实除了对视频的处理之外,深度学习神经网络也大量的用在图像处理中,例如下面这项名为Photo Wake-Up的工作。
【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)_第2张图片
这项工作是运用了深度的方法,让AI在图片中定位出需要运动渲染的人物模型,再经过蒙皮估计、3D运动合成等操作,最终形成可变的人物模型。

当这项工作和增强现实结合起来后,效果可谓更加地惊艳。

或许看完后大家会发现,原来深度学习神经网络能做的工作,竟是如此的酷炫。(#^ . ^#)

(3) 人工智能/神经网络简史

在之前的介绍中,笔者反复提起的高频词汇“人工智能”、“深度学习”、“神经网络”几者之间的关系可以用这张图来表示:
【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)_第3张图片
其中,机器学习是人工智能的核心内容,反映了人工智能具有摄取外部知识、适应环境变化和调整当前状态的能力。

从方法论的角度看,机器学习是“目的”,而神经网络是“方法”,二者的交叉学科我们称之为“神经网络学习”,当神经网络的层数达到一定的规模,也就成了深度学习。

深度学习的发展历史可以说是经历了“三起三落”。
【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)_第4张图片
首先是1943年心理学家和数学家首次提出了MP神经元模型,但在当时也只是提出,并没有引起过多的社会关注。

真正起革命性意义的是1958年美国计算机科学家提出的感知器模型,但很快人们意识到感知器模型无法解决稍微复杂的非线性问题(如异或问题),历史上第一次迎来了人工智能的冬天。

到了1986年,杰佛里·欣顿(2018年图灵奖获得者,“深度学习三巨头”之一)教授提出了反向传播算法,能够较好地解决多层感知器模型之间的权值更新问题,使得神经网络有了真正意义上的“学习能力”,但迫于当时计算机硬件的水平,以及在后来几年提出的支持向量机模型的联合打压下,深度学习的研究又一次地跌入了低谷。

直到2006年,在杰佛里·欣顿教授十几年来的坚持研究下提出了深度信念网络,把神经元的层数上升到了超大规模,并且结合当时计算机硬件的飞速发展(我们知道2006年酷睿2双核处理器都出了,根据摩尔定律,算力和以前根本不在同一个量级,更别说再后来的CUDA、CuDNN等一系列GPU加速库了),学术界对人工的研究进入了空前的高涨。

此外,通过上图不难发现,每一波深度学习浪潮无一不是起始于新算法的提出,终止于当前时代硬件水平能力(算力在每个时代都是供不应求的!)。换句话说深度学习的瓶颈无非这两种情况。笔者认为深度学习技术未来的突破,有赖于新的有效的数学模型(如对脑科学的研究突破),或者更高效的通用计算能力(如云计算、量子计算的普及)

【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)_第5张图片
2017年十九大期间,习近平总书记明确将“人工智能”、“神经网络”列入国家重点发展目标。

随后的一年互联网企业迎来了一波狂热的高薪招聘浪潮。下图是2018年网上疯传的一张互联网校招薪资表,号称“年薪25万只是白菜价”。
【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)_第6张图片
当然除了国内,在国外人们也对人工智能时代的到来给予了足够的重视,如不久前美国和日本把编程列入小学必修课程。

3月27日,日本文部科学省公布了全国小学从2020年度起使用的教科书的审定结果。在算术和理科方面,作为新的必修内容加入了编程教育。日本在IT教育方面的滞后被指出,希望借助此举培养短缺的IT人才。 ------ 《日本经济新闻》

特朗普6月19日召集了以苹果公司CEO蒂姆·库克等人为代表的18位科技与投资界巨头来到白宫探讨云计算、政府机构的采购制度。库克称,为了解决美国当今各方面AI人才的缺乏,政府应当尽责确保孩子们学习电脑编程。 ------ 《纽约时报》

(4) 讨论

那么在人工智能浪潮的冲击下,一些传统方法或其他行业还有自己的生存发展空间吗?我们又该何去何从呢?
【科普帖】漫谈人工智能/神经网络(最新成果+历史现状)_第7张图片
也许前面吹牛吹得有点过了。

当然,举一国之力而发展一门学科显然是不可取的,这是畸形发展。只有百花齐放,才能构成这个世界的美丽。

学术界一部分人认为人工智能即使发展地再完善,终究也只是一个工具,也只是为了辅助其他学科;还有一部分学者则是认为,当前商业和学术界炒起来的一些理念,实际上和工业界落地的成果之间是存在不小的差距的,当人们普遍认识到这种差距之时,也就是人工智能时代泡沫的幻灭之时

总而言之,不管我们是一味地吹捧它,还是不懈地质疑它,这就是我们所处的时代,这就是事实。

我们所能做的只是去接受它。

你可能感兴趣的:(科普帖)