我们正处于一个人工智能的时代,人工智能已经应用在生活的方方面面。从手机中的人脸解锁,自拍美颜,语音助手,智能相册到家庭用的智能音箱,智能家电,扫地机器人;从无人驾驶车,无人机到智能交通系统,工业机器人,从 AlphaGo 击败众多顶尖围棋高手,到智能作诗作画,都是人工智能的具体表现形式。
上图:亚马逊的人工智能产品,从左到右分别为智能音箱,无人机和配送机器人
人工智能的英文是“Artificial Intelligence”,简称“AI”。它诞生于上世纪 50 年代在美国的达特茅斯学院 (Dartmouth College) 举行的一个研讨会上,经过几十年的发展,人工智能在诸多领域已经取得了长足的进步。
上图:达特茅斯学院和达特茅斯会议五十年后(2006 年)的部分当事人重聚。左起:摩尔(Trenchard More),麦卡锡 (John McCarthy),明斯基 (Marvin Minsky),赛弗里奇 (Oliver Selfridge),所罗门诺夫 (Ray Solomonof)
人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的科学技术。人工智能让机器能够像人一样具有感知能力,认知能力和创造能力。感知能力简单的说就是人类的听、说、读、写、看等能力。比如说 AI 现在已经具有图像识别,人脸识别,语音识别,语音生成,语言理解等能力。认知能力指的是通过学习、判断、分析来了解知识、获取知识的能力。例如,AI 已经可以帮助医生进行医疗影像的分析,帮助电商进行消费行为的分析等等;另外下围棋和无人驾驶也是 AI 在认知领域的重要应用形式。创造能力指的是产生新思想,新发现,新方法,新理论,新设计,创造新事物的能力,像 AI 作曲、AI 作诗、AI 小说、AI 绘画、AI 设计等。
人工智能是人类赋予给机器的,无论人工智能如何思考问题或者拥有什么样的本领,都需要人类为它编写相关的程序,这就是编程。编程是一门思考的艺术,就像音乐和绘画一样,把脑子里的想法实现出来,然后人工智能就会遵照程序中一步一步的设定(也就是算法)进行执行。编写更好的程序,使用更好的设定,就能更好的实现人工智能。同时,人工智能也离不开大数据和互联网的支持。尤其是智能手机,平板电脑,智能设备等的移动互联,生成了越来越多的数据。我们提供给人工智能的数据越多,它也就会越来越智能。
人工智能有很多实现的方式。目前,实现人工智能的主流方式是机器学习。机器学习就是让机器能够学习人类的思维过程,模拟和实现人类的学习行为,来获取新的知识和技能。机器需要不断的学习才能越来越聪明。和人类一样,机器可以从三个来源学习。 一种是观察其他人在以往类似情况下所做的事情再做出决定;另一种是在现场观察并且直接尝试提出最佳的决定; 第三种是从先前的成功和失败中进行学习从而作出决定。 这三种方法分别对应于机器学习的三个分支:监督学习,无监督学习和强化学习。 我们可以分别使用这三种不同的方法来教宝宝认识苹果和香蕉。首先,我们可以教宝宝认识这两种水果分别是长什么样子的,比如说苹果又红又圆,香蕉又黄又长,然后宝宝就可以利用我们教过的知识进行苹果和香蕉的分类。这就是监督学习。或者,我们不教给宝宝苹果和香蕉的区别,而是给宝宝几个苹果和几个香蕉,让宝宝自己动手,在这些水果里分辨出哪些是相同的,哪些是不同的,从而进行苹果和香蕉的正确分类。这就是非监督学习。还有,我们先拿出一个水果让宝宝进行尝试区分是苹果还是香蕉,如果宝宝区分正确,就可以得到巧克力,如果宝宝区分错误,就得不到巧克力。之后我们接着拿出更多的水果,这时宝宝通过巧克力的激励,就能够越来越准确的区分出苹果和香蕉。这就是强化学习。
上图:监督学习,无监督学习和强化学习
机器学习通常用来解决下面几类问题,包括回归,分类和聚类。回归是用来进行数值预测的,是监督学习的一种,比如说我们可以使用回归来预测房价,预测客流量,预测电影票房, 预测极端天气等等。分类和聚类都是解决数据属于哪一个类别的问题。分类是向数据分配标签,属于监督学习,更具现实性;而聚类是将相似的数据放在一起,属于无监督学习,更具探索性。
上图:回归,分类和聚类
近年来人工智能的崛起其实是依赖于深度学习的。深度学习是机器学习的一种方法,我们可以把它简单理解为让机器像人类的大脑一样,来进行分层次的学习。比如,在识别人物脸部的时候,就可以把脸型、眼睛、鼻子、耳朵、嘴等看作是不同的层次,深度学习对每个层次的特征进行识别,最后掌握脸部的全部特征,通过这些特征来认出这个人是谁。
当前,深度学习又有了一些更新的进展,包括深度强化学习,深度生成学习等等。深度强化学习把深度学习的感知能力和强化学习的决策能力相结合, 可以直接根据输入的信息进行控制,是一种更接近人类思维方式的人工智能方法。深度强化学习在游戏、下棋、自动驾驶、医疗等领域都有丰富的应用。AlphaGo 就是用深度强化学习的方式进行训练的。在 Dota 2 和星际争霸等游戏对战中,深度强化学习也能够轻松战胜职业玩家。深度生成学习则具有创造新事物的能力,有人认为深度生成学习是十年来最有趣的机器学习概念。深度生成学习使计算机能够学习给定问题的基本模式,并利用该知识基于输入(例如图片、音乐和文本)生成新内容。例如,深度生成学习会基于人脸图片来学习它们普遍具有的特征,然后利用学到的知识生成它所认为的全新的人脸图像。我们就可以基于此,进行图像编辑,图像转表情包,图像转动画,图像分辨率增强,不同年龄段的图像生成,和更多有趣的操作。
上图:深度强化学习和深度生成学习
人工智能既然这么有趣,那么应该如何开始学习人工智能呢?从具体的产品开始,把学与玩相互融合,是不是更有吸引力?碰巧的是,AWS 在人工智能的学习领域正好就有几款这种寓教于乐的产品,包括智能摄像机 (AWS DeepLens),自动驾驶车 (AWS DeepRacer),和智能作曲器 (AWS DeepComposer)。使用这些智能玩具,轻松愉快的快速入门人工智能,何乐而不为?
AWS DeepLens 是全球首款支持深度学习的智能摄像头。它可以让不同年龄和不同技能的人员都可以快速上手深度学习,在目标检测,人脸识别,动作识别,风格迁移等计算机视觉领域进行内容丰富的实践。是不是非常有趣?
上图:AWS DeepLens
AWS DeepRacer 是一辆完全自动驾驶的赛车,只有真实赛车的 1/18 大小,却是由深度强化学习驱动。AWS DeepRacer 提供了一种通过自动驾驶开始深度强化学习的有趣方式。不同年龄和不同技能的人员都可以在模拟器中训练、评估和调整自动驾驶模型,并将模型部署到 AWS DeepRacer 上,从而获得真实世界的自动驾驶体验,并参加 AWS 组织的全球自动驾驶巡回赛,竞逐全球冠军锦标。今年,我们的全球自动驾驶巡回赛将在 F1 西班牙大奖赛的巴塞罗那-加泰罗尼亚赛道的模拟赛道上进行。我们的自动驾驶赛车将与 F1 职业车手展开对抗,其中包括巴塞罗那-加泰罗尼亚赛道目前的世界纪录保持者里卡多 (Daniel Ricciardo)!是不是非常刺激?
上图:AWS DeepRacer
AWS DeepComposer 是世界上第一款采用深度生成学习技术的音乐键盘。不同年龄和不同技能的人员都可以在创作原创音乐输出的同时学习深度生成学习。使用 DeepComposer 无需任何音乐知识。通过提供示例旋律,如《一闪一闪亮晶晶》或《欢乐颂》,DeepComposer 可为您提供快速轻松的入门音乐创作。您可以使用这些示例旋律作为输入,同时结合摇滚、流行、爵士和古典等不同的流派,来生成全新的原创音乐。是不是非常文艺?
上图:AWS DeepComposer
纸上得来终觉浅,绝知此事要躬行。让我们一起动起手来,开始人工智能的实践吧!最后做个小小的提醒,现在互联网上的各种人工智能应用层出不穷,家长在使用宝宝的照片或者视频的时候一定要注意保护宝宝的隐私呦~