https://www.toutiao.com/a6662520802170110467/
*以下根据吴恩达2017年9月11日在高山大学(GASA)硅谷站的课程笔记整理而成
GASA大学2017级硅谷站经典课程
《人工智能是新电能》
授课老师:吴恩达Andrew Ng,
斯坦福大学副教授、前百度首席科学家、Coursera联合创始人
我在百度就在讲了这句话:“人工智能是新电能。”100年前,电能给每个企业带来新的改变。今天,当人工智能技术足够成熟之后,会给很多企业带来大的改变。今天我主要人工智能的趋势以及对大家有什么影响。
AI,这个词对大多数人有时候有一种魔术的感觉,但是它具体能做什么?它的技术非常复杂,有很多部分,这两三年进步最快的一部分是 Supervised Learning (监督学习),也就是从a的Input (输入) 到b的Output (输出),什么意思呢?
具体案例说明下:
比如你输入足够多的一个电影影评,可以知道一个电影评价是好是坏;
比如输入一种图片,可以知道图片的好坏(图片识别);
比如输入一段语音,会输出一个文本(语音识别);
比如输入一段英文,会输出一段中文(自动翻译);
比如输入一段文本,会输出一段音频(语音输出);
比如输入一笔费用,会输出很好的回报(消费金融);
输入一段传感器信息,输出一个汽车的位置(自动驾驶)。
AI技术有很多不同的部分,进步最快的就是这个部分,今天有很多空间使用新技术,给企业带来价值,比如语音识别对百度就非常有价值。很多要做人工智能工作的企业需要理解你自己的生意,才能决定如何放入人工智能来创造价值。
不过这种技术有一个缺点,需要大量的数据,需要a,也需要b。
经常有人问我,AI可以做什么?我跟很多团队说,如果有哪个事情想一秒钟就成功搞定,那么这个部分就可以用AI创造价值。
为什么AI会突然在这几年进步这么快呢?如果你的横线是你的数据量 (Amount of data),纵轴是效率或准确度 (Performance),当企业产生大量的数据,传统企业按照过去的算法无法提供数据的计算效率,但如果训练一个巨大的神经网络,效果会非常巨大。
如果你要拿到最好的效果,有两个必要条件:
第一,要训练一个巨大的神经网络 (NN);
第二,要有大数据。
今天很多企业有海量数据,但是在几年之前都没有办法训练足够大的神经网络来实现计算。现在,最好的人工智能团队都可以从算法(机器学习)和超级计算机架构入手。
Supervised Learning (监督学习) 是人工智能的一部分,还有很多其他部分,我做人工智能项目的时候,有时候也需要到AI技术的不同部分。为什么通常只讲supervised learning (监督学习) 和神经网络 (NN)呢?因为这两个领域都进步得非常厉害,其他的部分只是慢慢增加,尤其神经网络在这两年有巨大的突破。
中国今天对深度学习和神经网络有这么大的兴趣,我来分享下神经网络这个词具体是什么。神经网络,对于很多人也有魔术的感觉。
我用具体的案例来说明:
如果你想预测一间房间的价值,横轴是大小,纵轴是价钱,那么输入房间大小,输出一个价格,这是一个最简单的神经网络。
在知道房间大小、睡房数量以及附近居住者的收入水平的前提下,如果买房子的人想知道房间可以住多少人,可以用一个神经元测算出来;也可以通过一个神经元测算是否需要驾车;还可以通过一个神经元测算附近学校的质量。把这些神经元汇合到一起,再通过另外一个神经元输出房子的价钱,这就是神经网络。
最后分享一个细节来了解神经网络的重要性:
如果输入房子的特征(a)和价钱(b),而且有大量的数据(a),它就可以自动学习这中间有什么概念,不用去考虑和担心这些神经元。
过去两年,人工智能的神经网络进步这么快,如果得到很多a,就能够计算出很多正确的b。就像语音识别,输入语音a,输出一个文本b,要做到高质量,需要一万个小时的数据量,也就是10年左右的数据量,但要拿到这些数据的价钱也是不少的。拥有比较准确的语音识别能力,用户也会更愿意使用。中国这几年语音识别的用户量增加得非常快,就在于现在语音识别比较准确。
今天很多人工智能的企业都是开源的,技术本身不能作为壁垒。
要理解另外一个公司的技术并不太难。我在百度和谷歌工作过,对技术比较了解,知道技术是怎么做的,但是如果我没有数据,我就没办法带一个团队做搜索。
如果你可以拿到一点点数据,你就可以通过神经网络来做一个产品。通常一个产品不用做得太好,只要用户能够接受,用户慢慢会有活跃度,用户就会为你产生数据,然后形成正循环,形成壁垒。
如果你有一个用户可以接受的产品,却又被巨头用另外一个产品挖走,那么你的数据就没有办法形成正循环。人工智能获取的战略已经越来越复杂,人工智能团队要想清楚信息获取的战略。
1. 什么是互联网公司?
如果你要为一个传统的购物中心做一个网站或者app,它们还不是一个互联网公司。就像沃尔玛网站,也不是一家互联网公司。你要做一个互联网公司,不在于是不是有网站,最重要的是整个公司的组织是否具有有效利用互联网的能力。
互联网公司会做A/B测试,每天可以做一千次A/B测试,所以互联网公司的学习速度会非常快。互联网公司也会在比较短的时间周期里发布新产品,可以每天发布一个或者20个,传统购物中心不能理解为什么这样做或者怎样做。
互联网公司做决定的能力不是只有CEO一个人,还有很多产品经理或工程师。因为在互联网公司,技术和用户行为比较复杂,没办法都交给CEO一个人做决定。传统购物中心因为变动比较慢,由CEO做决定是没有那么大问题的。因此,是不是互联网公司不是看你有没有网站。
2.什么是人工智能公司?
在人工智能时代,一个传统的互联网公司+神经网络技术,也还不是人工智能公司。一个公司要做成人工智能公司,要组织整个公司有效地使用人工智能的能力。AI现在还处于早期,人们还不能完全理解如何组织公司来使用它。
AI公司获取数据的战略非常复杂,有关战略,我们有时候会讨论好几天或好几星期。数据获取的过程要好几年,真的要一步一步来打。最好的人工智能公司都会把数据放在一个数据库里。
如果你的数据一部分在你个人电脑上,一部分在你办公室电脑上,一部分在某一个数据库里,一部分在另外一个数据库,你的工程师要做一个新的人工智能的话,如何把这些数据放一起给人工智能使用呢?但如果你把数据放进一个数据库,你的软件或者工程师就可以利用完整的数据来训练有效的人工智能。很多公司有很多数据,但是没有办法放在一起,数据的使用效率就会没那么高,你的工程师的工作效率就会慢很多。
在人工智能公司工作的工程师,和传统互联网公司的工程师,工作描述的内容是不一样的。如果你是百度公司的产品经理,你要做一个产品,就会画一个图,然后把图给工程师,工程师再写代码,这样的方式对互联网公司是非常有效的。
但如果你要做一辆自动驾驶汽车,产品经理画一张汽车图,是没有用的。在人工智能时代,产品经理也需要理解怎样获取数据;也要理解怎么和工程师沟通。
20年前,我们不知道A/B测试在今天会变得如此重要。今天,我们还没有人能完全理解人工智能这么重要的概念,谷歌和百度的想法已经比较领先了,但还没有人完全把人工智能的概念讲清楚。
这给了我们什么机会?进入互联网时代,很多新公司有了很多、很大的机会。进入AI时代,有一些传统公司像谷歌、百度都做得非常不错,也给很多新公司很多很大的机会。
AI技术发展这么快,但是理解的人比较少。有效地使用AI来创造价值,就要跨行业,让企业家和专家一起结合合作。因此,从CEO角度,你怎么安排有AI技能的人的工作呢?很多公司的架构是由CEO和不同的事业部组成,那么你怎样通过AI改变他们的工作呢?比如其中一个事业部是做礼品卡的,那么是否可以通过AI改变售卖礼品卡的工作呢?但礼品卡的leader不懂AI,所以它内部很难建成一个AI团队。
我经常对很多公司说,如果能够找到一个独立的AI团队,就把这些有AI能力的人放到不同的团队矩阵去。今天懂AI的人才那么少,他们不一定愿意被不懂AI的人领导,所以可以等过几年AI比较成熟,不需要一个单独的AI部门之后,就可以把AI人才放到公司的不同事业部团队内。
5、6年前,我们都不知道移动互联网能做什么,也没有想到“定位”可以产生这么大的作用,跨行业的团队产生的作用很大。今天,移动互联网技术和手机技术很成熟,大家都可以理解互联网能够做什么,这个时候公司就不需要跨行业团队了。同样,AI现在没有那么成熟,所以很需要跨行业人才。不是每个人都要懂AI,也不是每个CEO都要懂AI,但如果可以找人来帮你建立AI团队,可以让你的团队利用AI拥有不错的机会。
我在谷歌带谷歌大脑团队的时候,做的第一个事情就是给几百个工程师提供人工智能课程。今天,CEO的工作可以从外面选择内容课程,或者找专家和人才来教育你的团队。AI的成熟速度比较慢,很多企业都有很多机会用AI去改变自己的企业。正如过去,大公司都没有看到Uber和Airbnb的机会;在中国,大公司也没有想到滴滴会做到这样子。
高山大学(GASA)是一所以“科学复兴”为使命,以“没有受教,求知探索”为校训,致力于为创业者、企业家培养科学精神的新型大学。由长城会创始人文厨创办,前金山软件CEO张宏江、创新工场创始人李开复、清华大学教授鲁白、红杉资本中国创始合伙人沈南鹏、清华大学教授吴国盛、斯坦福大学教授崔屹、卡内基梅隆大学机器学习学院创始院长Tom Mitchell、加州大学伯克利分校教授杨培东、清华大学苏世民书院院长薛澜、百度总裁张亚勤、斯坦福大学教授张首晟(特别致敬)等联合发起并作为校董。
*笔记内容仅为课程内容的十分之一,报名申请GASA大学,获得全部课程笔记。