百度世界大会吴恩达演讲视频:
http://www.iqiyi.com/v_19rrocznt0.html#vfrm=2-3-0-1
百度世界大会吴恩达演讲内容:
凤凰科技讯 9月8日消息,2015百度世界大会今日举办,百度首席科学家吴恩达在会上展示了百度深度学习在噪音环境下的语音识别进展,还发布了iOS版脸优APP,通过用户自己上传脸部照片,实时合成在摄像头拍摄的其他脸部上,让视频达到变脸的效果。
吴恩达表示,在如今的海量数据时代,百度拥有的大量数据可以扩大神经网络训练,让效果更好。百度开发了HPC(High Performance Computing,高性能计算)来做深度学习试验,在训练巨大的神经网络之后,使用它提供在线服务。
此外,百度还开发了手机深度学习引擎,将神经网络的模型减少,大量提升运行速度,脸优APP就是一个例子。
吴恩达介绍称,百度还与伊利合作了一个直达号轻应用,可以识别出牛奶盒,并展现一个3D效果图,利用产品包装上的图案提供增强现实体验,不需要特别的图片或二维码。这款轻应用将于两三个月后上线。
关于人工智能的前景,吴恩达称,人工智能的下一步不仅是百度大脑更聪明,也能够使用户也更聪明,技术可以成为人的智能伴侣,提高效率。他表示,对人工智能成为人类合作伙伴的未来充满信心,也希望与大家共同走向智能伴侣时代。
以下为吴恩达演讲实录:
谢谢,大家好,人工智能已经在世界有很大的影响力,百度是引领人工智能发展的公司之一,今天我想跟大家分享一些我们正在做的先进技术,我也希望未来我们能把这些技术开放给我们的合作伙伴。
从李彦宏讲的一席话里我们看到语音识别重要性,百度和北京团队一起正在研究新一代的语音识别技术,让我为大家演示一下。这是一段用户手机的录音,请大家仔细听听,你能听出他在讲什么吗。来。现在请大家闭上眼睛再听一次他到底在讲什么。有时候由于噪音、口音等等,很难听清楚电话那边的人在说什么,我们把这段语音放给我们的语音识别系统得到这个结果,是说中国好声音几点开始,请大家再听一次。
让我们看一下第二个例子,我们听一听。再听一次。这就是语音识别的结果,大床房多少钱,再听最后一次,听到了吗?这个技术还没有上线,目前在很多情况下人的语音识别能力还是比机器识别更准确,但是我们发现如果只有一段很短的语音,尤其是在比较吵的环境下机器识别可以超过人的识别,一年前我没有想到这么快机器就可以做到这点。
我相信语音有很大的潜力改变人与设备的交互方式,现在语音识别可能已达到95%的准确度,但要看你的口音等等来定,很多人没意识到95%的准确度到99%的准确度带来的不是量变是质变,是从你偶尔使用语音变到常常使用做到更自然。做到99%准确,将彻底改变人与设备交互,这个技术的进展让我对人与设备全新交互充满信心。
在百度人工智能技术的进展主要靠深度学习,深度学习的意思是建设巨大的神经网络,语音识别也是用深度学习做的。
我们再看另外一个例子,王劲刚才讲了也是用深度学习做的,我们把图片交给神经网络他就会告诉人面前是什么。
在这一年中我们在深度学习基础架构上有很大的进步,这对人工智能的研究有很大的影响,我们的技术架构分为三个部分,第一就是用于训练的超级计算机,第二就是用于在线服务的云加速器,把训练后的加速器放到云端在线服务。第三就是手机上的深度学习引擎,让我详细解释一下这三个部分。
如今已是海量数据的时代,百度有着大量的数据可以使神经网络训练的更大效果更好。我们开发了HPC来做深度学习试验,这里百度使用很多的GPU做HPC,在使用HPC做深度学习训练上,百度处于世界领先地位。这里做HPC的一个难点是提升GPU的使用效率,2014年HPC深度学习的使用效率是20%左右,我们目前GPU使用效率可以提升到85%,让我们能够更快的训练巨大的神经网络。
使用HPC训练巨大的神经网络之后,下一步是使用它提供在线服务,例如当用户讲话时,系统会实时返回结果。普通的CPU服务器有时候很难做到运行巨大的神经网络,我很高兴像大家宣布百度已经开发了两个加速技术,第一我们开发了FPGA加速器,在很多重要的应用下他可以把速度提升五倍左右。第二我们也开发了GPU加速器,这里GPU不仅用于训练,我们也打算将其用于在线服务。百度的这种技术也是在世界上领先之一,这样做的难点是如果有十个用户在使用一个服务器,我们需要找到一个聪明的方法让一个CPU有效的为十个用户提供服务,使用这个技术,我们可以在在线服务上明显的提升神经网络规模。
对于一些应用,把数据传到云端太慢,影响用户体验,所以我们需要在手机上运行深度学习引擎。用HPC训练了巨大的神经网络后,把这个神经网络运行在这么小的手机上很难的,所以我们开发了手机深度学习引擎。
我们来看一个例子,我们想识别人脸,并理解表情,我们开发了一个深度学习系统,可以识别人脸上的72个关键点,对比其他系统我们识别了比较多的关键点,让我们有更多细节来理解表情。
在手机上运行神经网络,难点是模型规模、速度和错误率,这张图是一个神经网络在PC上运行的结果,这个神经网络对于手机来说太大了,用我们的手机深度学习引擎我们使用了一个聪明的办法,将神经网络的模型减少,还大量提升运行速度。
使用手机深度学习引擎,我们做了一个新的APP叫做脸优,我们刚刚在IOS发布这个APP,用手机拍一张你的照片,用神经网络识别出你的面部,然后和另外一张图片放在一起效果就是这样。让我们为大家演示一下,这就是我的手机,我刚刚今天早上跟我其他的演讲人拍的他们的照片。这就是我的脸变成了就是王劲,也可以变成李彦宏,很好看,这就是Travis 再试一试,很帅。做女性的也可以,其实这就是我妻子的图片,还有这就是我们的CFO,好,就这样,谢谢。如果你有iphone,我希望大家下载玩一下。
脸优是一个娱乐的APP,是需要非常快的响应速度,那么手机深度学习引擎还有什么其他用处呢?假如你和你的孩子一起去超市买东西,你们看见了这盒牛奶,我拿了一盒牛奶,如果你的孩子对这盒牛奶好奇你会怎么办?我们与伊利合作做了一个直达号轻应用,它可以识别出牛奶盒,并让你看到一个3D效果的地图,也可以从不同的角度来看他,从上面可以看,可以啊,远一点,台上灯光很亮,看见了,那你可以从不同的角度看这个地图,如果小朋友点击这个地图也可以看到另外一端牛奶的信息。这个轻应用两三个月后会上线,这个可以利用产品的包装上的图案提供增强现实体验,不需要特别的图片或二维码,增强现实技术可以让你更多的了解我们的世界,我们目前还是和很少的商家合作,希望未来有更多的商家可以使用这个技术,帮助用户了解产品并探索世界。
百度已经有很多人工智能的产品,我们的深度学习基础架构可以让人工智能越来越好,派发出更多更新产品。最后人工智能的未来是什么?在我结束演讲前,我想向大家讲讲人工智能的前景。
很长时间以来我们一直在讲百度大脑越来越聪明,这很重要,他能让我们对用户提供越来越好的服务,但这还不够,人工智能的下一步不止是百度大脑更聪明,也能够使用户也更聪明,像李彦宏提到的度秘,技术可以成为你的合作伙伴,让你变得更有效,虽然是你本人决定去哪里旅行,决定吃什么,决定买什么衣服,但是技术可以成为你的智能伴侣,帮你更好的了解信息,做出选择,做出定,这里技术需要了解你的想法,也需要与你交互,语音识别是一个重要的方法,也是技术与人交互的例子,李彦宏讲的秘书化也是这个意思,因此我对人工智能成为人类合作伙伴的未来充满信心,我也希望与大家共同走向智能伴侣时代。谢谢!