采访百度研究院副院长余凯

个人简介 余凯博士,百度研究院副院长,深度学习实验室(IDL, Institute of Deep Learning)主任,兼任负责百度图片搜索产品的高级总监。中组部第九批"千人计划“国家特聘专家,国际知名机器学习专家。他在中国率先推动大数据人工智能在互联网行业的技术研发和创新。他所带领的团队将深度学习技术成功应用于广告,搜索,图像,语音等方面,取得突破性进展,相继三次获得“百度最高奖”。在他的直接影响下,Andrew Ng等一批世界顶尖技术专家相继加入百度等中国互联网公司。他曾担任斯坦福大学计算机系Adjunct Faculty, 现在是南京大学、北京邮电大学和北京航空航天大学兼职教授,以及中科院计算所客座研究员。

   

1. 余凯老师,您先介绍一下百度深度学习研究院的一些情况?

余凯:就是这个研究院的话是2013年的1月份宣布成立的,真正投入运作是在2013年的7月份,像这种前沿技术的研发机构,百度可以说是第一家。现在,好多中国互联网公司,比如爱奇艺、淘宝都有自己的技术研发团队,这是非常好的一个趋势。我们很高兴扮演一个引领者的脚色,在公司内部,就是技术的研发,特别是深度学习技术,在广告、搜索、语音、图像以及面向未来的,像自动驾驶这些方向,我们都做了很好的一些前沿技术的积累,探索,以及在公司的核心业务上能够落地。比如大家关注的人工智能等技术,进展的速度是超出想象的。

   

2. 据我们了解,现在百度在深度学习方面的一些科研成果,已经超过了Google、Facebook。这方面百度是如何做得,有哪些关键的因素起到作用?

余凯:这个问题问得非常的好。李彦宏在两会上的发言,说人工智能技术我们跟国外的差距不是那么大,有些方面我们做得比国外好,主要是因为这个无论对于哪个国家,这都一个新型的领域,所以我觉得我们还有机会,而且我觉得从百度来讲,公司的投入足够大,决心足够大,比如说我们可以在全球去招聘最好的领军的人物,研究所内部的年轻人才,日常的投入的热情也非常高,加快了我们前进得步伐。还有一点就是百度本身的基因,因为整个搜索这个事情就是一个特别的技术驱动,这里面需要去应用大量的技术,比如机器学习,自然语言了解,图像语音。我们天然跟这个技术有种紧密的基因上的联系,也使的我们在这个领域比其他领域跑得更快。

   

3. 据我们了解,百度系统引入深入学习技术之后,广告点击率有了两位数的提升。我想问一下,像现在这种情况,比如说基于大数据,还有人工智能技术,形成这种技术力,它对小公司是不是有很大的压力,会不会说以后就是其他巨头在做的事情?

余凯:这个问题问的非常好。百度在过去一年多的时间里,就整个广告系统,确实因为深度学习的这种发展,可以说百度是世界上第一个把深度学习应用到广告系统里去,百度现在的蜂巢系统,是我们叫第二代这个机器学习系统,全部是基于深入学习的,对公司的实际影响是巨大的。那是不是说这个东西就是只是大公司的菜?小公司就很难做这个事情?其实我看一定不是这样的。因为深度学习技术恰恰是朝一个让世界更扁平化的方向发展。就是以前的话,我们看语音识别,只有大公司大投入才能做这个事情。但今天我们看到,其实很多的小公司,他自己就能开发语音识别系统,为什么?因为一个更好的技术,出现的时候,它往往是让这个世界变得更加的扁平。以前技术不太好的时候,就需要投入很多的资源,才能把事情做好,通常我们讲技术发展的话,它的意义是什么呢?一个技术的创新是以你更小的资源去做更大更多更好的事情,生物学也是这样。这让很多小公司,不需要投入很多智力资源,只要掌握这个技术,就能把东西做好。里面一些很复杂的东西,不需要知道也能把东西做好。实际上很多领域上深度学习是让世界更加的扁平,让很多小公司更有机会,特别是因为技术的发展,有很多开源系统,很多小公司都可以做了。

   

4. 像您这种科学家,成功地把自己的科研成果应用到商业产品当中去,这可能是很多科学家他一直的梦想,我想问一下,在这个过程当中,您应该承担了很多职责?能分享一下吗?

余凯:这里面的话,我觉得其实好多科学研究,从一定意义上来讲,是一个捅破窗户纸的过程,当然不完全是这样,其实最难的一个东西,就是说,在这么多窗户里面,你知道哪个是可以捅破的?捅破它是有意义的。我自己扮演的一个脚色就说组织大家,说这个方向是有前途的,能产生重大价值,可以走通。但具体的这些事情是我们这边年轻的科学家、工程师他们去做的。我自己可能更多的是营造一个环境,然后去获取资源,指引这个方向,去帮助这些年轻的科学家,让他们能够去展现才能,我更多的是扮演这样一个脚色。

   

5. 您认为深度学习应用范围会有多广,它能多大程度上替代人类?

余凯:首先来讲,就是要纠正一个大家误解。整个技术的发展,我觉得不是替代人类,它是延展人的能力,让人在不擅长的一些领域具备相当的能力。比如说人不擅长的,在高额的数据里做精确数的计算和预测。比如说我们广告系统,计算机就能够做得很好,这个领域是人完全不擅长的。所以说它不是替代人类,像一些很危险的一些工作,比如说矿工,在地下很深的地方去做很危险的作业,这个事情本来就不是人应该来做得,所以将来一定是机器去做。机器是延展人的能力,那么深度学习的话,它扮演一个什么样一个脚色呢?因为所有这些能力都需要有一个大脑,需要有一个对信息的综合的分析、建模、预测、识别、判断、决策。深度学习是扮演一个大脑的脚色,大脑对于人来讲多重要可想而知,我觉得这可以类比在整个的人工智能系统里面,以深度学习为代表的这个机器学习所扮演的脚色。

   

6. 我想问一下,现在百度正在研究各种人工智能产品,现在进展如何,什么时候能够真正的推向普通消费者?

余凯:现在的百度I,我们一开始认为,这个产品它不是面向消费者的产品,它是一个面向垂直领域的一个行业应用。现在有一些垂直领域,比如在博物馆里面,百度I有更好的图像语音识别技术,它能就比自动导游更加智能。在医疗场景里,可以实时进行第一视角的视频的分享,可以用在手术的场景,巡查病房的场景,远程医疗的场景,教育的场景,比如一些医疗操作,是不是符合流程;不同的病人用不同的纱布,是不是符合流程,这都需要有一个设备,所以它在垂直领域里面有巨大的机会,这个是我们在尝试的。百度还有其他的产品,比如快搜,快搜如果让它飞入寻常百姓家,可以判断这个菜它是不是足够营养,成分是怎么样的,是不是盐分过多。现在技术的发展已经到了一个可用的阶段。现在是有一些进展,比如说我们一个和一个知名厂商在一起做一个小规模的批量硬件,这些研发能够深刻改变产品,或者广泛改变人的生活。把这两个维度加在一起的话,就能理解,为什么我们对智能驾驶感兴趣。首先一点的话,它会改变你的生活。第二,是对生产、生活方式的巨大改变,李彦宏昨天演讲,到年底时,我们百度自己会有这么一个智能车,当时是跟某个车场合作的,它能在高速路上自动行使。我觉得对公众来讲,包括我们自己其实也会有这么一个感觉,就是我们可能高估了技术的发展的速度,我们觉得技术发展明显没有那么快,就是影响并没有那么大。但是在10年的这么一个时间维度上,我们又常常觉得低估了技术对我们的影响。在10年前你会知道今天的移动互联网在我们的生活里面扮演什么脚色,你可能想象不到,但我们有足够的耐心。

你可能感兴趣的:(采访百度研究院副院长余凯)