电脑报专访微软亚洲研究院院长洪小文

原文地址: http://www.shudoo.com/news/index.php?ac=va&aid=4663

“做研究的,怎么会没经历过失败?”这是微软亚洲研究院院长洪小文最常说的一句话,“成功就是克服一个个伪失败实现的。”

    “嗨,又见面了!”走进会议室的洪小文自然地和记者打招呼。上一次见面是2011年的儿童节,洪小文在北京天文馆作为大家长,带着微软亚洲研究院的上百位研究人员和他们的孩子一起过节,小朋友们还开心地分享了洪小文的生日蛋糕。

    与众多低调的科学家一样,洪小文给人的印象就是沉稳、儒雅,充满亲和力。或许,仅凭成功者具有的从容外表,你很难想象那些在成长经历中让洪小文刻骨铭心的失败。

语言挫折决定了一生的方向
    无挫折,随潮流。或许很多正在上学的朋友都抱着这样的心态随时间天天流逝,年轻时的洪小文也不例外。

    小学努力学习,进入了台北市名望颇高的仁爱国中,随即毫无意外地考上了台湾省最好的高中——建国中学,成绩一直名列前茅,并顺利考上了台湾大学。在中学时期表现出的数学天分,让大学的数学教授们很是欣赏,认为找到了一个培养成国际知名数学家的好苗子。但洪小文却进了电机系——因为当时的潮流就是“最好的人才上电机系”。还没来得及考虑人生方向的他就这么随着大流埋头学习,最终跨越重洋来到美国卡内基梅隆大学。

    “刚到CMU(卡内基梅隆大学的简称)的第一个月,听不同的教授讲课介绍他们的研究方向,然后选择自己的导师决定学习内容。”卡内基梅隆大学比较特别的奖学金分配制度,有利于学生了解导师后再作决定。教授们为了吸引学生投身门下,白天讲课不遗余力展示研究魅力,晚上还开派对与学生交流。

    可是,虽然洪小文英文笔试没有问题,但听力却不能适应。

     “当时刚到美国最好的学校,我还有些战战兢兢。我们这些人考托福,考英文的笔试都很好,但是听力很差。几乎大部分老师讲的很多内容我都听不懂。只有两个导师的英文每一句话我都听得很清楚,因为这两个导师刚好也都是外国人,一个来自印度,一个来自日本,他们讲话比较慢。”  

    洪小文想如果选的导师,他讲的每一句话我都不能听懂,那显然就不靠谱了,所以能听懂的这两位导师要优先考虑。

 
    这两个导师一个是做语音的,一个是做计算机视觉的。最后洪小文选择了语音,其中一个原因是因为语音是一维的,计算机视觉至少是两维,而且大部分做的是三维。

    “我想一维可能会比较简单。我当时的首要目标是要拿到学位,因此我要选一个比较稳妥的方向,而且我的导师讲的每一句话我都要听得懂,在这样的情况下我最终选择了语音。”

    虽然当时洪小文对语音技术还没有什么深入了解,但是事后看起来,这依然是一个幸运的选择。语音技术运用了机器学习,在30年后的今天依然是计算机热点之一,它的应用范围很广,很多领域都可以应用得到。

    更何况洪小文的导师罗杰•瑞迪在1994年的时候还得到图灵奖。

    现在洪小文给博士生们讲起当年的选择,总是说,“你可以批评我没有冒险精神,但是我觉得学语音技术对那个时候的我就是很合适的。”
“我觉得人生选择何尝不是这样,人生很多时候你只能做局部性的优化,没有人能够看到未来,没有人能够知道什么样的东西最好,更何况即使你知道了,其他因素你也不可能控制。”

很高标准上的一个失败
    从卡内基梅隆大学拿到博士学位后,1992年洪小文拒绝了贝尔实验室语音组的邀请加盟了苹果电脑公司,并受公司指派到新加坡组建了一个25人的研究团队,为满足中国及亚太地区用户的需求开发特定的语音及手写技术。

    洪小文的团队成功研发出新一代中文语音和手写输入系统,还在世界计算机大展上获奖。

    然而洪小文在苹果的研发生涯因为两个原因终止。苹果的发展陷入低谷,1994年开始削减研发投入,另一个原因则是来自微软的持续召唤。1994年,苹果步入了成长历程中最为艰难的几年——对个性化创新的极端追求让公司走入了一条迎合小众、孤芳自赏的歧路。业务拓展不利的苹果开始削减研发投入。相反,一直被苹果、IBM的光环所掩蔽的微软开始大放异彩,在操作系统与办公软件等产品领域取得了令人震惊的成绩。 

    微软研究院筹建之初,时任卡耐基梅隆大学计算机系的里克•雷斯特教授负责组建,就邀请过洪小文,如果那时洪小文不去苹果,就会成为微软研究院的元老。洪小文当时不确定语音研究在微软能否得到重视,对微软的了解也不多,因此第一份研究工作落在苹果。

    1995年,微软的同行再次邀请洪小文加盟,这次又被洪小文婉拒,直到几个月后,微软的一再邀约才有结果,洪小文满怀激情加入微软,成为雷德蒙研究院的高级研究员。

    在微软总部的那几年,洪小文既负责过语音技术的基础研究,也领导过Speech.net及自然交互服务产品部门的产品开发。

    “如果要说失败的话,从我个人的标准来看,90年代末、2000年初那会儿语音技术研究,终归没有对社会产生普及影响,我认为这是一种失败。”

    如今,语音技术在智能手机上的应用炙手可热,Windows Phone和安卓手机的语音功能、iPhone 4S的Siri一面市就受到消费者热捧。相比之下,十年前研究的语音技术和产品确实没有今天的普及和火爆的影响。

    “这是研究超前的失败类型。”洪小文分析说失败的类型有好几种,一种是方向性的失败,就是那种投资几年才发现无解的问题;其次是在激烈的竞争中,竞争对手抢先解决了问题;还有一种就是超前研究,因大环境而无法对社会产生巨大影响。

    想想看,十年前移动互联网还没影,智能手机难觅踪迹,语音技术的应用并不是任何地方都那么好用。30年前大师们就预测说语音技术5年后普及,直到今天,大师的回答仍然是5年后普及。

 
    “我不认为语音输入会成为唯一的输入法,现在所看到的语音识别的应用还是集中在智能手机上。”

    从专家的角度,洪小文认为如果只是用语音做输入,结果已经非常准确。语音输入在某些场景适用,但在另外一些场景使用起来还不如原有的GUI(图形用户界面)方便。比如订机票,通过语音输入来填写订票表格就不如通过键盘和鼠标输入更加方便直接。如果要实现订机票、协调酒店、行程安排等一系列更为复杂的旅行规划,则需要借助所有人工智能技术来解决。要解决所有人工智能的问题,语音系统又回归到基础人工智能系统的研究上。本质上其复杂度,可能再有5年也不能确保可以实现。

    让洪小文感到欣慰的是,十年前的语音研究经验对今天日趋火热的机器学习研究很有价值,“这让我们少走弯路。所以要乐观地对待失败,不要气馁,相信所有的探索终有一天会产生作用,”洪小文说除了面临这样的挫折,研究人员其实每天都在面临一个个伪失败。

    “研究过程本身就是由很多伪失败组成的,在一个实验的基础上开始另一项实验,这就是伪失败。但大家乐意见到这种伪失败,排除种种可能之后的创新成果就是跨越伪失败的结果。”

    洪小文善于把失败的负面影响转化成正能量,在学术上成就斐然。洪小文博士不仅是电气电子工程师学会院士(IEEE Fellow),微软“杰出科学家”和国际公认的语音识别专家,还是现任《美国计算机协会通讯》(Communication of the ACM)的编委,并在国际著名学术刊物及大会上发表了百余篇学术论文。他参与合著的《语音技术处理》(Spoken Language Processing) 一书被全世界多所大学采用为语音教学课本。另外,洪博士在多项技术领域拥有36项专利发明。他是CMU SPHINX System的联合发明人之一,这一成果被包括微软、苹果在内的许多公司作为商用语音识别系统的基础加以应用。

互联网时代年轻人更易成功
    “我觉得现在的年轻人非常幸运。在三十年前、二十年前,你不进像微软研究院这样的单位,你可能做不了任何的研究。今天的互联网、手机、电脑等速度发展得很快,又便宜,他们都可以得到而关键的是要有Idea。”

     以前做研究需要购买研究器材,但那时的研究器材动辄就需要花费几百万。今天很多信息上网就可以拿到,有好多共享的社区和资讯。

     过去这几年IT的进展,也证明了几乎能想到的事情都能够做得到。

    “近几年来不管是中国,还是海外,很多很大、很优秀的公司都是一些二十岁不到的小伙子想出来的东西。”

    “我们这些专门做研究的人都应该引以为鉴,不是只有我们能创新,每个人其实都可以创新。所以研究的态度、研究的方式更需要重新来看。”

    “以前国家、皇家实验室感觉才能做的东西,这个今天真的是不存在了。我相信这一代的年轻人肯定有更多的机会做出很了不起、令人敬佩的创新的成果。”

洪小文简介
    洪小文博士毕业于台湾大学,获电机工程学士学位,之后在美国卡内基梅隆大学深造,先后获得计算机硕士及博士学位。

    洪博士曾任苹果公司Apple-ISS研究中心的技术总监,带领团队研发出了苹果中文听写机产品并获得了多项工业界大奖。17年前加入微软公司,现任微软亚洲研究院院长,全面负责微软亚洲研究院的研究工作以及与中国及亚太地区高校、研究机构及政府部门的合作。

你可能感兴趣的:(别人的技术路)