转载自:http://www.myzaker.com/article/5a3b02081bc8e0f942000001
12 月 20 日,在由南方财经全媒体集团指导、《21 世纪商业评论》主办、《21 世纪经济报道》联合主办的 "2017 第十届 21 世纪中国商业模式高峰论坛 " 上,科大讯飞高级副总裁杜兰作了一场题为《A.I. 赋能 让一切皆有可能》的演讲,其谈到了 AI 技术和一些行业的结合,能为后者赋能,从而实现其自身的商业价值。在当天的会议现场,杜兰还通过向与会人员播放特朗普的一段视频,展示了科大讯飞的语音合成技术。
以下是演讲实录:
大家下午好!非常高兴今天能够来到这里,因为我刚才有很大的收获。今年其实我在全球参加各种演讲对话大概有 50 场,但是我很少听到像尹烨总这样有激情,有情怀的演讲。因为我相信,他也是和我们一样,在用热爱,用生命在做一个非常有价值的事情。
那么,科大讯飞之前我每次可能还是在两年前,我都会跟大家介绍,我们是来自亚太地区最大的智能语音的上市公司,但是到今天已经越来越多的人看到了我们,把我们甚至推到了风口浪尖上。因为最近各方面的媒体,还有投资界的疑问会非常非常多。实际上我们一直在说,科大讯飞和冲浪型的公司有最大的不同,就是我们实际上在这条路上,在沿着智能语音和人工智能的路上已经陌陌耕耘了 18 年,今天你们看到我们,甚至你们今天可以用我们的讯飞输入法完成 98%的准确率,让机器像人一样,能听会说,能理解会思考,这个路程其实是经过了 60 多年的一个探索。
大家知道人工智能是从 1956 年达特矛斯会议开始的,到今天它是一个跌宕起伏的过程,1970 年迎来了人工智能的第一次浪潮,当时他们认为可能 3-5 年后,这个机器就会具备像人一样的智力了。但是,很快我们发现第一代神经网络是有缺陷的。所以,我们迎来了第一次人工智能的冬天。到 1982 年随着 BP 算法的出现,使得我们又迎来了更高的热情,但是很快我们又发现,我们的计算能力以及我们的算法是有缺陷的。到了 2000 年,我们陷入了第二次人工智能的一个冬天。那么,再到 2006 年我们迎来了第三次浪潮,是随着深度神经网络和深度学习的提出,之后带来了我们的卷型神经网络的发展,才迎来了这次可能的人工智能的大的爆发。而第三次浪潮中,我想提醒大家注意的是,中国的企业不再缺席,而且中国的企业正在其中极具力量。以科大讯飞为代表的一些中国企业,甚至在全球很多领域处于一个非常领先的位置,希望大家今天能够认识到这样一个过程。
那么,今天我想也给大家请来了一位神秘嘉宾,我们先听听他说些什么。
这段视频就是我们让机器说出来了我们想让它说的话,其实这个机器像人一样说话的能力,我们叫做语音合成,合成的能力今天达到什么程度呢?比如说我们的播音员说话是 5 分,普通人说话 4.0 分,今天让机器说中文达到 4.5 分,说英文达到 4.2 分。不仅如此,我们还可以根据你的声纹特点合成你想说的花,大家可能用过像高德导航,听我志玲姐姐非常娇滴滴的声音,那时候我们的语音合成也做到了非常自然的程度,我们花的代价是什么呢?是我们请了志玲姐姐录了十个多小时的音频资料,同时后台用人工标注了 2-3 个月才可以完成,而今天我们合成特朗普的声音,这是 11 月 9 号在北京做我们全年发布会的时候,当时是特朗普总统第一次访华,为了表达我们的热情,就花了十分钟,就做出来这样的一个音频合成的效果,而且这就是我们最新的技术。实际上大家看到这段话已经体会到我们的技术今天进展到这一步。
我们看看最新的这样一些新闻,我可以理解成为,大家对我们在技术上的突破以及在应用上的一些拓展,给予了更多的关注,以及给了更多的一些鼓励。可以看到,最新的 CCTV 的十佳上市公司的榜单发布,它是从去年开始第一次发布,我们是连续两年获得了十佳上市公司的榜单称号,其实有一些数据从背后可以看得出来,因为我们是 1999 年创业的,可能发展到了 2004 年,就是连续五年我们才达到盈亏平衡。我们甚至很长一段时间,我们这么多的中科大的天之骄子,放弃去美国,放弃去很多地方,长期拿着 2000 块钱的工资。我们董事长差点账面上出现没有钱给大家发工资的状态。但是我们咬咬牙过来了,华大基因今年 7 月 14 号上市,很快今年 800 多亿的市值。我们 2008 年上市,上市 30 多亿,今天我们大概是 900 亿左右的市值。所以,大家站在一个不同的起跑线上,我可以告诉大家一个很负责任的一句话,在上市公司的榜单中间,我们做过一个统计,第三方的一个统计,就是连续十年,每年的增长率超过 10%的只有 10 家公司,而我们排在第五位。其实我想这对于一个做研发的公司是多么的不容易。
我们再看一下最新的这则新闻,这个是 12 月 11 号科技部下的一个文件,科技部启动了一个认知智能的国家重点实验室的建设工作,确定了科大讯飞是来做这样的一个重点实验室。实际上这代表了这个认知智能,因为我们想跟大家普及一个概念,就是人工智能发展我们认为分为三个阶段。第一个给段,运算智能。这个就是机器叫能存会算的能够。第二个阶段,感知智能。实际上是机器能听会说和能看会认的能力,比如语音识别、语音合成、自然语言的理解,还有像图像识别,还有医疗影像识别等等,都是这个冷遇上的一些突破,包括大家关心的像无人驾驶、自动驾驶等等,它很多也是用了感知智能这样的一个技术。我想告诉大家的是,运算智能领域,机器已经远远超过人类了,在感知智能领域,在某些特殊的领域,机器也做的比人要好。比如我们今天可以合成这样的声音,说的比你好。听我们可以达到 95%以上,之前会议上可以用一个听见转写和翻译的系统,这个系统上对一个人普通的转化率大概正确率是 95%以上,像我这样的语速,和我说话的水平大概是 99%以上。而我们人类最高的速记员的水平大概只有在 80%左右。
所以,在这个感知智能领域,机器在很多方面也做的比人要强了。最难的是什么?是认知智能,我们认为这是对人类的一个,研究这个人工智能方向上的一个非常大的挑战。因为我们看到,所以中国在今年 3 月份是将人工智能写进了两会的工作报告,而且在 7 月份下发了新一代人工智能的国家发展规划,在去年美国将已经开始将人工智能上升为国家战略,而且发布他们的规划,今年我们也很高兴的看到中国终于将这样一个事情迈上了非常重要的议程。所以今年也启动了认知智能的国家实验室,代表在认知智能的领域,中国非常有机会可以实现更多的一些突破。
那么,再看到这个 11 月份也有一个这样的新闻,就是 BATI 的一个平台的出现。这也是意味着中国在人工智能这个国家队的一个四大平台。我们也希望根据大家各自的特点发挥各自的一些特长,为中国下一轮在人工智能的建设中,以及研发方面的突破能够做出更多的一些贡献。
那么,看到这个机器人,实际上这则新闻也长期困扰了我,因为这则新闻实际上是在 8 月 27、28 号的时候我们做的医考机器人,参加了国家卫计委组织的医师资格考试。因为它是机器人参加考试,所以当时很快我们就知道了它的分数挺高的,肯定是过了。因为 600 分是满分,360 分是及格分,我们一直等着想宣布这样一个消息,卫计委说要等到人类考试的成绩出来以后一起公布。后来在 11 月 6 号左右我们开始公布了,发现我们的机器是 456 分。这是一个什么样的分数呢?我可以告诉大家的是,在我们学医学专业的人员,通过了几年工作经验以后,参加这样一个考试通过率只有一半,这个成绩基本上是在人类考生的前 4%到 5%左右,所以可以说,它已经战胜了绝大多数的人类。到 2020 年卫计委说要为每个家庭配备一个医生,这个怎么样实现?有华大基因的努力,更有我们这样的机器人的出现,可以帮很多医生做一些赋能的工作。比如一线最优秀的医生,我们可以提高他的效率,而像一些不是那么优秀的医生,可以通过机器人的帮助使得他具备最优秀的医生的一些能力,我想这就是我们可以去给大家提供的更多的一些帮助。
这是今年 6 月份的一则新闻,这则新闻我认为是这轮资本市场上很火的一个理由,因为这是我回过头来看的。今年其实很多人,见到我的时候说,要请你吃饭。我说为什么?他们说因为大概一般都是在 3、4 月份可能是听过我的演讲,或者是我们在做一些战略合作的时候我们有接触,他们认为这是一家值得拥有的公司,那时候我们的股价在 27 块钱以下,从 6 月份,不断的攀升,攀升到 74 块。当时 MIT 商业评论每年都会出具一个榜单,这个榜单中国的企业有 9 家已经上榜了,其中大陆是 7 家,台湾是 2 家。很欣喜的是科大讯飞的能力被屏为全球第六和中国第一,这样一个榜单的发布对我们也起到了一个很大的鼓舞作用,我们也相信我们在技术上的突破逐渐引起了全球各方的关注。因为今年 2 月份纽约时报出了一则新闻,我 3 月份在华盛顿参加财富论坛的路演的时候,当时他们的联合主席就曾经问过我一句话,他说纽约时报上曾经提出来,中国在人工智能这个领域上的发展已经让每个人感到受威胁了,因为他把两国在这个方面的较劲上升到军备竞赛的高度。所以,越来越多的中国企业已经出现在全球人工智能在研发领域的一个非常前沿的一个位置。
纵观这样的一些过程,实际上我相信大家已经感受到人工智能它是离我们越来越近了。在两年之前我们大胆的预言,我们认为在万物互联、人机交互的一个时代的到来,会使得语音成为一个非常自然的方式。同时,我们也预言未来 3-5 年后,人工智能将会像水和电一样无处不在,它会影响到我们每个人的生活。那么,今天看来它确实是离我们越来越近。我们也认为谁能够拥有源头技术的创新,谁就会掌握未来,谁就可以在新的人工智能的竞赛中掌握更强的主动性,而且能够给大家带来更多更多的一些应用,新的一些体验。
那么,看这张科大讯飞的人工智能核心技术的表,我们就可以看到,其实刚才主持人也介绍了,我们不仅仅是一家做智能语音的公司,我们更是一家做人工智能的公司。因为我们更重要的,要想让机器听懂你说的是什么?它不仅要具备能听会说的能力,更重要的是要有一颗会思考的大脑和一颗懂你的心。除了像语音合成的技术上,我们是从 2006 年就开始参加美国的暴风雪竞赛,到 2017 年连续 12 年拿了全球第一,今天已经越来越多的能够给大家带来更多的体验,比如西玛拉亚商大家很多喜欢的书都是机器人读的。前不久喜马拉雅也跟我强调,越来越多新书的出现,越来越多的观众已经接受机器人替他们读书的这种方式。还有像语音识别的技术,我相信在座应该有很多人用讯飞输入法,我真的很希望今天给大家送一个礼物,希望你们下载讯飞输入法,因为我们非常自信,你们用了就不会离开它,今天我们已经有 5 亿的用户,而且输入法上可以提供 22 种方言,包括像粤语的识别,包括英语的识别等等,还有随身翻译的功能,所以我认为这样的一个技术实际上是非常方便大家做更多的文字的一些记录的工作。把我们从重复的劳动中解放出来,做一些更有价值的工作。
机器翻译技术,2014 年之前,中翻英是日本人第一,英翻中美国人第一,我们参加了这个比赛,现在都是中国人第一。如果说想怎么样去懂你的心,怎么样去理解,我们认为让机器能理解,会思考是更加有难度的一件事情。比如我们的常识推理技术,这个比赛是业内被认为替代图灵测试的一个比赛。但是,今天我们人类在认知智能上的这个进步,还有非常大的空间。即使我们拿了全球第一,但是我们的准确率只有 58%。可想而知,人和机器在逻辑推理上还是有很大差别的。
那么,再看看我们的机器阅读理解的技术,这是刚刚今年的,斯坦福做的一个 SQUAD 的一个比赛,实际上是拿了十万篇的英文的文章,让机器去阅读,然后让人来提问题,机器来回答,然后看这样一个准确率。如果我们有这样一些技术,就会有更多的新的应用场景可以出现。再到图像识别和图像理解的一些技术。比如说,像我们业内有一个医疗影像的测试,我们在肺结核这个病历上不断的刷新我们朋友的召回率,从 92.3%,再到 94.1%,不断的打破世界纪录。
在最新的奔驰提出来的一个最新的比赛,叫做 Cityscapes,这个比赛就是我们在自动驾驶领域的一个图像理解技术,我们通过前方的摄像头拍出来的视频或者说图片可以告诉你这是人,是车,还是车轮,还是马路,来帮助你进行一些判断。未来我们要做非常多的自动驾驶的一些应用,这样的技术就会给大家提供非常多的帮助。
所以,很多人都很关心人工智能到底会进行到哪一步,以及它到底会给我们的生活带来怎样的变化?我想主要是两方面。第一,它会改变我们的生活方式。因为当人和机器出现这样的一个互动的状态下,我们可能会用语言,然后我们用一些新的方式和我们生活中的场景发生不断的一些互动。第二,机器能够学习最优秀的人类的能力,然后取代或者是超越我们 90%的普通人。所以说,这样的一个机器的学习优秀的人类的能力可以给大家提供赋能,不仅仅是帮助每个普通人,更重要的是帮助每个行业。所以,AI 是一种赋能型的技术,是一种真正的供给侧的创新引擎。
我看到今天的主题也是谈这样的一个商业的话题,所以我们看看我们 AI 到底能够带来哪些商业价值?能够给大家提供各种各样的一些新的什么样的场景。
我们今天说到整个 AI 公司的发展,就是我们从讯飞的价值观上,这个角度,我们的战略实际上是平台加赛道的战略,平台就是我们在 2010 年就已经将我们的语音技术还有后台的人工智能和大数据的一些技术,就是放到了我们的语音云平台上,是免费开放给广大的开发者的。所以非常多的小伙伴们已经在我们这个平台上聚集,用下面的算法为他的应用提供各种各样的帮助。在这个基础上,我们会选择我们的核心赛道。比如说像教育、智慧城市、医疗,客户服务等等,非常多的领域,我们会选择很有拓展空间,而且已经符合我们企业价值观的赛道不停的往前走。在这样一个 " 平台 + 赛道 " 的战略方向上,我们产生出非常多的应用,刚才提到像讯飞输入法,还有大家知道的可能像翻译机,翻译机也是我们非常火的明星产品,实际上它就是给个人进行赋能,更重要的是我们要给各个行业进行赋能。
比如 AI+ 教育,今天教育发展到什么程度?一个老师用几分钟就可以组一套试卷,他的教师机推送给学生机,学生在上面回到问题,教师很快能看到他回答的问题怎么样,同时后台大数据的算法,能够根据每个学生的特点发现他不同的知识点掌握情况,然后给他推送不同的题目。今天很多省英语口语不是老师回答问题,而是机器,机器人学习的 500 个专家的评阅试卷以后,就可以对剩下的 70 万份试卷进行打分,而且不知疲倦,客观公正。还有现在主观题的作文的阅卷也可以用机器实现了,指的就是比如说学生手写了一份作文,拍照以后上传,我们的机器,因为我们有英文手写识别技术,还有图文混合识别技术,然后根据后台评测的人工智能大数据算法,可以学习优秀老师的棚顶,最后打出分数。同时指出试卷中间有那些问题。所以,非常多的教育会给我们带来很多变革,我们也非常希望通过信息化技术的帮助,使得因材施教真正成为一种可能。
所以,今天我们谈到像在教育上,我们已经在全国有 8000 万的师生在用我们的技术,而且覆盖了 12000 多学校,其中全国的百强名校中间有 68 所。今年的高考里的高考状元有 14 个省的高考状元都用了我们的教学产品。所以我们非常希望 "AI+ 教育 " 带来非常大的空间。
再看看 "AI+ 城市 ",我们希望在后台将很多大数据打通,这不仅仅是技术上的问题,也会有很多行政上的问题。在我们打通过的城市里,看到大数据真的在后台替老百姓跑腿了,因为涉及到企业 5000 多项数据,个人 4000 多项数据,如果打通,节省很多柜台和人员,也节约大家的时间,所以这个我们已经在逐步逐步的实施。
"AI+ 医疗 ",可以想像的首先最简单的有一点,我们的语音电子病历很快就可以实现。当你在牙科医生给你检查牙齿,或者 B 超医生给你做检查的时候,他的双手是没有时间的。所以,他要花时间专门留出来做一线的病历的描述。但是,如果我们现在有了一个这样的专治的耳机以后,他就可以直接把病历记录下来,这样可以大大节约一线医生的时间。同时像影像识别的技术,机器对我们的测评甚至比普通的医生的水平要准确。这个时候他就可以给我们提供更高的一个判断,而且他的特点是非常快,他可以瞬间看很多几十万张片子,能够快速的找到这个问题的正解。所以,我们在一些地区也打造了医疗的综合瘟疹平台,希望给普通医生提供更多的辅助诊疗的举措。
再看看 "AI+ 司法 ",其实在司法领域,目前我们和全国人民最高检察院,还有最高法院都达成了一个战略合作。这个合作实际上就是我们希望用智能问询的系统加快法院庭审的速度,目前在已经使用的法院和检察院的审判过程中,大概已经提升了 30%的效率,大大节约了法官一线人员的时间。同时机器也可以大量的阅读各种卷宗,对你的案件进行一个辅助的判断,他可以给量刑提供一些更多的有价值的信息。实际上在过去的一些案件里边,我们输入进这个系统之后就会发现,它已经有很多自相矛盾的地方,实际上这就是人工智能和司法的给和,有助于机器人的判断,更给老百姓以安全感,更加觉得这是一个公平、公正的一个判断。
我们再看一看 "AI+ 客服 ",客服领域是我们最擅长和最早做的一个领域。我们目前像在运营商,在金融机构,大量的客服已经是我们机器人在接听了。昨天我给广州市委机关干部讲课的时候给他演示了一款我们给海底捞打电话的一个音频录音,基本上没有人听出来对方跟你问答的是一个机器人。实际上这样的一些能力,可以成为我们很多的助手,因为未来人工智能替代人类中间,大量的一些非手工的,非情感的和非创造性价值的一些工作,实际上都可以由机器来替他完成了。
AI+ 车载,在汽车的领域,语音和人工智能用的技术是最适合的一个场景。但是,它对技术上有很大的困难。像车速达到 100 公里的时候,空调也开着有一个自然的噪声,这个环境下汽车能听懂你说的话吗?能够知道你的指令的正确性吗?所以,这一点上,全球唯一能做的达到 90%可用门槛就是科大讯飞的技术。哪怕在 2015 年宝马车在选合作伙伴的时候,在做中文语音技术测试的时候,我们比在美国的对标公司高了 12 个百分点,他依然没有用我们。但是到 2016 年他实在扛不住了,2016 年果断的还是选择了科大讯飞的技术。所以,现在不论宝马、雷克萨斯等都选择了我们的技术,我们大概在汽车领域的覆盖率是 90%。
所以,我们看到在 2010 年已经将我们的语音云平台开放给广大的开发者,今天在这个上面积累了非常多有价值的数据。我们看一下,比如说每一天的日均交互次数已经达到了 40 亿人次,仅仅是一年前才只有 29 亿人次,这个增长速度是非常快的。还有我们累计的终端数达到 15 亿,以及在这个平台上聚集了 46.5 万个创业团队。今天我们不仅仅将这些数据开放给广大的开发者,更重要的是来到全球的很多科学家,科学家们也需要用这样的数据验证他们的算法,所以我们将这样一个平台,希望用人工智能的这些技术赋能开发者成就科学家。
今天我们谈到整个 "AI+" 的时代,因为我们都可以清楚的看到它的趋势,它离我们越来越近,未来像水和电一样无处不在。所以,面临这样一个时代,它不仅仅是从业者的时代,我们在做 AI 的企业,和 AI 的科学家研发的时代,更强的是一个新时代。因为今天是媒体做的一个活动,这段时间非常多媒体关注我们,提了非常非常多关心我们的问题。但是我想说,在中国,在做这样一个源头技术创新的企业它有多么的不容易。其实我们这 18 南来,一直是坚持将核心源头技术掌握在中国人手里,并且做到全球最好的这 18 年,而且这 18 年我们一直是甘坐冷板凳,机器谁都不知道的时候我们一直坚定的做这样一件事情,怀着热爱的心情,这种态度其实坚守了这 18 年。未来我们也依然是坚守在这个方向上,希望代表中国的人工智能产业能够做出我们的一个贡献,同时我们也希望在座的,不论是媒体界、企业界、科技界的伙伴们,都能够支持中国做源头科技创新的一些企业,希望大家能够共同感到更加美好的世界,谢谢大家!