语音机器人的关键,并不在于语音识别

近年来,人工智能(AI)越来越受关注。人工智能催生了新产业、新业态和新模式,推动经济社会从数字化、网络化向智能化加速跃升,并对人们的生活方式和思维方式产生前所未有的深刻影响。国内外众多企业纷纷花上重金投入其中。

据纽约时报估计,仅在芯片领域就有45家人工智能创业公司,从事机器学习、深度学习和常规人工智能项目的更是多达数百家。

当然,人工智能技术并不是我们人类社会追求的目的,而是助力人类实现和发挥更大价值的手段。人工智能的确能在很多领域实现应用,它可以强大我们自身的运算能力、延伸我们的感知和生产能力。

从2010年,富士康在自己的每个代工厂开始部署超过1万台机器工人Foxbot;到2016年,Google的AlphaGo陆续战胜欧洲围棋冠军樊麾,世界围棋冠军李世石;再现在琳琅满目的各种智能音箱:亚马逊Echo、Google Home、苹果HomePod、微软Invoke、阿里天猫精灵、京东叮咚、百度小度...

从实际与人交互和给人感知的角度来说,智能语音识别算是当下人工智能应用最为成熟的技术了。根据Analysys易观《2017年中国人工智能行业分析(智能语音应用篇)》显示,2017年中国智能语音产业规模即破百亿,占人工智能市场规模主要占比。

在语音识别率方面,百度、谷歌,科大讯飞等主流平台识别准确率均在96%以上,稳定的识别能力为语音技术的落地提供了可能。

与此同时,语音交互的核心环节也取得重大突破。语音识别环节突破了单点能力,从远场识别,到语音分析和语义理解有了重大突破,呈现一种整体的交互方案。智能语音整体的交互技术方案突破,也让各大品牌的智能音箱和自2017年开始流行的电话语音机器人有了更佳良好的体验。

由上图语音交互的核心环节构成,可见语音机器人智能狡猾关键,并不只取决于语音识别技术。

语音和按键、触摸、手势等都是人机交互的一种方式,从某种程度上来说,语音识别并非是人工智能相关应用中的关键点。正真的语音智能是在于语言的理解,语言理解并不等同于语音识别。

我们首先要明确一下语音和语言的区别,这是一个基础性的问题。语音(Speech)是语言(Language)的信号载体,语音是人的发音器官发出的,承载一定的语言意义,而语言才承载人类的智慧。通俗的讲,语音是天生就存在的,婴儿的咿呀咿呀也算是语音,甚至其哭声也代表一定的意义,而语言则是需要学习不断进化的。

人机语音交互实际上就是语言的交互,即便语音识别做到100%,对于理解语言来说也没有具体意义,何况语言总是个性的、场景的和情绪的。语言是社会文化的产物,离开了文化就没什么语言可言了。换句话说,脱离场景下的语音识别是没有意义的。

只有结合场景,语音识别后输出的结果,才能通过智能算法、语义处理技术被恰当、准确地应用。电话机器人作为智能语音最典型的的应用产品,它的智能交互,最重要的便是在于场景化下的语音结果处理和响应。

图灵机器科技,便是专注于做场景化下智能语音交互的公司。公司以技术应用创新为原动力,紧跟技术发展和市场需求前沿方向,提供电话通信和业务场景语音交互应用方案交付,通过人工智能和大数据技术为企业赋能,助力企业价值和效率提升。

你可能感兴趣的:(语音机器人的关键,并不在于语音识别)