技术文章 | 智能语音交互:阿里的研究和实践

本文来源于阿里云-云栖社区,原文点击这里


云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲。本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出。

 

在众多的人工智能应用中,智能语音交互是大众能够最近距离接触到的一个。从几年前的手机语音助手,到近年来的互联网汽车、智能音箱、电视、IoT设备等,语音交互正以前所未有的深度和广度,融入雨后春笋般涌现的各种智能设备中。国内外各大互联网公司和众多初创企业都瞄准了智能语音交互这一重要领域,并视其为下一个最重要的流量入口和服务分发途径。不仅是在这些新兴领域,智能语音交互还逐步渗透到传统行业内,助力传统服务智能化。本报告将简要介绍智能语音交互的技术现状,以及阿里巴巴在这一领域的已有研究探索和未来展望。

 

 智能语音交互

智能语音交互,是阿里巴巴iDST智能语音交互团队的核心智能产品体系,将人工智能、语音识别、语言理解、语音合成、人机交互、知识图谱、大数据深度学习、声纹识别等等无缝结合,专注于各类智能终端的能力供给,提供“能听、会说、懂你”的智能语音交互体验。


8b551dceaf378c185209a8f45348af27677aab24


整个东西都是由阿里在自己的平台上,例如基于阿里云计算平台跟大规模弹性服务的平台上进行研发的。我们自己有比较独特的语音深度学习的声学技术,还有比较大规模的语言模型跟解码器技术。语音识别系统是无法为所有场景同时做好服务的,怎么能够在阿里云上做低成本的定制、低成本的服务,这是我们区别于其他单一语音提供商的。我们的产品在阿里内部跟外部都有一些具体的应用。

 展开全文

你可能感兴趣的:(技术文章)