百度大脑UNIT3.0详解之语音语义一体化方案

在电话客服场景里,用户和机器人交流的过程中,经常会出现沉默、打断机器人、噪声等情况,机器人在应对这些异常情况的时候,需要语音和语义理解技术进行处理,才能实现用户和机器人的流畅交谈。而这些能力的获取与应用,也是企业智能对话项目落地过程中需要解决的难题之一。

为此,UNIT带来了全新的语音语义一体化解决方案,帮助企业解决语音交互过程中的难题。

【电话客服场景下语音语义一体化解决方案】

百度大脑UNIT3.0详解之语音语义一体化方案_第1张图片

语音语义一体化是针对电话客服对话场景的技术方案,可用于呼叫中心智能客服等业务。整个方案包含以下内容:

(1)降低集成开发成本

提供语音识别、语义理解、对话流程控制、知识库、语音合成的打通方案,全双工对话能力,一体化的部署方案,省去开发者对各环节自行调用、拼装的学习成本以及二次开发成本。

(2)标准协议快速接入

提供基于unimrcp框架开发的mrcpserver服务接入包,通过标准协议适配不同呼叫中心设备(主流的freeswitch、avaya、及基于mrcp标准协议自主研发的呼叫中心设备)。

(3)场景定制服务提升效果

方案中自带基于百度大脑呼叫中心下的通用ASR、语义纠错,打断策略,TTS模型,也可以基于开发者的业务场景,提供模型定制训练服务,定向提升业务准确率。

(4)极少量开发,轻松实现对话流程

提供Taskflow配置管理能力,开发者可在梳理业务流程后,通过少量代码快速配置对应的对话流程,后续可直接零代码在UNIT平台上进行拖拽式配置。

百度大脑UNIT3.0详解之语音语义一体化方案_第2张图片

【语音语义一体化方案解读】

(1)语音识别ASR

采用领先的百度语音技术,实时将音频流转识别出文本,并自动识别断句。

(2)全双工对话能力

建立通用机制,组织多模块协同工作,实现双通道数据(文本、事件信号)实时分发及处理。

(3)纠错

根据场景相关词汇生成纠错候选,利用GBDT模型对获选打分排序,最后通过beam search解码出最优纠错结果。

(4)打断

采用分类模型实现,判断是否满足打断条件,并下发打断信号,可支持用户自定义语料的模型训练。

(5)静默及反问

在设定时间内用户未回复情况下,机器人可自动反问。可支持用户对时间条件、机器人反问话术进行配置。

(6)挂机、转人工

定义标准事件信号:挂机、转人工。用户可通过配置、或简单二次开发完成判断条件的设定。

(7)对话理解

基于UNIT强大的语义理解能力,从实时文本中,解析用户意图。

(8)对话逻辑引擎

以可编程的方式构业务建对话逻辑。

(9)语音合成TTS

基于深度神经网络技术,提供高度拟人,流畅自然的语音合成服务,便于应用、设备开口说话,更具个性。

【如何获取语音语义一体化能力】

开发者可以进入UNIT官网——解决方案——语音语义一体化方案页面,了解技术详情并体验真实对话样例。https://ai.baidu.com/unit/v2/static/voice

1、方案了解

2、真实对话样例的体验

百度大脑UNIT3.0详解之语音语义一体化方案_第3张图片

如果您的产品或项目需要使用语音语义一体化方案,请在上述页面下方点击“联系我们”。

点击阅读上一篇相关文章:

百度大脑UNIT3.0解读之对话式文档问答——上传文档获取对话能力

你可能感兴趣的:(百度大脑UNIT3.0详解之语音语义一体化方案)