什么是语音识别?

实时语音识别是对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。

语音识别的应用场景:

语音搜索

支持各种场景下的语音搜索,如地图导航、浏览器搜索等。可以集成到任何形式的手机应用中,最大限度地解放双手。

语音指令

通过语音命令控制智能设备,实现快捷便利的操作,如控制空调开关、电视换台等。可以集成到智能家居等设备中。

语音短消息

发送或者接收语音短消息时,利用音频转文字能力,实现音频内容快速预览。

视频实时直播字幕

现场演讲场景、实时直播场景下,将视频中的音频实时转写为字幕,还可以进一步对内容进行管理。

实时会议记录

将会议、法庭庭审中的音频实时转写为文字,辅助会议记录工作,同时适用于电视会议等远距离场景。

实时客服记录

将呼叫中心的语音实时转写为文字,可以实现实时质检等。

呼叫中心语音质检

上传呼叫中心的录音文件,通过录音文件识别得到文本,进一步通过文本检索,检查有无违规话术、敏感词等信息。

庭审数据库录入

上传庭审记录的录音文件,进行识别后,将识别文本录入数据库。

会议记录总结

对会议记录的音频文件进行识别,然后通过人工或者自动方法,对会议记录作出总结。

医院病历录入

手术时通过音频记录医生的操作,通过录音文件识别得到文本,提高病例录入效率。

你可能感兴趣的:(什么是语音识别?)