探索无需再训练的句间混杂识别

苹果

EXPLORING RETRAINING-FREE SPEECH RECOGNITION FOR INTRA-SENTENTIAL CODE-SWITCHING
 

代码转换是指句子或话语中的语言发生变化的现象,它对传统的自动语音识别系统提出了挑战。由于缺乏多语言训练数据来构建新的、特殊的多语言声学和语言模型,使得代码切换问题变得复杂。在这项工作中,我们提出一个原型研究语码转换语音识别系统,利用现有的单语声学和语言模型,即。,不需要特别训练。为了在母语音素集中生成高质量的外语单词发音,我们使用了现有的声学电话解码器和基于lstm的图形音素到音素模型。此外,利用翻译后的词对借用母语模型中的统计量,建立了语码转换语言模型。我们证明了我们的方法比基于人类标记的技术更好地处理带重音的外国发音。我们最好的系统在不影响单语准确度的前提下,将传统单语语音识别系统的误码率从34.4%降低到15.3%。

你可能感兴趣的:(语音识别)