AI视野·今日CS.Sound 声学论文速览
Thu, 28 Sep 2023
Totally 1 papers
上期速览✈更多精彩请移步主页
Speech collage: code-switched audio generation by collaging monolingual corpora Authors Amir Hussein, Dorsa Zeinali, Ond ej Klejch, Matthew Wiesner, Brian Yan, Shammur Chowdhury, Ahmed Ali, Shinji Watanabe, Sanjeev Khudanpur 为代码转换 CS 设计有效的自动语音识别 ASR 系统通常取决于转录 CS 资源的可用性。为了解决数据稀缺的问题,本文引入了语音拼贴(Speech Collage),这是一种通过拼接音频片段从单语言语料库合成 CS 数据的方法。我们使用重叠添加方法进一步提高了音频生成的平滑质量。我们研究了在域 CS 文本和合成 CS 文本的零样本方法的两种场景中生成的数据对语音识别的影响。实证结果表明,域内和零样本场景的混合错误率和字错误率分别相对降低了 34.4 和 16.2。 |
Chinese Abs From Machine Translation |
Papers from arxiv.org
更多精彩请移步主页
pic from pexels.com