【AI视野·今日Sound 声学论文速览 第十四期】Thu, 28 Sep 2023

AI视野·今日CS.Sound 声学论文速览
Thu, 28 Sep 2023
Totally 1 papers
上期速览✈更多精彩请移步主页

【AI视野·今日Sound 声学论文速览 第十四期】Thu, 28 Sep 2023_第1张图片

Daily Sound Papers

Speech collage: code-switched audio generation by collaging monolingual corpora
Authors Amir Hussein, Dorsa Zeinali, Ond ej Klejch, Matthew Wiesner, Brian Yan, Shammur Chowdhury, Ahmed Ali, Shinji Watanabe, Sanjeev Khudanpur
为代码转换 CS 设计有效的自动语音识别 ASR 系统通常取决于转录 CS 资源的可用性。为了解决数据稀缺的问题,本文引入了语音拼贴(Speech Collage),这是一种通过拼接音频片段从单语言语料库合成 CS 数据的方法。我们使用重叠添加方法进一步提高了音频生成的平滑质量。我们研究了在域 CS 文本和合成 CS 文本的零样本方法的两种场景中生成的数据对语音识别的影响。实证结果表明,域内和零样本场景的混合错误率和字错误率分别相对降低了 34.4 和 16.2。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

你可能感兴趣的:(Sound,audio,Papers,人工智能,语音,语音识别,音频,声学学习)