Magic Data 论文入选国际语音顶级大会 INTERSPEECH 2022

Magic Data 论文入选国际语音顶级大会 INTERSPEECH 2022_第1张图片

国际语音顶级会议INTERSPEECH 2022预计将于今年9月18日-22日在韩国仁川举办。

Magic Data(北京爱数智慧科技有限公司)联合中科院声学研究所、上海交通大学和西北工业大学,基于语音识别、说话人日志和关键词检索的相关研究论文《Open Source MagicData-RAMC: A Rich Annotated Mandarin Conversational(RAMC) Speech Dataset》脱颖而出,成功入选本次大会。

届时,Magic Data 将作为大会的银级赞助商参与活动,致力于加强工业界和学术界的技术协作,支持会议顺利进行。

Magic Data 论文入选国际语音顶级大会 INTERSPEECH 2022_第2张图片

 

INTERSPEECH是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会。本届会议以“Human and Humanizing Speech Technology”为主题,内容涵盖 语音识别、自然语言处理、神经机器翻译等领域。

Magic Data作为全球领先的AI数据解决方案提供商,以实际业务场景需求为驱动,聚焦ASR、NLP、TTS等领域。在INTERSPEECH 2022中,Magic Data论文经过重重审核,最终被大会收录。本文向大家分享Magic Data入选论文的主要内容与创新点。

Magic Data 论文入选国际语音顶级大会 INTERSPEECH 2022_第3张图片

随着智能语音助手、智能家居设备、智能客服等技术被广泛利用,自然对话语音识别的需求量日益增长,越来越多的开发者向语音社区OpenSLR免费开放中文语音数据库,覆盖朗读、会议、访谈、新闻等场景。但自然对话中的口语表达、犹豫、重复、非语言信息等表达不流畅的现象给语音识别任务带来很大的挑战。由于缺乏免费且高质量的自然对话语料库,近年来对话式语音识别研究进展缓慢,探索对话场景中的语音处理技术仍然是一个挑战。

为了进一步丰富开源语音语料库,促进语音语言处理技术的发展,Magic Data联合中科院声学研究所、上海交通大学和西北工业大学,在Magichub开源社区正式开源180小时中文对话式语音数据集MagicData-RAMC。MagicData-RAMC是一批高质量且标注丰富的训练数据集,能够很好地支持开发者完成语音识别和说话人日志相关的研究。

MagicData-RAMC包括351组多轮普通话对话,时长共计180小时。每组对话的标注信息包括转录文本、语音活动时间戳、说话人信息、录制信息和话题信息。说话人信息包括了性别、年龄和地域,录制信息包括了环境和设备。

Magic Data 论文入选国际语音顶级大会 INTERSPEECH 2022_第4张图片

下载 MagicData-RAMC Conversational Speech Dataset - MagicHub

论文 https://arxiv.org/abs/2203.16844

基线 GitHub - MagicHub-io/MagicData-RAMC-Challenge

目前,Magichub.com开源社区共开源超过100个数据集,数据类型涵盖ASR、TTS、NLP、发音词典等,开源数据语言包括中文、英语、德语、意大利语、阿拉伯语等众多语种。未来,更多语种和类型数据集将持续在社区开源,欢迎大家下载使用。

更多详情请见:MagicHub - Datasets Download | Open-Source Datasets

你可能感兴趣的:(语音识别,人工智能,科技)