赛事简介
智能语音市场处于大幅增长前期,逐渐成熟的语音技术使得智能语音的商业化落地成为可能。随着智能音箱以及智能语音交互的设备不断落地,声纹识别的技术成为人体物理特征验证的一项重要语音技术。未来智能语音交互的设备都将具备声纹识别功能、借此确认用户身份,只有自己的声纹才可以启动购物、签字、控制等。5G的到来,AI+IoT成为可能,万物联网所带来的智能化时代,语音助手、安防等领域有着广泛的应用场景,声纹识别技术将面临很多挑战。
本届大赛以智能家居场景为假设,从近场注册远场测试和远场注册远场测试两个技术点出发设计赛题。通过赛事发现参赛技术方的优秀创新成果,引领声纹识别的未来。
赛事组织者
李 明--昆山杜克大学
那兴宇--微软
卜 辉--AISHELL
邹月娴--北京大学深圳研究生院
都家宇--AISHELL Foundation
吴本谷--AISHELL Foundation
赛事任务
数据
赛事数据来自希尔贝壳的AISHELL-WakeUp-1唤醒数据库。录音内容为“你好,米雅” “hi, mia”的唤醒词。340名录音人在真实家居环境中录制,设置7个录音位,包括6个圆形16路PDM麦克风阵列录音板做远场拾音(16kHz,16bit)、1个高保真麦克风用做近场拾音(44.1kHz,16bit)。
The setup of the AISHELL-WakeUp-1 database
本赛事数据为抽取AISHELL-WakeUp-1的高保真近讲Mic、1m、3m、5m的中文内容“你好,米雅”数据,其中训练集(254人)、开发集(42人)和测试集(44人)。数据详细信息可参考 AISHELL-WakeUp-1.pdf。
Download
任务
多通道远场文本相关声纹识别:
Track1:近场数据注册,远场数据测试
即用高保真近讲Mic作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。
Track2:远场数据注册,远场数据测试
即用距离说话人1m的阵列语音作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。
赛事日程
2019年09月06日 | 报名启动并开放训练集与开发集 |
2019年09月28日 | 报名截止 |
2019年10月10日 | 开放测试集并开启结果提交通道 |
2019年10月20日 | 关闭提交结果通道 |
2019年10月26日 | kaldi第四届线下技术交流会举办并颁奖 |
参赛须知
参赛条件
• 参赛人群:大赛面向社会各界开放,不限年龄国籍,高校、科研院所、企业从业人员均可报名参赛。参与大赛组织工作有关单位不可参赛;
• 报名要求:每人仅能拥有一支团队(1-5人),报名时所有个人或团队在注册信息里必须提供基本信息;
参赛步骤
• 注册成功即为报名成功;
• 注册之后登陆界面,点击赛事数据下载,签署协议之后即可获得比赛数据;
• 待提交结果通道开启之后,提交结果。
参赛规则
在您(以下简称“参赛者”)参赛前,请您务必仔细、审慎阅读并充分理解本协议的内容。如果参赛者有任何疑问请通过邮件提问,举办方将尽快解答。
参赛者一旦选择“同意”,将视为同意并签署了本协议的所有内容。如若参赛者“不同意”,将视为自动放弃参加比赛资格。
• 组队规则:在关闭报名通道前,单人团队可以加入其它单人或多人团队,一旦加入不可离队;
• 知识产权:参赛数据版权归主办方希尔贝壳所有。参赛者提交评测数据将对公众开源;
• 公平竞技: 本赛事为指定唤醒词训练集,如扩充只可使用openslr开源数据和AISHELL2,其他数据禁止使用。推荐参赛者优先使用kaldi开源
系统做技术能力,禁止利用规则漏洞或技术漏洞等不良途径提高成绩排名,禁止在比赛中抄袭他人作品、交换答案、使用多个小号,经发现
将取消比赛成绩并严肃处理。比赛过程中将持续自动化反作弊,针对系统的封禁可发邮件至[email protected]申诉;
• 组织声明:组委会保留对比赛规则进行调整修改的权利、比赛作弊行为的判定权利和处置权利、收回或拒绝授予影响组织及公平性的参赛团
队奖项的权利。
评审标准
基线
赛事基线系统由昆山杜克大学提供,使用kaldi x-vector标准框架来实现声纹识别系统,仅使用单通道数据开展训练与单条语音来注册模板,没有使用openslr以及aishell任何数据做预训练。
本赛事基于远场声纹识别前沿性技术相关研究可参考以下论文:
• Xiaoyi Qin,Danwei Cai,Ming Li,"Far-Field End-to-End Text Dependent Speaker Verification based on Mixed Training Data with Transfer Learning and Enrollment Data Augmentation", Interspeech 2019.Download
• Danwei Cai,Xiaoyi Qin,Ming Li,"Multi Channel Training for End-to-End Speaker Recognition under Reverberant and Noisy Environment",Interspeech 2019. Download
标准
评分标准以1、3、5m混合测试集的EER结果做评测。
奖项
每个赛道(Track)设置一、二、三等奖各一名。
名次 | 奖金 | 其他 |
第一名 | 6000 | 高品质数据,定制纪念品 |
第二名 | 4000 | 高品质数据,定制纪念品 |
第三名 | 3000 | 高品质数据,定制纪念品 |
权威证书
赛题获一二三等奖,都可以获得主办单位冠名的纸质证书,团队成员都可获得电子版证书。
绿色通道
赛题获一二三等奖,可获得企业内推入职及实习机会绿色通道。
免费书籍
赛题获一二三等奖,可免费获得《Kaldi语音识别实践》一本。
联系我们
赛事官网
http://challenge.aishelltech.com