AISHELL Speaker Verification Challenge 2019

赛事简介

智能语音市场处于大幅增长前期,逐渐成熟的语音技术使得智能语音的商业化落地成为可能。随着智能音箱以及智能语音交互的设备不断落地,声纹识别的技术成为人体物理特征验证的一项重要语音技术。未来智能语音交互的设备都将具备声纹识别功能、借此确认用户身份,只有自己的声纹才可以启动购物、签字、控制等。5G的到来,AI+IoT成为可能,万物联网所带来的智能化时代,语音助手、安防等领域有着广泛的应用场景,声纹识别技术将面临很多挑战。

本届大赛以智能家居场景为假设,从近场注册远场测试和远场注册远场测试两个技术点出发设计赛题。通过赛事发现参赛技术方的优秀创新成果,引领声纹识别的未来。

赛事组织者

李   明--昆山杜克大学

那兴宇--微软

卜   辉--AISHELL

邹月娴--北京大学深圳研究生院

都家宇--AISHELL Foundation

吴本谷--AISHELL Foundation


赛事任务

数据

赛事数据来自希尔贝壳的AISHELL-WakeUp-1唤醒数据库。录音内容为“你好,米雅” “hi, mia”的唤醒词。340名录音人在真实家居环境中录制,设置7个录音位,包括6个圆形16路PDM麦克风阵列录音板做远场拾音(16kHz,16bit)、1个高保真麦克风用做近场拾音(44.1kHz,16bit)。

AISHELL Speaker Verification Challenge 2019_第1张图片

The setup of the AISHELL-WakeUp-1 database

本赛事数据为抽取AISHELL-WakeUp-1的高保真近讲Mic、1m、3m、5m的中文内容“你好,米雅”数据,其中训练集(254人)、开发集(42人)和测试集(44人)。数据详细信息可参考 AISHELL-WakeUp-1.pdf。

Download

任务

多通道远场文本相关声纹识别:

Track1:近场数据注册,远场数据测试

即用高保真近讲Mic作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。

Track2:远场数据注册,远场数据测试

即用距离说话人1m的阵列语音作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。


赛事日程

2019年09月06日 报名启动并开放训练集与开发集
2019年09月28日 报名截止
2019年10月10日 开放测试集并开启结果提交通道
2019年10月20日 关闭提交结果通道
2019年10月26日  kaldi第四届线下技术交流会举办并颁奖

参赛须知

参赛条件

• 参赛人群:大赛面向社会各界开放,不限年龄国籍,高校、科研院所、企业从业人员均可报名参赛。参与大赛组织工作有关单位不可参赛;

• 报名要求:每人仅能拥有一支团队(1-5人),报名时所有个人或团队在注册信息里必须提供基本信息;

参赛步骤

• 注册成功即为报名成功;

• 注册之后登陆界面,点击赛事数据下载,签署协议之后即可获得比赛数据;

• 待提交结果通道开启之后,提交结果。

参赛规则

在您(以下简称“参赛者”)参赛前,请您务必仔细、审慎阅读并充分理解本协议的内容。如果参赛者有任何疑问请通过邮件提问,举办方将尽快解答。

参赛者一旦选择“同意”,将视为同意并签署了本协议的所有内容。如若参赛者“不同意”,将视为自动放弃参加比赛资格。

• 组队规则:在关闭报名通道前,单人团队可以加入其它单人或多人团队,一旦加入不可离队;

• 知识产权:参赛数据版权归主办方希尔贝壳所有。参赛者提交评测数据将对公众开源;

• 公平竞技: 本赛事为指定唤醒词训练集,如扩充只可使用openslr开源数据和AISHELL2,其他数据禁止使用。推荐参赛者优先使用kaldi开源

  系统做技术能力,禁止利用规则漏洞或技术漏洞等不良途径提高成绩排名,禁止在比赛中抄袭他人作品、交换答案、使用多个小号,经发现

  将取消比赛成绩并严肃处理。比赛过程中将持续自动化反作弊,针对系统的封禁可发邮件至[email protected]申诉;

• 组织声明:组委会保留对比赛规则进行调整修改的权利、比赛作弊行为的判定权利和处置权利、收回或拒绝授予影响组织及公平性的参赛团

  队奖项的权利。


评审标准

基线

赛事基线系统由昆山杜克大学提供,使用kaldi x-vector标准框架来实现声纹识别系统,仅使用单通道数据开展训练与单条语音来注册模板,没有使用openslr以及aishell任何数据做预训练。

AISHELL Speaker Verification Challenge 2019_第2张图片

本赛事基于远场声纹识别前沿性技术相关研究可参考以下论文:

• Xiaoyi Qin,Danwei Cai,Ming Li,"Far-Field End-to-End Text Dependent Speaker Verification based on Mixed Training Data with Transfer Learning and Enrollment Data Augmentation", Interspeech 2019.Download

• Danwei Cai,Xiaoyi Qin,Ming Li,"Multi Channel Training for End-to-End Speaker Recognition under Reverberant and Noisy Environment",Interspeech 2019. Download

标准

评分标准以1、3、5m混合测试集的EER结果做评测。


奖项

每个赛道(Track)设置一、二、三等奖各一名。

名次 奖金 其他
第一名 6000 高品质数据,定制纪念品
第二名 4000 高品质数据,定制纪念品
第三名 3000 高品质数据,定制纪念品

权威证书

赛题获一二三等奖,都可以获得主办单位冠名的纸质证书,团队成员都可获得电子版证书。

绿色通道

赛题获一二三等奖,可获得企业内推入职及实习机会绿色通道。

免费书籍

赛题获一二三等奖,可免费获得《Kaldi语音识别实践》一本。


联系我们

[email protected]

赛事官网

http://challenge.aishelltech.com

你可能感兴趣的:(国际数据竞赛,语音识别,人工智能)