Interspeech 2022丨FFSVC 2022 远场说话人识别比赛

Interspeech 2022丨FFSVC 2022 远场说话人识别比赛_第1张图片

近日,FFSVC 2022 远场说话人识别比赛已开放注册系统、提交系统和 Leaderboard,新的训练集/开发集/测试集已经发布。

官网:https://ffsvc.github.io/

01背 景

FFSVC 2022(Far-field speaker verification challenge2022)是 Interspeech 2022 的 satellite events 之一,由昆山杜克大学新加坡国立大学南加州大学希尔贝壳公司共同发起的远场说话人识别比赛。本次比赛的目的是检验当前说话人识别技术在远场环境下的性能,并促进这一领域的技术研究发展。FFSVC 2022 对所有个人和单位免费开放,做为 Interspeech 2022 的 satellite events,任何远场声纹识别相关的论文都被鼓励提交到我们的 workshop 中。

02比赛信息

FFSVC 2020 在 Interspeech 2020 的成功举办表明越来越多的研究人员开始关注远场说话人验证任务。今年 FFSVC 2022 的挑战仍然集中在远场说话人验证任务上,并提供了一个新的开发和测试集。不同于 FFSVC 2020,新的测试集为远场单通道数据,包括手机和平板信道。为了减少训练集和测试集的数据不匹配,我们额外发布了针对 FFSVC 2020 的补充集,覆盖训练集说话人相对应的手机和平板远场数据。另外,本届挑战赛的一个新任务是跨语言的自监督/半监督学习,参赛者可以使用 FFSVC 2020 的训练/开发/补充数据集(中文,域内,无标签)和 VoxCeleb 1&2 数据集(英文为主,域外,有标签)来构建模型。

03任务描述

今年 FFSVC 2022 重点关注远场单通道场景。这次比赛有两项说话人识别任务:

  • Task1. Fully supervised far-field speaker verification

    (全监督的远场说话人验证)

  • Task2. Semi-supervised far-field speaker verification

    (半监督远场说话人验证)

任务1和任务2都是固定训练集任务,即参赛者只能使用指定的训练集来构建说话人验证系统。固定训练集由以下三个数据库组成:

  • VoxCeleb 1&2

  • FFSVC2020 train and dev set

  • FFSVC2022 supplementary set (新发布)

在任务1中,参赛者可以使用 VoxCeleb1&2 和 FFSVC 2020 数据集的说话人标签来构建说话人识别模型;对于任务2,参赛者可以使用 VoxCeleb1&2 的说话人标签,但不能使用 FFSVC 2020 数据集(train/dev/supplement)的说话人标签。在任务2中,我们鼓励参赛者采用自监督或半监督的方法对域内数据进行标注或生成伪标签的方法进行训练。

注:禁止使用其他语音数据集对系统进行训练,但允许参赛者使用开源的非语音数据集(如MUSAN,RIR_NOISE)进行数据扩充。自监督的预训练模型(如Wav2Vec, HuBERT, WavLM)不能用于此次比赛。

04数据集介绍

VoxCeleb 1&2

请访问 :

https://www.robots.ox.ac.uk/~vgg/data/voxceleb/

获取更多关于VoxCeleb数据的信息

FFSVC 2020 数据集

训练集和开发集

FFSVC 2020 的训练集和测试集由近讲高保真麦克风、近讲手机和远场麦克风阵列数据组成。所有人录制语音三次(命名为F,S,T),每次间隔7-15天。

如果你没有这部分的数据,可向下方邮箱以 “Apply for the FFSVC2020 Challenge data” 为主题申请数据。

申请邮箱:

[email protected]

数据详情地址:

http://www.aishelltech.com/FFSVC_2020

补充集

FFSVC 2020 的补充集是 FFSVC 2020 训练集的补充集,所有说话人信息和 FFSVC 2020 的训练集对应,该数据是由远场手机和远场平板数据组成,可在 FFSVC 2022 比赛官网下载。

FFSVC 2022 开发集和测试集

FFSVC 2022 的开发集将为参赛者提供一个包含准确说话人信息的trial文件和对应的音频文件。FFSVC 2022 开发集与测试集具有相同的数据分布。然而,FFSVC 2022 的开发集仅允许用于调整超参数和测试模型性能,不允许在训练中使用

05时间安排

Interspeech 2022丨FFSVC 2022 远场说话人识别比赛_第2张图片

 

06注册与提交

注册

由于今年比赛的 leaderboard 和提交在 Codalab 平台上,因此比赛的注册也将放到 Codalab 平台上。我们恳请您将您的 Codalab 帐户使用您所在机构/学校/公司的电子邮件注册。

以下是对应任务的 codalab 链接:

  • Task 1. Fully supervised far-field speaker verification.      (https://codalab.lisn.upsaclay.fr/competitions/2167)

  • Task 2. Semi-supervised far-field speaker verification.     (https://codalab.lisn.upsaclay.fr/competitions/2166)

提交

参赛者必须为每个参与任务向 Codalab 平台提交至少一份有效的分数文件。在 Codalab 中,点击“Participants”选项卡下的“Submit/View Results”链接可以提交你的分数文件。您必须以 ZIP 文件的形式提交结果,其中只包含一个名为“scores.txt”的文件。文件必须位于 ZIP 文件的根目录下,并且 ZIP 文件不应包含任何文件夹。评分文件应为 UTF-8 格式,每次试验一行。请访问官网下载样例文件。

你可能感兴趣的:(智能语音,人工智能,语音识别)