MTGAN:通过多任务三元生成对抗性网络对说话人进行验证

MTGAN: Speaker Verification through Multitasking Triplet Generative Adversarial Networks

MTGAN:通过多任务三元生成对抗性网络对说话人进行验证

摘要

在本文中,我们提出了一种增强的三元组方法,它通过联合利用生成对抗机制和多任务优化来改进嵌入的编码过程。 我们扩展了具有生成性对抗网络(GAN)和softmax丢失功能的三重编码器。 引入GAN是为了增加样本的通用性和多样性,而softmax则用于增强扬声器的功能。 为简化起见,我们将我们的方法称为多任务三元组生成对抗网络(MTGAN)。 短话语实验表明,MTGAN分别比传统的i-vector方法和最先进的三元组丢失方法将验证等错误率(EER)降低了67%(相对)和32%(相对)。 这有效地表明MT-GAN在表达说话者信息的高级特征方面优于三元组方法。

索引术语:生成对抗性网络,说话者验证,三元组丢失

1.简介

自动说话人验证(ASV)是指在给定注册的语音数据库的情况下识别说话者的未知话语的ID的过程。作为一种重要的非接触式生物识别技术,它已被广泛研究[1,2,3,4]。

在过去几年中,ASV领域已形成了i-vecto

你可能感兴趣的:(深度学习声纹识别,论文翻译)