基于条件生成对抗网络的I-向量变换在短说话人验证中的应用

I-vector Transformation Using Conditional Generative Adversarial Networks for Short Utterance Speaker Verification

基于条件生成对抗网络的I-向量变换在短说话人验证中的应用

用于短话语说话人验证的条件生成对抗网络的I向量变换

 

摘要

 

基于I向量的文本无关说话人验证(SV)系统在短发音时往往性能较差,因为短发音中的偏置语音分布使得提取的i向量不可靠。本文提出了一种使用生成对抗网络(GAN)的i向量补偿方法,其生成网络被训练成从短发音i向量生成补偿i向量,其解犯罪网络被训练成确定i向量是否由发生器或从长话语中提取的发生器。此外,我们还给GAN分配了两个学习任务来稳定它的训练,并使生成的i向量更具有说话者特异性。在NIST SRE 2008“10秒-10秒”条件下进行的说话人验证实验表明,应用该方法后,等差错率比传统的i矢量和PLDA系统降低了11.3%。

 

索引术语:说话人验证,简短发音,i向量转换,生成对抗网络,多任务学习

 

你可能感兴趣的:(深度学习声纹识别,论文翻译)