15.CS-REP: MAKING SPEAKER VERIFICATION NETWORKS EMBRACINGRE-PARAMETERIZATION(2022.4)

题目:CS-REP:使说话人确认网络包含重新参数化

论文地址:https://arxiv.org/abs/2110.13465

pytorch代码:https://github.com/zrtlemontree/CS-Rep

摘要:自动说话人确认(ASV)系统用于确定两个语音是否来自同一说话人,主要关注确认的准确性,而忽略了推理的速度。然而,在实际应用中,推理速度和验证精度都至关重要。为了提高模型的推理速度和验证精度,提出了一种新的多类型网络拓扑重参数化策略——交叉序列重参数化策略。CS-Rep解决了现有重参数化方法不适用于典型ASV骨干网的问题。当模型应用CS-Rep时,训练期网络利用多分支拓扑来捕获说话人信息,而推理期模型转换为类似时延神经网络(TDNN)的简单主干,具有堆叠的TDNN层,以实现快速的推理速度。在CS-Rep的基础上,提出了一种测试和部署友好的改进TDNN Rep-TDNN。与最新模型ECAPA-TDNN相比,Rep-TDNN的实际推理速度提高了约50%,EER降低了10%。

1. INTRODUCTION

        自动说话人验证(ASV)系统确定两个演讲是否来自同一个说话人。ASV系统的前端模型&#x

你可能感兴趣的:(声纹识别,深度学习,神经网络,人工智能)