AI视野·今日CS.Sound 声学论文速览
Tue, 19 Sep 2023
Totally 1 papers
上期速览✈更多精彩请移步主页
Frame-to-Utterance Convergence: A Spectra-Temporal Approach for Unified Spoofing Detection Authors Awais Khan, Khalid Mahmood Malik, Shah Nawaz 语音欺骗攻击对自动说话人验证系统构成重大威胁。现有的反欺骗方法通常模拟特定的攻击类型,例如合成攻击或重放攻击。然而,在现实场景中,对策不知道攻击的生成模式,因此需要统一的解决方案。当前的统一解决方案很难检测欺骗伪影,尤其是最近的欺骗机制。例如,欺骗算法会注入光谱或时间异常,这些异常很难识别。为此,我们提出了利用帧级和话语级系数的谱时间融合。我们针对帧级不一致引入了一种新颖的局部谱偏差系数 SDC ,并采用基于双 LSTM 的网络来处理顺序时间系数 STC ,该网络捕获话语级伪影。我们的频谱时间融合策略结合了这些系数,并且自动编码器生成频谱时间偏差系数 STDC 以增强鲁棒性。我们提出的方法解决了多种欺骗类别,包括合成、重放和部分深度伪造攻击。 |
Chinese Abs From Machine Translation |
Papers from arxiv.org
更多精彩请移步主页
pic from pexels.com