【AI视野·今日Sound 声学论文速览 第七期】Tue, 19 Sep 2023

AI视野·今日CS.Sound 声学论文速览
Tue, 19 Sep 2023
Totally 1 papers
上期速览✈更多精彩请移步主页

【AI视野·今日Sound 声学论文速览 第七期】Tue, 19 Sep 2023_第1张图片

Daily Sound Papers

Frame-to-Utterance Convergence: A Spectra-Temporal Approach for Unified Spoofing Detection
Authors Awais Khan, Khalid Mahmood Malik, Shah Nawaz
语音欺骗攻击对自动说话人验证系统构成重大威胁。现有的反欺骗方法通常模拟特定的攻击类型,例如合成攻击或重放攻击。然而,在现实场景中,对策不知道攻击的生成模式,因此需要统一的解决方案。当前的统一解决方案很难检测欺骗伪影,尤其是最近的欺骗机制。例如,欺骗算法会注入光谱或时间异常,这些异常很难识别。为此,我们提出了利用帧级和话语级系数的谱时间融合。我们针对帧级不一致引入了一种新颖的局部谱偏差系数 SDC ,并采用基于双 LSTM 的网络来处理顺序时间系数 STC ,该网络捕获话语级伪影。我们的频谱时间融合策略结合了这些系数,并且自动编码器生成频谱时间偏差系数 STDC 以增强鲁棒性。我们提出的方法解决了多种欺骗类别,包括合成、重放和部分深度伪造攻击。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

你可能感兴趣的:(Sound,audio,Papers,人工智能,Sound,Audio,声学模型)