CQCC

CQCC

1. abstract

CQCC特点,时间分辨率可变
优点是能够可靠捕获模仿攻击的一些信息,并且他的结构对用例情景和模仿攻击同时敏感(以往的仿模仿的系统没有和用例情景结合)

2. Introduction

ASV面临的攻击:

  • replay
  • voice conversion
  • speech synthesis
  • impersonation
    一般情况下可以通过特征提取和模式识别的作为对策,但最好是研究一种新的具有鲁棒性的特征,因此用到了CQT,来自音乐处理领域(有空可以看一看他的论文)

然后看一下FFT和CQT的时间频率分辨率的对比:
CQCC_第1张图片
究竟为什么CQT适合做音乐处理,轨道分离?并且CQT的缺点又是什么,需要看其中的引文。
WIKI上的CQT和FFT的对比汇总:(他 = CQT)

  • 他的数据量少
  • 他的计算和实现比较复杂
  • 他能提取乐器的特征,谐波的模式,和基频无关
  • 他更符合

你可能感兴趣的:(学习,特征提取,语音识别,声纹识别)