《SEGAN: Speech Enhancement Generative Adversarial Network》论文阅读
本文的作者是SantiagoPascual,AntonioBonafonte,JoanSerra。研究动机目前语音增强的技术都是用在频谱域上或者高维特征上,这样的话,大多数的音频处理会受到噪声环境数量的限制并且依赖一阶统计特征。为了解决这些问题,深度网络是可以从大型的数据集上学习到复杂的映射。本论文中,提出了增强GAN网络,名叫SEGAN,它是直接用时域的波形当作输入送入到网络当中去的,在看不见的