论文翻译 SVSGAN: Singing Voice Separation Via Generative Adversarial Network
文章主要是将混合音频的声谱作为输入,人声,bgm的声谱作为标签,通过GAN来完成近似过程,生成器最后一层用的output_voice=[z_voice/(z_voice+z_bgm)]*x,output_bgm=[z_bgm/(z_voice+z_bgm)]*x而且文章中的生成器是经过预先训练后的。我在MKR-100上用SVSGAN时难以训练(以后换成wgan)。0.摘要从混合音频中分离出两种来源