语音情绪识别和语音识别等语音处理任务的语音数据 振幅归一化方法 how to normalize the amplitude of audio with python
网上找了一圈都没有找到比较靠谱的方法,有一篇文章提到用什么do_pcm工具,但是全网都没有相关的内容,这里贴上一个调用pydub.effects.normalize方法进行振幅归一化的方法.方便后面的同学.主要思想取一段语料中幅度最大的点将其幅度拉大到接近1,记录拉大的比例,再将其他所有点均按这个比例拉伸。pydub.effects.normalize源码@register_pydub_effec