音频采样率批量转换

因为之前训练的模型采样率是22050,现在手上有采样率48000的数据,虽说调整下参数也可以,但效果不是太好,就试着转一下,用的是BZNSYP的语料库。

现有的
音频采样率批量转换_第1张图片
想要的
音频采样率批量转换_第2张图片

方案一

import librosa
import os
from tqdm import tqdm
l = os.listdir('F:\我的程序练习\BZNSYP\Wave')[:-1]
for i in tqdm(l):
    y, sr = librosa.load('F:\我的程序练习\BZNSYP\Wave\\'+i, sr=48000)
    y_16 = librosa.resample(y, sr, 22050)
    librosa.output.write_wav('F:\\我的程序练习\\BZNSYP\\Wave\\'+i, y_16, 22050)

可以送进去模型,但是模型识别不出来它的梅尔谱图,否决了
方案一结果
音频采样率批量转换_第3张图片
方案二
用sox,下载地址,下好安装,然后就在cmd里调用就好,这个应该可以,等下看看结果

for %i in (*.wav) do 
	"H:\sox\sox-14-4-2\sox.exe" %i 
	-r 22050 
	F:\我的程序练习\BZNSYP\sox\%i

方案二结果
音频采样率批量转换_第4张图片

你可能感兴趣的:(linux,Python)