在语音处理任务中,有时需要对立体声或多声道音频文件,批量处理成单声道文件,然后送入算法模型进行处理。
这里,提供一个Python脚本实现批量分离,提高处理效率。
编码思路
wavfile
包用前需先导入以下包:
import scipy.io.wavfile
封装代码如下:
def split_stereo(input_path, output_path):
# default stereo
samplerate, data = wavfile.read(input_path)
left = []
right = []
for item in data:
left.append(item[0])
right.append(item[1])
file_name = input_path.split('\\')[-1]
file_name = file_name.split('.')[0]
outfile_name = file_name + '_1ch_left.wav'
out_path_file = os.path.join(output_path, outfile_name)
wavfile.write(out_path_file, samplerate, np.array(left))
# wavfile.write('right.wav', samplerate, np.array(right))
当然,有兴趣的也可以用专业音频处理软件Audition
实现批量处理。