wav和pcm的转换(Python版本)

wav和pcm是语音信号处理中最常见的文件格式,时常会遇到需要两种文件格式的相互转换。wav存储的一般是解码后为[-1, 1]的float数据,文件头有44个字节记录文件的采样率、长度等等信息。pcm存储的是int型整数,不含任何采样率相关信息。虽然原理比较简单,但是整理后更便于利用。

 

wav转pcm

原理:将文件头去掉,数据转成int型即可。

import numpy as np
def wav2pcm(wavfile, pcmfile, data_type=np.int16):
    f = open(wavfile, "rb")
    f.seek(0)
    f.read(44)
    data = np.fromfile(f, dtype= data_type)
    data.tofile(pcmfile)

 

pcm转wav

原理:利用wave库,添加通道信息、采样位数、采样率等信息作为文件头,pcm数据直接写入即可。

import wave
def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
    pcmf = open(pcm_file, 'rb')
    pcmdata = pcmf.read()
    pcmf.close()

    if bits % 8 != 0:
        raise ValueError("bits % 8 must == 0. now bits:" + str(bits))

    wavfile = wave.open(wav_file, 'wb')
    wavfile.setnchannels(channels)
    wavfile.setsampwidth(bits // 8)
    wavfile.setframerate(sample_rate)
    wavfile.writeframes(pcmdata)
    wavfile.close()

 

你可能感兴趣的:(语音处理,小工具库)