Python音频转成numpy数组:numpy.frombuffer报错ValueError: buffer size must be a multiple of element size

使用背景:导入音频信号,下面代码段最后一句报错

import wave
import numpy as np

f = wave.open(wav_path)
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
# 声道数; 量化位数(byte); 采样频率; 采样点数
str_audio = f.readframes(nframes)
f.close()

audio = np.frombuffer(str_data, dtype=np.short)

问题解决:最后一句dtype的参数改成与自己的声音信号相一致

查看sampwidth这一参数,量化位数(sampwidth)就是记录声波每次采样所需的位数,一般有16,24,32位

sampwidth(byte) dtype
2byte=16bit int16  or i2 (整型short)

3byte=24bit

需要wavio包读取
4byte=32bit int32 or i4 (长整型long)
  • 数据量(总b) = 采样频率(Hz) x 量化位数(bit) x 时间(s) x 声道数(个)
  • 数据量(总B) = 采样频率(Hz) x 量化位数(bit) x 时间(s) x 声道数(个) / 8

 

如果音频的量化位数为24bit,如何读取?

可以使用wavio包,直接读取成numpy数组

import wavio

audio = wavio.read(wav_path)

附上wavio的github链接:

https://github.com/WarrenWeckesser/wavio/blob/master/wavio.py

你可能感兴趣的:(音频学习笔记)