音频处理

  1. 批量读取文件
path = r"E:\xiaopeng\误唤醒\Wav"  # 添加路径
filenames = os.listdir(path)  # 得到文件夹下的所有文件名称
for file in filenames:
    filepath = os.path.join(path,file)
  1. 读取音频信息
    声道数:常见的单声道和立体声(双声道)
    量化位数(byte):单位是bytes,一般是2,即16bit,它的数值越大,分辨率也就越高,录制和回放的声音就越真实。
    每个采样数据记录的是振幅, 采样精度取决于采样位数的大小:
    1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
    2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;
    采样频率:采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个信号样本。
    采样点数:采样的数目
    如果采样频率为1000,采样点数也设为1000,数据的更新率是1次/每秒。
    如果采样频率为1000,采样点数也设为100,数据的更新率是10次/每秒。
    视频时长:采样点数/采样频率
f = wave.open(r"E:\xiaopeng\误唤醒\result.wav", 'rb')
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
print(nchannels, sampwidth, framerate, nframes)

你可能感兴趣的:(自然语言)