python pcm 分贝_语音文件 pcm 静默(静音)判断

pcm 文件存储的是 原始的声音波型二进制流,没有文件头。

(1)首先要确认 pcm文件的每个采样数据 采样位数,一般为8bit或16bit。

(2)然后确定是双声道还是单声道,双声道是两个声道的数据交互排列,需要单独提取出每个声道的数据。

(3)然后确定有没有符号位,如采样点位16bit有符号位的的范围为-32768~32767

(4)确定当前操作系统的内存方式是大端,还是小端存储。具体看http://blog.csdn.net/u013378306/article/details/78904238

(5)根据以上四条对pcm文件进行解析,转化为10进制文件

注意:对于1-3可以在windows使用cooledit 工具设置参数播放pcm文件来确定具体参数,也可以使用以下java代码进行测试:

本例子的语音为: 静默1秒,然后说 “你好”,然后静默两秒。pcm文件下载路径:http://download.csdn.net/download/u013378306/10175068

packagetest;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjava.io.IOException;importjava.io.InputStream;importjavax.sound.sampled.AudioFormat;importjavax.sound.sampled.AudioSystem;importjavax.sound.sampled.DataLine;importjavax.sound.sampled.LineUnavailableException;importjavax.sound.sampled.SourceDataLine;public classtest {/***@paramargs

*@throwsException*/

public static void main(String[] args) throwsException {//TODO Auto-generated method stub

File file= new File("3.pcm");

System.out.println(file.length());int offset = 0;int bufferSize =Integer.valueOf(String.valueOf(file.length())) ;byte[] audioData = new byte[bufferSize];

InputStream in= newFileInputStream(file);

in.read(audioData);float sampleRate = 20000;int sampleSizeInBits = 16;int channels = 1;boolean signed = true;boolean bigEndian = false;//sampleRate - 每秒的样本数//sampleSizeInBits - 每个样本中的位数//channels - 声道数(单声道 1 个,立体声 2 个)//signed - 指示数据是有符号的,还是无符号的//bigEndian -是否为大端存储, 指示是否以 big-endian 字节顺序存储单个样本中的数据(false 意味着//little-endian)。

AudioFormat af = newAudioFormat(sampleRate, sampleSizeInBits, channels, signed, bigEndian);

SourceDataLine.Info info= new DataLine.Info(SourceDataLine.class, af, bufferSize);

SourceDataLine sdl=(SourceDataLine) AudioSystem.getLine(info);

sdl.open(af);

sdl.st

你可能感兴趣的:(python,pcm,分贝)