音频信号中采样率和比特率以及采样编码的问题

采样率和比特率:

cmd: soxi aa.mp3
Input File     : 'aa.mp3'
Channels       : 1  
Sample Rate    : 44100   
Precision      : 16-bit
Duration       : 00:01:11.95 = 3172951 samples = 5396.18 CDDA sectors
File Size      : 1.24M
Bit Rate       : 138k
Sample Encoding: MPEG audio (layer I, II or III)
比特率=采样率X采样精度(位数)(*通道数)
那这里的采样率是  44.1K * 16bit = 706Kb ?结果为什么会是这样?

Input File     : 'test.wav'
Channels       : 2
Sample Rate    : 48000
Precision      : 16-bit
Duration       : 00:00:04.86 = 233280 samples ~ 364.5 CDDA sectors
File Size      : 933k
Bit Rate       : 1.54M
Sample Encoding: 16-bit Signed Integer PCM
那这里的采样率是  48K * 16bit * 2 =  1536K =  1.54M

通过这两个的对比,发现sample encoding 是不一样的,具体直接用MPEG进行提取特征有无影响不清楚,这里可以通过ffmpeg工具进行转一些就好了。
mac ubuntu 都可以直接安装 brew 或者 apt-get.
可以用ffmpeg直接转化

ffmpeg -i aa.mp3 -ar 44100 -y  aa.wav

也可以用python,也是调用的ffmpeg

from pydub import AudioSegment as AS

sound = AS.from_mp3("./aa.mp3")
print sound
sound.export("./aa.wav", format="wav")

转换之后再来看一下:

Input File     : 'aa.wav'
Channels       : 1
Sample Rate    : 44100
Precision      : 16-bit
Duration       : 00:01:11.94 = 3172608 samples = 5395.59 CDDA sectors
File Size      : 6.35M
Bit Rate       : 706k

注意文件大小也变了很多,具体的两者的编码原理这里暂时不讨论了,我也不懂。

你可能感兴趣的:(sre,ASR,MPEG,PCM,采样率,比特率)