音频常用术语

采样

采样率是指一秒钟采样的次数,采样率越高,还原的声音也就越真实

采样频率一般共分为11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五个等级,11025Hz能达到AM调幅广播的声音品质,

22050Hz和24000HZ能达到FM调频广播的声音品质

44100Hz是理论上的CD音质界限,

48000Hz专业音频和视频制作采样率

数字音频采样率

8,000 Hz - 电话所用采样率, 对于人的说话已经足够

11,025 Hz-AM调幅广播所用采样率

22,050 Hz和24,000 Hz- FM调频广播所用采样率

32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率

44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率

47,250 Hz - 商用 PCM 录音机所用采样率

48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率

50,000 Hz - 商用数字录音机所用采样率

96,000 或者 192,000 Hz - DVD-Audio、一些LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和HD-DVD (高清晰度 DVD)音轨所用所用采样率

采样精度(位宽位深度,量化精度)

描述一个采样点,横轴(时间)代表采样率,纵轴(幅度)代表位深度。

8位(8-bit):每个采样点用8位二进制数表示,动态范围为256个离散值,通常用于低质量音频,如电话。

16位(16-bit):每个采样点用16位二进制数表9示,动态范围为65,536个离散值,这是CD音频的标准,广泛用于高质量音频。

24位(24-bit):每个采样点用24位二进制数表示,动态范围为16,777,216个离散值,常用于专业音频录制和制作。

32位浮点(32-bit Float):每个采样点用32位浮点数表示,具有更高的动态范围和精度,通常用于高级音频制作和编辑。

对于一般的音乐听众来说,16位/44.1 kHz的音频已经能提供很好的音质,而对于专业音频制作,则可能需要24位/96 kHz或更高的设置。

声道数:

声道(Sound Channel) 是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号,所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量

音频常用术语_第1张图片

音频常用术语_第2张图片

音频常用术语_第3张图片

音频帧 

音频数据是流式的,本身没有明确的一帧帧的概念,在实际的应用中,为了音频算法处理/传输的方便,一般约定俗成取2.5ms~60ms为单位的数据量为一帧音频

码率

编码之后的数据会用音频码率的方式来描述他所需要的最低的传输速度,这就是码率

码率=采样率x位深度x声道数

码率也叫位速,单位是比特率(bps,bit per second)。通常听歌时候的128kbps、320kbps均为码率,其中320kbps是mp3格式的最高比特率

44.1kHz采样率、16bit位深的wav文件双声道的码率是44.1x16x2=1411.2kbps

音频编码方式

常见的编码方式有:PCM 和 ADPCM,这些数据代表着无损的原始数字音频信号,添加一些文件头信息,就可以存储为WAV文件了

编解码格式

按压缩程度区分:

不压缩的格式(UnCompressed Audio Format):PCM数据、wav(PCM类型)。

无损压缩格式(Lossless Compressed Audio Format):FLAC、APE、dts、m4a。

有损压缩格式(Lossy Compressed Audio Format):mp3、wma、wav(ADPCM等

按数据来源区分:

流媒体格式(一帧一帧的数据):sbc、msbc、cvsd、aac。

文件格式(音频文件):mp3、wav、wma、flac、ape、m4a、amr、dts、alac。

既可以用于流媒体解码又可以用于文件解码的格式:MSBC

按技术标准区分:

标准格式(国际通用):mp3、wav、wma、flac、ape、m4a、sbc、msbc、cvsd。

自定义格式(仅本司SDK可以使用):G729(wtg)、G726、MTY、wtgv2。

文件名后缀

一般音频格式都有其固定的文件名后缀,如mp3格式:123.mp3

同一文件名后缀,格式可能不同。如wav后缀,可能是adpcm或者dts格式;mp4后缀,可能是m4a或者alac格式。

同一格式,文件名后缀也可能不同。如dts格式,可能是dts或者wav后缀。

编码大小对比

1)PCM做到最大程度的无限接近。PCM约定俗成了无损编码,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M

 2)MP3文件大小计算公式:编码率(kbps) x 时间(秒)/8=文件大小(kB) 

如果 sample.wav 采样率为 8kHz  , 那么对应的 编码率为 24kbps 

于是一分钟mp3文件的大小 = 24 x 60 / 8 = 180 KB ,可近似成 200 K 计算

你可能感兴趣的:(音视频,音视频)