音频采样频率为什么是44.1k?

44.1k这个特别的数字,在音频采样和编码的时候经常会遇到。这是无损音质的采样码率,音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)。

为什么是44.1k而不是?

主要依据几个点:
  1. 人能听到的声音范围为20-20kHZ。
  2. 根据采样定理,采样频率必须为被采样数据的最高频率的2倍以上,才能确保数据的完整性。

根据1 和 2 那么理论上,采样频率应该是40kHZ即可,为什么是44.1k,这个特别的数字?
网上有些说法说考虑到一定的数据冗余,才定为44.1k。这个说法站不住脚。 实际上,44.1K是行业标准,因为一些原因被当时寡头垄断的SONY确定,维基百科有详细的说明。到了这里基本解惑了为什么是44.1k这个特别的频率了。其实里面还是设计到更多的点,如数据的混叠问题,采样率更好是选择2.5倍,而不是2倍。

先从采样定理说起:

为什么是2倍,才能保证数据完整性?如果少于2倍会存在什么问题?
插个概念:根据采样定理,采样率的1/2为奈奎斯特频率。

如果采样频率达不到数据最高频率的一半,那么数据那么存在把高频信号采样成低频信号的可能。频率高于奈奎斯特频率的数据成分将被重构成低于奈奎斯特频率的信号,这种频谱重叠导致的失真成为混叠。如下图所示:


image.png

为什么更好的选择是2.5被或以上?

当进行采样的时候,通常我们只想获取到关注的那部分频率的数据,即20-20kHZ,通过滤波器滤波能达到目的,实际上所有的滤波器包括数字滤波器都达不到完美的滤波。滤波器存在滤波陡度,即在奈奎斯特频率以上存在一个过渡带宽,过渡带宽以上才被完全滤波。所以(奈奎斯特频率)以上的一些区域还存在混叠的可能性,这个区域对应的带宽的80%以上部分,也就是带宽的80%-100%区域。

image.png

为了解决这部分的混叠,把采样频率提高即可,根据80%-100%区域,可以计算出把采样频率调整为2.5倍,这样就能保证关注的频率范围内不存在混叠现象。

理论上为44k就能达到无损,为什么还有48k、960k能高采样?

无损是数学理论上的,实际上只能无限逼近,那么更高的频率就代表更好的音质。另外,48kHz是视频和电视台的音频标准,48K更好的兼容视频。

补充:

在数字音频领域,常用的采样率有:

8,000 Hz - 电话所用采样率, 对于人的说话已经足够

11,025 Hz-AM调幅广播所用采样率

22,050 Hz和24,000 Hz- FM调频广播所用采样率

32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率

44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率

47,250 Hz - 商用 PCM 录音机所用采样率

48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率

50,000 Hz - 商用数字录音机所用采样率

96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率

2.8224 MHz - Direct Stream Digital 的 1 位 sigma-delta modulation 过程所用采样率。

参考:

百度百科-采样定理
采样定理
维基百科:44,100 Hz
采样定理为2倍,为什么经常用2.56倍进行采样?

你可能感兴趣的:(音频采样频率为什么是44.1k?)