杜比数字AC-3(Dolby Digital AC-3)是杜比公司开发的新一代家庭影院多声道数字音频系统。
杜比定向逻辑系统是一个模拟系统。
它的四个声道是从编码后的两个声道分解出来的,
因此难免有分离度不佳、信噪比不高,对环绕声缺乏立体感,
并且环绕声的频带窄等缺点。AC(Audio Coding)指的是数字音频编码,它抛弃了模拟技术,
采用的是全新的数字技术。
杜比AC-3特点
杜比数字AC-
3提供的环绕声系统由五个全频域声道加一个超低音声道组成,
所以被称作5.1个声道。五个声道包括前置的“左声道”、“
中置声道”、“右声道”、后置的“左环绕声道”和“右环绕声道”
。这些声道的频率范围均为全频域响应3-20000Hz。
第六个声道也就是超低音声道包含了一些额外的低音信息,
使得一些场景如爆炸、撞击声等的效果更好。
由于这个声道的频率响应为3-120Hz,所以称“.1“声道。
杜比数字AC-3是根据感觉来开发的编码系统多声道环绕声。
它将每一种声音的频率根据人耳的听觉特性区分为许多窄小频段,
在编码过程中再根据音响心理学的原理进行分析,保留有效的音频,
删除多作的信号和各种噪声频率,使重现的声音更加纯净,
分离度极高。
杜比数字AC-3系统可用前置的左、右音箱,
中置音箱产生极有深度感和定位明确的音场,
用两个后置或侧置的环绕音箱和超低音箱表现宽广壮阔的音场,
而六个声道的信息在制作和还原过程中全部数字化,
信息损失的很少。全频段的细节十分丰富,具有真正的立体声。
杜比数字AC-3具有很好的兼容性,它除了可执行自身的解码外,
还可以为杜比定向逻辑解码服务。因此,
目前已生产的杜比定向逻辑影视软件都可以使用杜比数字AC-
3系统重现。由于杜比数字AC-3系统的编码非常灵活,
所以它的格式很多。目前它已被美国采用作为高清晰电视(
HDTV)音频系统,最新DVD机也包含杜比数字AC-3。
因此杜比AC-3环绕声系统可能是极有发展前途的技术。
杜比AC-3原理
自1976年杜比环绕声(Dolby stereo optical,4-ch)首次应用于电影后,
已成为最受欢迎的多声道立体声系统之一,用于家庭的杜比环绕声(
Dolby Surround,3-ch,1982)和杜比定向逻辑环绕声(
Dolby Surround Pro Logic,4-ch,1987),
更能让你在家中享受电影院的环绕声效果。
1992年杜比公司又开发了最新一代的杜比数码环绕声系统(
Dolby Digital)并应用于电影,该系统基于先进的感觉编码(
perceptual coding)和数字压缩编码技术,即杜比AC-3。
其优良的特点使之在1995年被选作DVD播放机的标准多声道音
频格式(在NTSC制电视的国家)
及多项其它系统的标准音频格式。
杜比数码环绕声系统有6个完全独立的声道,全频带的左、右、
中置、左环绕、右环绕,再加上一个20~
120Hz的超重低音的声道(以01声道计),故又称作5
1声道。在杜比AC-
3规格中超重低音的音量比其它全频带声道大10dB,
可得到震撼力非凡的低频效果。
杜比AC-
3原理上是它将每一声道的音频根据人耳听觉特性划分为许多最优的
狭窄频段,利用音响心理学“听觉掩蔽效应”,
删除人耳所听不到或可忽略的部分,并采用数字信号压缩编码。
同时,
利用狭窄频段的划分使部分频段噪声在编码时可被几乎全部滤除,
使其余噪声的频谱靠近在信号频谱附近,
而这些噪声可被信号所抑制。因此杜比AC-
3系统实际上是一种具选择性及强抑噪的系统。不难理解杜比AC-
3的特点:以较低的码率支持全音频多声道,
并具优良的回放音质和效果。
杜比AC-3就是一种感知型编码方式,
它把整个音频频带分割成若干个较窄的频段,
因为人类的听觉对不同频率的声音具有不同的灵敏度,
各频段的宽度并不完全一样。由于有用的信号被划分成狭窄的频频,
编码噪声的滤降总是就比较容易。因为对于每个频段来说,
该频率以外的所有信号可以全部被滤除掉而不会损伤有用信号。
而频段内,剩余噪声信号的频率与有用信号的频率非常接近,
这正是遮蔽效应发挥最大作用的区域。从这种意义上说,象AC-
3这样的感知型编码系统是一种非常有效的减噪系数。
这些被分割成狭窄频段的多路数字音频信号最终还需要被合成一路完
整的全频带信号,但每一个频段所占有的数据量并不是平均分配的,
编码器内部有一个“听觉遮蔽模块”,可以模拟人的听觉遮蔽效应,
它能根据信号的动态特性来决定在某一时刻的数据用量应当如何分配
给各频段才是最合适的。频谱密集、
音量大的声音元素应该获得较多的数据占有量,
那些由于遮蔽效应而听不到的声音则少占用或不占用数据量。
AC-3编解码技术
AC-3是在AC-1和AC-
2基础上发展起来的多通道编码技术,保留了原AC-
2中如窗函数处理、指数变换编码、自适应比特分配等许多特点,
还新增了运用立体声多声道的编码技术策略的coupling和r
ematrix算法。一般而言,
立体声的左声道和右声道的信号在听觉上十分相似,
存在着许多重复的冗余信息,
将这两个声道的信号联合起来加以编码,
便可除去冗余的信号且不会影响原来的音质。这里AC-
3阵低码率的又一个有效的手法。
AC-3输入PC声音数据,输出压缩后的数码流。
编码的第一步是,运用TDAC(Time Domain Aliasing Cancellation)
滤波器把时域内的PC取样数据变换成频域内成块的一系列变换系数
,每个变换系数以二进制指数形式表示,
即由一个指数和一个尾数构成。
指数部分经编码后构成了整个信号大致的频谱,又被称为频谱包络。
用频谱包括和遮蔽由线的相关性决定每个尾数的比特分配。
由于比特分配中采用了前/
后向混合自适应比特分配以及公共比特池等技术,
因而可使有限的码率在各声道之间、
不同的频率分量之间获得合理的分配;在对尾数的量化过程中,
可对尾数进行抖晃处理,
抖晃所使用的伪随机数生器的可在不同的平台上获得相同的结果。
最后由六个块的频谱包络、粗量化的尾数及相应的参数组成AC-
3数据帧格式,连续的帧汇成数码流输出。
由时域变换到频域的块长度的选择是指数变换编码的基础。在AC-
3中定义了两种长度切换,一种是512个样值点的长块,
一种是256个样值点的短块。在信号频谱分析时,
对要处理的声道信号块区截取得越长越好,
这样可以得到较好的频率分辨力,同时也能得到较高的编码效率。
但是较长的数据块可能包含了一些不同一些可能被识别的噪音,
如pre-echo。
也就是说人耳因时间和频率上存在的遮蔽效应在进行指数变换编码时
是有矛质的,不能同时兼顾,必须统筹处理。对于稳态信号,
其频率随时间变换缓慢,为提高编码效率,
要求滤波器组有好的频率分辨力,即要求一个长区块;
而对于快速变化的信号,则要求好的时间分辨力,
即要求一个短区块。在编码器中,
输入信号在经过3Hz高通滤波器去除直流成分后,
再经过一个8kHz的高通滤波器取出高频成分,
用其能量与预先设定的阈值相比较,以检测信号的瞬变情况。
AC-3采用基于改良离散余弦变换(MDCT)
的自适应变换编码(ATC)算法。虽然在AC-
3标准中定义了MDCT变换,但是实际采用一个N/
4点的IFFT(快速傅立叶变换),再加上两个简单的Pre-
IFFT和Post-IFFT作为调整,
以实现一个N点的IMDCT变换。
ATC算法的一个重要考虑是基于听觉遮蔽效应的临界频带理论,
即在临界频带内一个声音对另一个声音信号的遮蔽效应最明显。
因此,划分频带的滤波器组要有足够迅速的频率响应,
以此保证临界频带外的噪声衰减足够大,
使时域和频率内的噪声限定在遮蔽阈值以下。
在AC-3编码器的比特分配技术中,
采用了应用广泛的前向和后向自适应比特分配法则。
前向自适应方法是编码器计算比特分配,
并把比特分配信息明确地编入数据比特流中,
其特点是在前端编码过程中使用听觉模型,
因此修改模型对接收侧解码过程没有影响;其缺点是降低编码效率,
因为要传送比特分配信息而占用了一部分有效比特。
后向自适应方法没有得到编码器明确的比特分配信息,
而是从数码流中产生比特分配信息,优点是不占用有效比特,
因此有更高的传输效率。其缺点是要从接收的数据中计算比特分配,
如果计算太复杂会使解码器的成本升高。此外,
解码器的算法也会随着编码器听觉模型的改变而改变。AC-
3采用混合前向/后向自适应比特分配,
在提高码率和降低成本间取得了平衡。
AC-3解码器的解码原理基本上是编码的逆向过程,
首先解码器必须与编码数据流同步,
然后从经过数据纠错校验的数码流中分离出控制数据、
系统配置参数、编码后的频谱包络及量化后的尾数等内容,
根据声音的频谱包络产生比特分配信息,对尾数部分进行反量化,
恢复变换系数的指数和尾数,再经过合成滤波器组,
把数据由频域变换到时域,最后输出重建的PCM样值信号。
通过对AC-3的了解,可以看到AC-
3技术充分利用人耳的感官模型,针对不同性质的信号,
采取了相应有效的算法,
达到了在保证较高音质的前提下实现较高码率的预期目的,
是一种非常高效而又经济的数字音频压缩系统。AC-
3是美国数字电视系统的强制标准,
是欧洲数字电视系统的推荐标准,同时,AC-
3还是DVD系统的强制标准。
目前我国正在发展和推广数字电视系统,所有有理由相信AC-
3技术会有一个不错的应用前景。
在DVD中应用
以美国C-CUBE公司研制成功的ZIVA-D6
DVD解压芯片为核心,组成了一个DVD播放机(Dolby Digital C级产品)方案。其音频解码和输出的方框图如图1所示。
该方案可支持多种源音频的解码,有一个光纤数码输出,
一个2声道模拟输出和一个5.1声道模拟输出。
既满足了杜比AC-3的输出配置要求,
又满足了与不同功放的配接。
1声源的解码输出模式
ZiVA可以根据检测到音源码的采样频率和大小的变化进行音源识
别,主要是MPEG-1的系统码流,MPEG-2的节目码流,
LPCM的采样码和VCD的扇区码。
然后通报MCU以便控制数模转换器。
声源CD-DA,LPCM,
MPEG1等都以1或2声道的格式记录于光碟中,而且ZiVA-
D6不包含Dolby Pro Logic解码器,所以都以1或2声道的方式输出。
声源Dolby Digital经解码生成多声道的数码送到D/A转换器,
可根据节目源内容和听音喇叭配置的数量,
设置生成相应的多声道的模拟声频输出。例如3/2,LCR/SL SR;2/2,LR/SL SR;3/1,LCR/S;2/1,LR/S;3/0,LCR;
2/0,LR;1/0 C;2/0,LtRt等八种数码混合输出模式。
以上的各种模式是由ZiVA-D6解码器通过矩阵混合产生,
SUB声道没参与混合,是独立声道输出。
表面上ZiVA-D6解码器输出模式等同杜比输出模式,
但目前其技术规范并不能完全符合AC-3的规格。因此需要在D/
A后作专门电路设计以达到杜比AC-3的规格要求,见本文四。
2DVD音频输出
DVD音频有两种输出形式:一是数码输出;二是音频模拟输出。
数码输出有两种格式:光纤数码输出(
IEC958或IEC1937)和数码RF输出。
本方案选择光纤数码IEC958输出,采用S/PDIF(
SONY/PHIL IPS数码界面)光学联结器(内含电光转换器)生成光信号,
再用光纤传输到其它A/V产品,如AC-3功率放大器等。
音频模拟输出:2-ch输出是符合杜比AC-
3混合输出要求的必选项,且在声源为Dolby Digital时,以2/0,LtRt(杜比定向逻辑模式)
输出。
线性输出起初意图是联结到一个外接的立体声或环绕声复制系统,
而不直接联结功率放大器。
于是应该有符合标准电平的固定声音输出,
这个标准电平依靠应用软件进行控制。
所以DVD等视频影碟机取消音量控制线性输出。
而多路输出是可选择项,本方案亦选择。