电视播出中的数字音频加解嵌技术

[转]电视播出中的数字音频加解嵌技术简介

本帖最后由 yhm 于 2009-6-15 16:57 编辑

文章来源:局技术论文获奖文章


刘小丰 叶玉群
刘小丰 局播送中心播出部高级工程师;叶玉群 局播送中心播出部助理工程师

    英语中嵌入音频是EMBEDED AUDIO,而加嵌是MULTIPLEXING(简写为MUX),英语本意是多工的概念,指的是在通讯系统里,一个设备在一个载频上同时发送多个信号;而接收设备从中分离出需要的信号,称为DEMUX。
    数字音频种类多,名称或通俗叫法有很多种,我们常常听到的MP3、SACD等,美国的AC-3音频编码标准,欧洲的MPEG音频编码标准,日本的AAC音频标准等;此外,还有CS-51、DTS、THX等标准;我国现有卫星和有线标准清晰度数字电视系统的音频标准为MPEG-1层Ⅱ,即MUSICAM;这些是按信源编码标准称呼的。电视播出中的数字音频,指的是AES/EBU数字音频,和前面那些的命名方式不同,是一种接口标准, AES/EBU(音频工程师协会/欧洲广播联盟)标准是很常用的专业数字音频标准,其中AES是指AES建议书AES3-1992“双通道线性表示的数字音频数据串行传输格式”,EBU是指EBU发表的数字音频接口标准EBU3250,两者内容在实质上是相同的,但后者输入和输出均采用变压器耦合。两者统称为AES/EBU数字音频接口。
    AES/EBU是一种基于单根绞合线用来传输数字音频数据的串行位传输协议。不均衡传输时的距离可达100 m,如果均衡传输,则距离更远。AES/EBU提供两个信道的音频数据(最高24 bit量化),信道是自动计时和自动同步的。它也提供了传输控制的方法和状态信息的表示及一些误码的检测能力。它的时钟信息是由传输端控制,来自AES/EBU的位流。它的3个标准采样率是33 kHz,44.1 kHz,48 kHz,许多接口能够工作在其他不同的采样率上。

  AES/EBU专业模式的状态位格式里数字信号的源和目的地址、日期时间码、采样点数、字节长度和其他信息,比消费模式包含的信息多,其采样频率为48 kHz, 24bit量化。
下面和大家一起了解一下音频嵌入技术的基本常识
1、辅助数据区
分量数字视频格式的有效行中,625/50制共有1728个取样字(525/60制为1716个取样字),其中对Y、Cb和Cr取样有1440个取样字(0~1439)。而对行消隐期间的取样可安排288个取样字(525/60制为276个取样字)。数据传送中,每行的消隐期间的数据是相同的,就是所谓的“冗余”部分,用“SAV”和“EAV”,作为数据开始和结束的标志,不再需要传送同步和色同步信息。模拟视频中的行消隐期间,在数字视频中被称为行辅助数据区“HANC”(Horizontal Anicillary Data);模拟视频中的场消隐期间,在数字视频中被称为场或帧辅助数据区,由EBU定义为“VANC”(Vertical Anicillary Data)。 
    我国广播电影电视行业标准GY/T160-2000《数字分量演播室接口中的附属数据信号格式》,等效采用ITU-RBT1364建议书标准,规定了数字分量演播室应用的嵌入到视频数据信号中的辅助数据格式。分量视频数据信号的辅助数据区,用来传输数字音频等辅助数据信号。辅助数据信号以数据包的形式运载,每个包都带有自身的包头标识,在辅助数据区内,不可随意放置。依据标准规定,插入在数字视频的串行数据流中,可以同时发送多达16个通道,(8个AES/EBU数据流通道)20或24比特的声音信号。但必须紧接在EAV后面,不能有一个码字的空隙。误码检测信号EDH(SMPTE RP165定义)被放置在行辅助数据区的第5或315行(625/50制),但必须紧邻在“SAV”前面,同样不能有一个码字的空隙。行辅助数据区的剩余部分,可安排其它数据使用。顺便提及,对场辅助数据区(VANC),也有特殊的规定,以625/50制为例,第5行留给EDH码,第6行留给SMPTE RP168标准场切换,第10行留给放置DVITC(Digital Vertical Interval Time Code)码。对于分量数字视频格式的辅助数据包有具体的规范。
    数据区结构见表1。附属数据标志ADF表征数据包的开始。ADF由三个字的序列组成,其数值为:oo,ohFF,chFF,ch。因此,如果该空间中的前三个字不是ADF(oo,ohFF,chFF,ch),则可以认为不存在附属数据包,整个区域可以用于插入附属数据包,但不是改写定时基准信号。 数据标识DID(Data ID)规定附属数据包中用户数据字所运载数据的内容和性质。数据块序号DBN(Date Block Number),表明数据包号码,以区分带有共用数据标识的相继附属数据包。接收机可根据包号码的连续性,来判别是否丢失数据。另一种附属数据包没有数据块序号DBN,而将这一字节用来补充数据标识SDID,以增加数据标识范围。数据计数DC(Data Count)表示附属数据包中用户数据字的数量。用户数据字UDW(User Data Words),用来传送由DID标识的最多255个字的信息。需要商讨的是625/50制要有比525/60制多12个字的空间。数据包误码检验CS(Check Sum)用来确定自EAV至UDW的附属数据包的有效性。
下载 (9.78 KB)
2009-6-15 16:37

2、 音频嵌入的帧结构
辅助数据最大的用途是放置音频,被放置的音频称为嵌入音频。嵌入音频最大的好处是解决了电视信号在传输中的声画同步问题。嵌入音频后的视频信号可用一根同轴电缆同时传送音视信号,简化了系统连线。被嵌入的音频信号是以块为单位,打包传送的。一个块由192个连续帧组成,每个帧包含有相关的两个子帧,每个子帧(32比特)表示一个音频通道,放置一个音频取样字,因此一个数字音频码流有2个声道。示意图见表2:
下载 (17.49 KB)
2009-6-15 16:26

    每个子帧定义为32比特,其中前置码占有4比特,音频数据为24比特,在数据位后的4比特,分别是有效标志位V(Validity),用户数据位U(User Data),通道状态位C(Channel Status Data)和子帧的奇偶校验位P(Parity)。子帧结构见表3。
下载 (11.01 KB)
2009-6-15 16:37

    帧的传输速率与源取样频率要严格对应。在视频串行接口中可传输多达8个AES/EBU通道对(音频通道编号为1-16),分编到编号为1~4的音频组中。每个音频数据包传输1个音频组,每个音频组包含两个从各自的AES/EBU音频源中得到的数字音频通道对,即4个音频通道。即使在4个通道(CH1~CH4)中只有1个通道为有效通道时,也应该把4个通道的所有音频数据传输出去,此时要把所有无效通道的V、U、C和P比特置为零。用户数据字(UDW)包括音频时钟相位数据(CLK)、两个AES/EBU音频通道对组成的音频组(4路音频通道)的音频数据(CHn)和纠错码(ECC)。嵌入音频数据字是均匀地放置在各电视行中,消除了伴音和画面口形的不一致。
3.电视播出中AES/EBU音频嵌入和解嵌的实现
    在实际播出中,音频的嵌入是通过专门的加嵌设备实现的。现在的加嵌设备已经模块化,如我台使用的GVG8920MUX加嵌模块,可以在一个2U的箱子里插10块这样的模块。其信号处理方框图如下:
下载 (50.42 KB)
2009-6-15 16:26

    其中,均衡放大器有降噪作用,串行数据转换为并行数据后,会经过EDH处理器,发现的数据错误都会发给FPGA(现场可编程门阵列,FIELD PROGRAMMABLE GATE ARRAY),FPGA中包含辅助数据区管理器,它可以按用户设置,选择需要的音频组,具有替换,保留,删除用户选定的音频组而不破坏辅助数据区其他数据的功能。加嵌器是一个单独的芯片,将选定的音频通道嵌入数字视频中,再在并行-串行转换器里将并行的流转变为串行数字信号,最后分配后输出。
解嵌模块方框图见图2:
下载 (27.91 KB)
2009-6-15 16:41

    很多模块和MUX模块基本相同,信号走向和MUX正相反,其中DEMUX是个单独的芯片,将数字音频从输入的数字视频信号中解出。
    我国参考ITU-R BT1365建议书制定的GY/T162-200《HDTV串行接口中作为附属数据信号的24比特数字音频格式》,确定了音频嵌入技术标准。我国数字电视播出系统中采用音频嵌入技术正成为必然的选择。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/13771794/viewspace-618445/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/13771794/viewspace-618445/

你可能感兴趣的:(电视播出中的数字音频加解嵌技术)