【AV SYNC】数字电视中的编解码器同步机制

数字电视中的编解码器同步机制

1MPEG-2流结构
   
在数字电视系统中,模拟视音频信号按照MPEG-2的标准,经过抽样、量化及压缩编码形成基本码流ES,基本码流ES是不分段的连续码流。把基本码流分割成段,并加上相应的头文件打包形成的打包基本码流PES(如图1所示),PES包和包之间可以是不连续的。在传输时将PES包再分段打成有固定长度188B的传送码流TS或可变长度的节目流包(PS包)。PES只是PS转换为TSTS转换为PS的中间步骤或桥梁,时MPEG-2数据流互换的逻辑结构。TSPS这两种码流分别适应于不同的场合应用,节目流PS适合在相对出错较少的环境下使用,其长度是变化的,而传送流TS能够把多个节目在基于一个或多个时间标识的基础上构成一个流,传送流适合于出错较多的场合下使用。用数据包传输的优点是:网络中信息可占用不同的连接线路和简单暂存。通过数据包交织把多个数据流复用成一个新的数据流。便于解码器按照相应顺序对数据包进行灵活的整理,从而,为数据流同步和复用奠定了基础。

MPEG-2的结构可分为压缩层和系统层,其中ES属于压缩层,PESTS/PS属于系统层
PES层,主要是在PES包头信息中加入PTS(显示时间标签)DTS(解码时间标签)用于视频、音频同步

而在TS流中,TS包头加入了PCR(节目时钟参考),用于解码器的系统时钟恢复。

在节目流PS包头中加入SCR,它的作用与PCR域相似
    ES
是编码视频数据流或音频数据流,每个ES都由若干个存取单元(AU)组成,每个视频AU或音频AU都是由头部和编码数据两部分组成,1AU相当于编码的1幅视频图像或1个音频帧,也可以说,每个AU实际上是编码数据流的显示单元,即相当于解码的1幅视频图像或1个音频帧的取样。
   
我们知道,MPEG-2对视频的压缩产生I帧、P帧、B帧。把帧顺序I1-P4-B2-B3-P7-B5-B6帧的编码ES,通过打包并在每个帧中插入PTS/DTS标志,变成PES。在插入PTS/DTS标志时,由于在BPTSDTS是相等的,所以无须在B帧多插入DTS(参见图1)。而对于I帧和P帧,由于经过复用后数据包的顺序会发生变化,显示前一定要存储于视频解码器的从新排序缓存器中,经过从新排序后再显示,所以一定要同时插入PTSDTS作为从新排序的依据。例如,解码器输入的图像帧顺序为I1-P4-B2-B3-P7-B5-B6,但显示时P4一定要在B2B3之后,在PSTDTS的指引下,经过缓存器从新排序,以从建视频帧顺序为:I1-B2-B3-P4- P7-B5-B6
   
PES包再打成更小的具固定长度的TS包时在其包头位置加入了PCRPID(包标识)PID的值是由用户确定的,解码器根据PIDTS(多节目传输流)上不同节目的TS包区分出来,以重建原来的ES。另外,TS的包头包含一个4bit的连续计数器,连续计数器可对PID包传送顺序计数,据计数器读数,接收端可判断是否有包丢失及包传送顺序错误。所以TS的包头具有同步、识别、检错等功能。


2
、时间模型
   
MPEG-2系统层时间模型中,它的端到端延迟——从信号进入编码器到信号从解码器输出是一个常数,信号总共经过编码器、编码缓冲器、多路复用器、传输或存储、解复用器、解码缓冲器以及解码器等器件的延迟。如图2所示。


   
所有的视频和音频经过采样(A/D变换)进入编码器后,经一恒定的延迟,在解码器分别输出显示,采样后的码率在编码器和解码器中应严格相等。在MPEG-2中,所有的时序被定义成一个共同的系统时钟(STC),故编码器、解码器的系统时钟必须同步。解码器的系统时钟应由编码器的系统时钟经恒定延迟后恢复出来,以服从于编码器
   
对于PS(节目流)而言,这个时钟可以与视频或音频采样时钟之间有一个严格的特定比率,或者稍有区别,但仍足以提供精确的端到端的时序和时钟恢复。而在TS(传输流)中,此系统时钟频率与视频或音频的采样时钟之间任何时候都必须有严格的比率关系,其目的是为了在解码器中恢复视音频采样后的码率。


3
、时间标签定义及同步机制
   
编码器中有一个系统时钟(其频率是27MHz),此时钟用来产生指示音视频的正确显示和解码的时间标签,同时可用来指示在采样过程中系统时钟本身的瞬时值。指示音视频显示时间的时间标签称为显示时间标签(PTS),指示音视频的解码时间标签称为解码时间标签(DTS),指示系统时钟本身的瞬时值的时间标签称为节目参考时钟标签(PCR)。解码器通过VBV_delay(视频流延时值,在解码时利用视频流缓冲区把视频流缓存到相应的vbv_delay时间后,再启动解码器解码、显示、实现音视频的同步。vbv_delay存在于视频ES的头部,长度为16bit)的数值来确定解码的开始,用解码时间标签(DTS)和显示时间标签(PTS)来确定解码和显示的次序,用PCR来获得系统时钟的同步。解码器中的系统时钟及其同步就是依靠这些时间标签来进行恢复和修正的。
PCR
PTSDTS具体构成如下:
    PCR
的插入必须在PCR字段的最后离开复用器的那一时刻,同时把27 MHz系统时钟的采样瞬时值作为PCR字段插入到相应的PCR域。27 MHz时钟经波形整理后分两路,一路是由27MHz脉冲直接触发计数器生成扩展域PCR_ext,长度为9bits。另一路经一个300分频器后的90 kHz脉冲送入一个33位计数器生成90KHZ基值,列入PCR_base(基值域),长度33bits,用于和PTS/DTS比较,产生解码和显示所需要的同步信号。这两部分被置入PCR域,共同组成了42位的PCR
    PTS
域为33bits,编码成为3个独立的字段,表示此分组中第一个访问单元在系统目标解码器中的预定显示时间。
    DTS
域也为33bits,编码成为3个独立的字段,表示此分组中第一个访问单元在系统目标解码器中的预定解码时间。
   
解码器在解码时,首先利用PCR重建和编码器同步的27 MHz系统时钟,恢复27 MHz系统时钟后,再利用PES流中的DTSPTS进行音频与视频间的同步,同时利用VBV_Delay设置解码器的缓冲时长,后启动初始解码。
解码器同步算法如下:
1) 解码器从输入码流的包头中解出时间信息PCR送入到系统时间时钟恢复电路;系统时间时钟恢复电路在接收到每一个新的PCR时,进行本地系统时间时钟恢复和锁相。
2) 解复用器后,从PES包头中解出显示时间标签PTS和解码时间标签DTS,并送入到基本流解码器中。
3) 基本流解码器在接收到新的PTS/DTS后,存入对应的FIFO(先进先处存储器)中进行管理;对于没有PTS/DTS的显示单元,需要对其时间标签进行插值,并送入到FIFO中管理。
4) 每一显示单元开始解码前,用其对应的DTSSTC进行比较,当STCDTS相等时开始解码;
5) 每一显示单元开始显示前,用其对应的PTSSTC进行比较,当STCPTS相等时开始显示。
   
在理想情况下,PTSDTS的值应该是相同的,但由于实际解码器在解码时需要一定的时间,所以PTSDTS的值是不同的。如果在PES包头中只出现了PTS,我们就认为DTS=PTS


4
、系统时钟(STC)恢复
   
在解码器中,STC的恢复是同步的关键。如果解码器中的时钟频率和编码器的时钟频率严格匹配,那么视频和音频的解码和显示将自动和编码器保持相同的速率,此时,端到端的延迟是一个常数。在实际中,是利用接收到的PCR的值来使解码器时钟服从于编码器的系统时钟,其典型方法是通过锁相环(PLL)。
   
当一个新节目的PCR到达解码器时,就需要更新时间基点,STC要设置为PCR中的当前值。通常第一个从解复用器中解出的PCR被直接装入到STC的计数器,PCR的值作为锁相环的参考频率,用来和STC的当前值比较,产生的差值e,经过脉宽调制后输入到低通滤波器并经放大,成为控制信号f用来控制振荡器(VCO)的瞬时频率,VCO输出的频率是在27 MHz左右振荡信号,它作为解码器的系统时钟。如图3所示。


5
DTS/PTS的管理
   
PCR域的33 bits中的90 kHz部分(即PCR-Base域)用于与PTSDTS作比较,当二者相同时,相应的单元被显示或者解码。但按照MPEG-2标准的规定,PTS/DTS位于PES包的包头中,而解复用器所解出的PES包头的字节不被送入到任何基本流解码器的输入缓冲区,仅用于控制各解码器工作。每当解复用器解到一个PTS/DTS时,PTS/DTS就作为其后送入各个基本流解码器的输入缓冲器中的数据的显示/解码时间,但此时送入信道缓冲器中的基本流并不一定立即被解码,因此基本流解码器必须记录当前这个PTS/DTS及所对应的码流位置,以利于后面的解码和显示同步。
   
针对以上分析,我们采用如下方法来达到解码与显示的同步:在每一个基本流解码器中建立一个33 bitsPTS/DTS先入先出存储器(FIFO),用以存放PTS/DTS值,同时在解复用器中加入一个检测电路,每当码流开始新的一帧图像时,则产生一个信号,用来通知基本流解码器,并将该帧图像的PTS/DTS写入到FIFO中。每当解码器解到一帧图像时,就从FIFO中读出相应的PTS/DTS,此PTS/DTSSTC进行比较,当两者相等时,当前图像就开始显示/解码。
   
MPEG-2标准中,并非每一个PES包或每一帧图像均有PTSDTS,一般PS流中每两个PTS之间的间隔是0.7 s,而TS流中每两个PTS之间的间隔是0.1 s,所以在没有PTSDTS的一帧图像出现时,我们可以在前一PTS/DTS的基础上加一增量得到对应该帧图像的PTS/DTS,并将计算出来的新的PTS/DTS插入到存放PTS/DTSFIFO中去,即:PTSn=PTSn1+ΔPTSn为第n帧图像)。


6
PTS/DTS同步实现和失步处理
    27 MHz
系统时钟经过300分频后,得到本地的33 bits PCR_Base,该时钟与寄存器中当前图像的PTS/DTS进行比较,系统软件根据比较结果做出相应的处理:
1) 若当前的PTS/DTSPCR计数器的值小于半帧以上,即PTS_Base≤-ΔPTS/2,此时说明系统解码过慢,解码器处于失步状态,应根据该帧的结构做出相应的同步调整;
2) 若当前的PTS/DTSPCR计数器的值在半帧时间以内,我们认为此时系统解码正常,立即显示/解码当前帧;
3) 若当前的PTS/DTS大于PCR计数器的值,则此时解码器稍快,在这种情况下,只需等到PCRPTS/DTS相等时,就可显示/解码

你可能感兴趣的:(算法,工作,网络,存储,扩展,delay)