H.266/VVC的关键编码技术(五):AI, RA, LD三种编码结构

AI, RA, LD三种编码结构

VVC中采用三种编码结构:全帧内(AI, A11lntra)、低延迟(LD, Low Delay),随机接入(RA, Random Access),分别用于满足不同场景下的编码需求。

AI编码H.266/VVC的关键编码技术(五):AI, RA, LD三种编码结构_第1张图片
在全帧内编码结构下,序列中每一帧图像均采用帧内编码,具有各自独立的上图所示,I帧不需要参考其他帧的像素信息,可独立的进行编解码,且每一帧的量化参数都保持一致,AI编码结构适合信道环境较差,容易发生丢包现象的编码场景,当发生丢包时不会影响后续帧的编解码。

RA编码H.266/VVC的关键编码技术(五):AI, RA, LD三种编码结构_第2张图片
在低延迟编码结构下,一个编码序列中仅有第一帧图像是I帧,后续所有B帧/P帧被分为多个图像组(Group Of Pictures , GOP),根据后续帧的类型,将低延迟编码结构进一步分为LDB和LDP两种编码框架。在LD配置下,参考列表中的参考帧均处于当前编码帧时域顺序之前,P帧仅有一个参考列表,而B帧有两个参考列表。

将每帧图像的播放顺序记为POC(Picture Order Count)编码顺序记为EOC(Encoding Order Count)。在LD配置下,播放顺序和编码顺序相同,每帧图像仅参考播放顺序在当前编码图像之前的重建帧,视频序列按播放顺序编解码,不必等待编码顺序在当前图像后面而播放顺序在前面的图像的编解码,时延相对更小,低延时结构由此得名,适合直播,视频通话等对时延要求较高的场景。在VVC默认LD配置下,GOP的大小为4,又根据GOP内的参考关系将一个GOP中的4帧编码帧分配到3个时域层TL,不同时域层的量化参数不同,相比于HEVC,不同TL之间的QP偏移值Qpoffset,进一步增大,且Qp offset,与I帧的量化参数QP有关,除I帧外,TL1的QP是最小的,因为它被TL2和TL3的编码帧直接或间接参考,所以它的重建质量是最高的,其次是TL2,被TL3的编码帧直接或间接参考,QP最大的是TL3的编码帧,因此其重建质量是最低的。

LD编码H.266/VVC的关键编码技术(五):AI, RA, LD三种编码结构_第3张图片
随机接入编码结构是三种编码结构中性能最高的,采用循环GOP结构,处于GOP中相同位置的编码帧采用相同的参考帧和量化参数。VVC中默认随机接入编码框架,相比于HEVC, GOP大小从8增大至16,编码帧的播放顺序POC与编码顺序EOC不相等,此时,GOP中的16个编码图像被分配到5个时域层TL,每个TL的Qpoffset,设置方式与I帧的量化参数QP1有关,为了应对广播及流媒体应用的需求,引入随机接入点(Random Access Point, RAP)的概念,使得序列在播放时可以实现无缝切换,RAP帧都是I帧,除了RAP帧之外的其他编码帧均是B帧。序列第一个RAP帧称为即时刷新帧(Instantaneous Decoding Refresh, IDR),根据视频序列的帧率和GOP大小设置IntraPeriod参数,通常设置为GOP大小的整数倍且最接近视频序列的帧率,固定地以IntraPeriod为周期在编码时插入I帧,后续插入的I帧称为纯随机接入帧CRA(Clean Random Access) 。

你可能感兴趣的:(VVC/H.266,视频处理,音频编码解码)