H264和AAC

注:本文比较浅显,适合初学者看。

引述:H264的标准已经很多年了,成熟稳定,普及率非常高,目前比它更好的也有H265和VP9(google出品),但都不能撼动H264的地位。

A: 

h264(MPEG-4Part10), 对应的H265就是(MPEG-4Part11)

1、BP-Baseline Profile:基本画质。支持I/P 帧,只支持无交错(Progressive)和CAVLC;

2、EP-Extended profile:进阶画质。支持I/P/B/SP/SI 帧,只支持无交错(Progressive)和CAVLC;

3、MP-Main profile:主流画质。提供I/P/B 帧,支持无交错(Progressive)和交错(Interlaced),

也支持CAVLC 和CABAC 的支持;

在BP-Baseline Profile基础上另外增加了:

- 隔行编码

- B条带类型

- CABAC熵编码

- 加权预测

- 422和444 YCbCr

- 不支持ASO, FMO和RS


4、HP-High profile:高级画质。在main Profile 的基础上增加了

- 8x8内部预测、4*4和8*8大小之间自适应选择的支持。

- 自定义量化、 

- 可预测无损视频编码

- 更多的YUV 格式;

- 高级10档次(Hi10P), 高级422,444档次;

Baseline和Main比较常用,Baseline 压缩的比较厉害,低于mepg-4的10%-20%; Main低于MPEG-4的50%.  High比Main又能节约10% 的码流量,那High应该是低于mepg-4的45%。

压缩率来说就是BP>HP>MP, 比例大概是100的原始数据, 压缩后BP=15,HP=45,MP=50;

所以MP和HP其实没啥大区别,但是BP就压缩的很低,所以一般监控和直播会首选BP,BP的特点是没有B帧,画质很一般,能满足基本要求。

【B帧的前世今生】

除了Baseline以外,其它都是有B帧的,I/B/P的关系用一句话说就是:I就是一张完整图片,但数据很大,如果都是I帧,视频会很庞大,而且也没必要;P帧是单向参考,前向参考,只参考I帧的,记录和I帧的区别;B帧双向参考,参考I帧和P帧,如果被参考的P帧花屏了,B帧也会花屏。

B帧会带来一个问题:编码顺序和解码顺序不同,因为正常播放时,解码帧的排列是I BBB... P BBB... P

可以看出B帧是插在IP和PP之间的,因为B帧数据比较小,所以会插很多帧。

我们来看看编码的顺序是怎样的:I P BBB...

解码顺序呢:I BBB...P

这问题了来,有B帧时编码解码BP的顺序不一致,所以引入了PTS(显示时间戳)和DTS(解码时间戳)

贴一张装B的图(先留着,我也没仔细看):

H264和AAC_第1张图片

B:

h264的功能分为两层,视频编码层(VCL)和网络提取层(NAL)

VCL功能是进行视频编解码,包括运动补偿预测,变换编码和熵编码等功能;

NAL用于采用适当的格式对VCL视频数据进行封装打包

1)VCL数据即被压缩编码后的视频数据序列。

在VCL数据要封装到NAL单元中之后,才可以用来传输或存储。

VCL里面的几个基本概念就是: YCbCr颜色空间, 宏块,内循环去块过滤器,条带,内部预测,运动补偿,变换、缩放和量化;熵编码

2)NAL单格式(NALU)

H.264定义了两种封装格式: RTP头和start_code_prefix头(00 00 01 和 00 00 00 01)

主要目的是确定NAL边界(其实封装都是这个目的,大同小异)。

包含针对rtp/ip, 文件格式如mp4, 服务视频会议的h.32x, 和mpeg-2系统




参考:《视频技术手册(第5版)》

你可能感兴趣的:(H264和AAC)