H264 视频流rtp打包之我理解

H264视频流一般关键帧都会有 00 00 00 01 sps + 00 00 00 01 pps,
sps:是以 67 开头的数据 一般是 [00 00 00 01 67 42 A0 1E 23 56 0E 2F … ]

pps:是以68开头的 一般是【00 00 00 01 68 CE 3C 80】

若是一帧数据的长度小于MTU,则可以一包就发送完,直接在数据前面加12字节的RTP头就可以了

FA-U分片打包:
NALU头由一个字节组成,它的语法如下:

  +---------------+
  |0|1|2|3|4|5|6|7|
  +-+-+-+-+-+-+-+-+
  |F|NRI|  Type   |
  +---------------+

F: 1个比特.
forbidden_zero_bit. 在 H.264 规范中规定了这一位必须为 0.

NRI: 2个比特.
nal_ref_idc. 取00~11,似乎指示这个NALU的重要性,如00的NALU解码器可以丢弃它而不影响图像的回放.

Type: 5个比特.
nal_unit_type. 这个NALU单元的类型.简述如下:

0 没有定义
1-23 NAL单元 单个 NAL 单元包
24 STAP-A 单一时间的组合包
25 STAP-B 单一时间的组合包
26 MTAP16 多个时间的组合包
27 MTAP24 多个时间的组合包
28 FU-A 分片的单元
29 FU-B 分片的单元
30-31 没有定义

h264仅用1-23,24以后的用在RTP H264负载类型头中

FA-U分片时,每一包的RTP头后面都需要有两个字节的 FA-U头,FA-U头的构造:

每一帧视频数据都会有一个 NALU 头,00 00 00 01 65这个是关键帧的NALU头 非关键帧的头为 00 00 00 01 61

NALU头的前三个位加上fa-u的type 也就是0x1c(28)的后五位组成第一个字节
|0|1|2|3|4|5|6|7|
|F|NRI| type |
0x65 二进制:01100101 0x1c二进制: 00011100
01100101 取高三位
00011100 取低五位
高三位低五位组成:01111100 (0x7c)

第二个字节构成:
|0|1|2|3|4|5|6|7|
|S|E|R| type |
高三位为此包的描述,低五位为nalu头的低五位
S:第一包
E:最后一包
R:默认0
type:这里的type 就是nalu头的后五位

这个组一个第一包的FA-U头的第二字节:
S = 1 ,E = 0,R=0,
高三位二进制:1 0 0 0 0 0 0 0
低五位二进制:0 0 0 0 0 1 0 1(0x65 二进制:01100101)
组成:10000101 (0x85)
这样就构成了FA-U的头了,解包时只需要反过来取第一字节高三位,第二字节低五位就能组成0x65了

你可能感兴趣的:(c,技术,c语言,rtp,h264)