FLV文件格式
FLV包括文件头(File Header)和文件体(File Body)两部分。文件结构如图所示:
FLV文件头
header部分记录了flv的类型、版本等信息,是flv的开头,一般都差不多,占9bytes。具体格式如下:
Header | 字节数(byte) | 描述 |
---|---|---|
文件标识(signature) | 3 | 总是为”FLV”,0x46 0x4c 0x56 |
版本(version) | 1 | 目前为0x01 |
流信息(TypeFlags) | 1 | 文件的标志位说明。前5位保留,必须为0;第6位为音频Tag:1表示有音频;第七位保留,为0; 第8位为视频Tag:1表示有视频 |
Header长度(HeaderSize) | 4 | 整个header的长度,一般为9(版本为0x01时);大于9表示下面还有扩展信息。即0x00000009 |
.
FLV文件体
文件体由一系列的Tag组成。其中,每个Tag前面还包含了Previous Tag Size字段,表示前面一个Tag的大小。Tag的类型可以是视频、音频和Script,每个Tag只能包含以上三种类型的数据中的一种。
每个Tag由也是由两部分组成的:Tag Header和Tag Data。Tag Header里存放的是当前Tag的类型、数据区(Tag Data)长度等信息,具体如下:
Tag | 字节数(byte) | 描述 |
---|---|---|
Tag类型(Type) | 1 | 0x08:音频; 0x09:视频; 0x12:脚本; 其他:保留 |
数据区长度(DataSize) | 3 | 在数据区的长度 |
时间戳(Timestamp) | 3 | 整数,单位是毫秒。对于脚本型的tag总是0 (CTS) |
时间戳扩展(Timestamp_ex) | 1 | 将时间戳扩展为4bytes,代表高8位。很少用到 |
StreamsID | 3 | 总是0 |
数据区(data) | 由数据区长度决定 | 数据实体 |
.
下面详细介绍一下三种Tag的Tag Data部分的结构:
Audio Tag Data结构(音频Tag)
音频Tag开始的第1个字节包含了音频数据的参数信息,从第2个字节开始为音频流数据。如图为音频Tag结构:
第1个字节的前4位的数值表示了音频编码类型,第5-6位的数值表示音频采样率,第7位表示音频采样精度,第8位表示音频类型。具体格式如下:
从上图可以看出,FLV封装格式并不支持48KHz的采样率。
Video Tag Data结构(视频Tag)
视频Tag也用开始的第1个字节包含视频数据的参数信息,从第2个字节为视频流数据。如图为视频Tag结构:
第1个字节的前4位的数值表示帧类型,第1个字节的后4位的数值表示视频编码类型。具体格式如下:
VideoData为数据具体内容:
如果CodecID=2,为H263VideoPacket;
如果CodecID=3,为ScreenVideopacket;
如果CodecID=4,为VP6FLVVideoPacket;
如果CodecID=5,为VP6FLVAlphaVideoPacket;
如果CodecID=6,为ScreenV2VideoPacket;
如果CodecID=7,为AVCVideoPacket;
AVCVideoPacket格式
AVCVideoPacket同样包括Packet Header和Packet Body两部分:
即AVCVideoPacket Format:
| AVCPacketType(8)| CompostionTime(24) | Data |
AVCPacketType为包的类型:
如果AVCPacketType=0x00,为AVCSequence Header;
如果AVCPacketType=0x01,为AVC NALU;
如果AVCPacketType=0x02,为AVC end ofsequence
CompositionTime为相对时间戳:
如果AVCPacketType=0x01, 为相对时间戳;
其它,均为0;
Data为负载数据:
如果AVCPacketType=0x00,为AVCDecorderConfigurationRecord;
如果AVCPacketType=0x01,为NALUs;
如果AVCPacketType=0x02,为空。
AVCDecorderConfigurationRecord格式
AVCDecorderConfigurationRecord包括文件的信息。
具体格式如下:
| cfgVersion(8) | avcProfile(8) | profileCompatibility(8) |avcLevel(8) | reserved(6) | lengthSizeMinusOne(2) | reserved(3) | numOfSPS(5) |spsLength(16) | sps(n) | numOfPPS(8) | ppsLength(16) | pps(n) |
Script Tag Data结构(控制帧)
该类型Tag又通常被称为Metadata Tag,会放一些关于FLV视频和音频的元数据信息如:duration、width、height等。通常该类型Tag会跟在File Header后面作为第一个Tag出现,而且只有一个。结构如图所示:
第一个AMF包:
第1个字节表示AMF包类型,常见的数据类型如下:
0 = Number type
1 = Boolean type
2 = String type
3 = Object type
4 = MovieClip type
5 = Null type
6 = Undefined type
7 = Reference type
8 = ECMA array type
10 = Strict array type
11 = Date type
12 = Long string type
FLV文件中,第一个字节一般总是0x02,表示字符串。第2-3个字节为UI16类型值,标识字符串的长度,一般总是0x000A(“onMetaData”长度)。后面字节为具体的字符串,一般总为“onMetaData”(6F,6E,4D,65,74,61,44,61,74,61)。
第二个AMF包:
第1个字节表示AMF包类型,一般总是0x08,表示数组。第2-5个字节为UI32类型值,表示数组元素的个数。后面即为各数组元素的封装,数组元素为元素名称和值组成的对。常见的数组元素如下表:
引用
https://wuyuans.com/2012/08/flv-format/
http://blog.csdn.net/leixiaohua1020/article/details/17934487