mp4文件格式解析

注:概念

  • box:由唯一类型标识符和长度定义的面向对象的构件
  • container box:用来容纳一组相关box的box,container box通常都不是fullbox
  • chunk:同一轨道的一组连续的采样
  • hint track:不包含媒体数据,但包含了将一个或多个轨打包到流频道的指示
  • media data box:用来容纳实体数据的box
  • movie box:子box定义了元数据(metadata)的容器box
  • sample:与单个时间戳相关联的所有数据,video sample即为一帧视频,或一组连续视频帧,audio sample即为一段连续的压缩音频
  • sample description:定义和描述轨中的采样的格式的结构
  • sample table:指明sampe时序和物理布局的表
  • track:按时间排序的相关的采样,对于媒体数据来说,track表示一个视频或音频序列

1、概述

  MP4文件中的所有数据都装在box(QuickTime中为atom)中,也就是说MP4文件由若干个box组成,每个box有类型和长度,可以将box理解为一个数据对象块。box中可以包含另一个box,这种box称为container box。一个MP4文件首先会有且只有一个“ftyp”类型的box,作为MP4格式的标志并包含关于文件的一些信息;之后会有且只有一个“moov”类型的box(Movie Box),它是一种container box,子box包含了媒体的metadata信息;MP4文件的媒体数据包含在“mdat”类型的box(Midia Data Box)中,该类型的box也是container box,可以有多个,也可以没有(当媒体数据全部引用其他文件时),媒体数据的结构由metadata进行描述。


来自网络

2、Box

  box中的字节序为网络字节序,也就是大端字节序(Big-Endian),简单的说,就是一个32位的4字节整数存储方式为高位字节在内存的低端。Box由header和body组成,其中header统一指明box的大小和类型,body根据类型有不同的意义和格式。

  标准的box开头的4个字节(32位)为box size,该大小包括box header和box body整个box的大小,这样我们就可以在文件中定位各个box。如果size为1,则表示这个box的大小为large size,真正的size值要在largesize域上得到。(实际上只有“mdat”类型的box才有可能用到large size。)如果size为0,表示该box为文件的最后一个box,文件结尾即为该box结尾。(同样只存在于“mdat”类型的box中。)

  size后面紧跟的32位为box type,一般是4个字符,如“ftyp”、“moov”等,这些box type都是已经预定义好的,分别表示固定的意义。如果是“uuid”,表示该box为用户扩展类型。如果box type是未定义的,应该将其忽略。

3、ftyp:file type box

表明文件类型,该box只有一个并且只能被包含在文件层,不能被其他box包含。同时,他应该出现在文件的最开始的位置,指示该MP4文件应用的相关信息。ftyp box包含一个32位的major brand(4个字符),一个32位的minor version(整数)和一个以32位为单位的compatible brands数组。

file type box

注:box的类型为ftyp box大小为24个字节,其中major_brand和minor_version都是isom。

  • major_brand: 是一个标识符
  • minor_version: 是一个major brand 的次版本标识
  • compatible_brands:是一个list,一直到box的结尾

4、Movie Box(moov)

该box包含了文件媒体的metadata信息,“moov”是一个container box,具体内容信息由子box诠释。同File Type Box一样,该box有且只有一个,且只被包含在文件层。一般情况下,“moov”会紧随“ftyp”出现。“moov”中会包含1个“mvhd”和若干个“trak”。其中“mvhd”为header box,一般作为“moov”的第一个子box出现(对于其他container box来说,header box都应作为首个子box出现)。“trak”包含了一个track的相关信息,是一个container box。

你可能感兴趣的:(mp4文件格式解析)