AVI是音频视频交错(Audio Video Interleaved)的英文缩写,它是Microsoft公司开发的一种符合RIFF文件规范的数字音频与视频文件格式,原先用于Microsoft Video Windows(简称VFW)环境,现在已被Windows95/98,OS/2等多数操作系统直接支持。AVI格式允许视频和音频交错在一起同步播放,支持256色和RLE压缩,但AVI文件并未限定压缩标准,因此,AVI文件格式只是作为控制界面上的标准,不具有兼容性,用不同压缩算法生成的AVI文件,必须使用相应的解压缩算法才能播放出来,常用的AVI播放驱动程序,主要是Microsoft Video for Windows或Windows98/98中的Video1,以及Intel公司的Indeo Video.
在介绍AVI文件前,我们要先来看看RIFF文件结构。AVI文件采用的是RIFF文件结构方式,RIFF(Resource Interchange File Format,资源互换文件格式)是微软公司定义的一种用户管理Windows环境中多媒体数据的文件格式,波形音频wave,MIDI和数字视频AVI都采用这种格式存储。RIFF文件的实际数据中,使用了列表(List)和块(Chunk)的形式来组织。列表可以嵌套列表和块。整个RIFF文件可以看成一个数据库,其数据块ID为RIFF ,称为RIFF块。一个RIFF文件中只允许存在一个RIFF块。RIFF块中包含一系列的子块,其中有一种子块的ID为“List”,称为LIST块,LIST块中可以再包含一系列的子块,但除了LIST块外的其他所有的子块都不能再包含子块。
RIFF和LIST块分别比普通的数据块多了一个被称为形式类型(Form Type)或者列表类型(List Type)的数据域。
Chunk块大小=实际的块数据长度,而不包括ckID域和ckSize域本身的大小
00000000-00000003、多媒体文件识别码:RIFF
00000004-00000007、文件大小(10EDICH字节)——8字节
00000008-0000000B、AVI文件识别码
0000000C-0000000F、第一个LIST块识别码
00000010-00000013、第一个LIST块的大小(168H字节)
00000014-00000017、hdrl部分识别码,代表后面的数据记录着此文件的格式
00000018-0000001B、hdrl部分所包含的avih块识别码,此模块记录着本文件的初始化信息
0000001C-0000001F、avi块大小(38H字节)
00000020-00000023、每帧画面显示所维持多少个百万分之一秒,本例为1046h,即6667百万分之一秒约0.07秒。所以在播放此文件时,你看到的画面约每秒15帧
AVI文件时目前使用的最复杂的RIFF文件,他能同时存储同步表现的音频视频数据。AVI的RIFF块的形式类型是AVI,它包含3个子块,如下所述。
一. 信息块:ID为“hdrl”的LIST块,定义AVI文件的数据格式
“hdrl”LIST块包含两个子块,一个是ID为“avih”的子块和一个是ID为”strl”的LIST块。
“avih”块结构:用于记录AVI文件的全局信息,比如流的数量,视频图像的宽和高等:
typedef struct
{
DWORD ChunID; // 必须为'avih'
DWORD ChunkSize; //本数据结构的大小,不包括最初的8個位元組(ID和Size兩個域)
DWORD dwMicroSecPerFrame ; //显示每帧所需的时间ns,定义avi的显示速率
DWORD dwMaxBytesPerSec; //最大的数据传输率
DWORD dwPaddingGranularity; //记录块的长度需为此值的倍数,通常是2048
DWORD dwFlages; //AVI文件的特殊属性,如是否包含索引块,音视频数据是否交叉存储
DWORD dwTotalFrame; //文件中的总帧数
DWORD dwInitialFrames; //说明在开始播放前需要多少桢
DWORD dwStreams; //文件中包含的数据流个数
DWORD dwSuggestedBufferSize; //建议使用的缓冲区的大小,
//通常为存储一桢图像以及同步声音所需要的数据之和
DWORD dwWidth; //图像宽
DWORD dwHeight; //图像高
DWORD dwReserved[4]; //保留值
}MainAVIHeader;
接着就是”avih”块的数据部分:一个或多个“strl”子列表
1. 文件中有多少个流,这里就对应有多少个“strl”子列表)。
2. 每个“strl”字列表至少包含一个“strh”块和一个“strf”块,
3. “strd”块(保存编解码器需要的一些配置信息)和“strn”块(保存流的名字)是可选的。
4. 注意:“strl”子列表出现的顺序与媒体流的编号是对应的,比如第一个“strl”字列表说明的是第一个流(Stream 0),第二个“strl”字列表说明的是第二个流(Stream 1),以此类推
“strh”块结构:用于说明这个“strl”LIST块对应的数据流的头信息:
typedef struct
{
FOURCC fccType; //4字节,表示数据流的种类,vids 表示视频数据流,auds 音频数据流
FOURCC fccHandler; //4字节 ,表示数据流解压缩的驱动程序代号
DWORD dwFlags; //数据流属性
WORD wPriority; //此数据流的播放优先级
WORD wLanguage; //音频的语言代号
DWORD dwInitalFrames; //说明在开始播放前需要多少桢
DWORD dwScale; //数据量,视频每桢的大小或者音频的采样大小
DWORD dwRate; //dwScale /dwRate = 每秒的采样数
DWORD dwStart; //数据流开始播放的位置,以dwScale为单位
DWORD dwLength; //数据流的数据量,以dwScale为单位
DWORD dwSuggestedBufferSize; //建议缓冲区的大小
DWORD dwQuality; //解压缩质量参数,值越大,质量越好
DWORD dwSampleSize; //音频的采样大小
RECT rcFrame; //视频图像所占的矩形
}AVIStreamHeader;
“strf” 块结构:“strf”子块紧跟在“strh”子块之后,其结构是“strh”子块的类型而定,如下所述:
typedef struct tagBITMAPINFO
{
BITMAPINFOHEADER bmiHeader;
RGBQUAD bmiColors[1]; //颜色表
}BITMAPINFO;
typedef struct tagBITMAPINFOHEADER
{
DWORD biSize;
LONG biWidth;
LONG biHeight;
WORD biPlanes;
WORD biBitCount;
DWORD biCompression;
DWORD biSizeImage;
LONG biXPelsPerMeter;
LONG biYPelsPerMeter;
DWORD biClrUsed;
DWORD biClrImportant;
}BITMAPINFOHEADER;
typedef struct
{
WORD wFormatTag;
WORD nChannels; //声道数
DWORD nSamplesPerSec; //采样率
DWORD nAvgBytesPerSec; //WAVE声音中每秒的数据量
WORD nBlockAlign; //数据块的对齐标志
WORD biSize; //此结构的大小
}WAVEFORMAT
“strd”块结构:“strd”子块紧跟在strf子块后,存储供压缩驱动程序使用的参数,不一定存在,也没有固定的结构
“strl”List块定义的AVI数据流依次将“hdrl”LIST块中的数据流头结构与“movi”LIST块中的数据联系在一起,第一个数据流头结构用于数据流0,第二个用于数据流1,依次类推。
二. 数据块:ID为“movi”的LIST块,包含AVI的音视频序列数据
用于保存真正的媒体流数据(视频图像帧数据或音频采样数据等)。保存方式为:
1. 将数据块直接嵌套在“movi”列表里面
2. 将几个数据块分组成一个“rec”列表后再编排进“movi”列表
(注意:在读取AVI文件内容时,建议将一个“rec”列表中的所有数据块一次性读出)
但是,当文件中包含有多个流的时候,数据块与数据块之间如何来区别呢?于是数据块使用了一个四字符吗来表征它的类型,这个四字符码由2个字节的类型吗和2个字节的流编号组成。
比如:
第一个流(Stream 0)是音频,则表征音频数据块的四字符码为“00wb”;
第二个流(Steam 1)是视频,则表征视频数据块的四字符码为“01db”或“01dc”。
对于视频数据来说,在AVI数据序列中间还可以定义一个新的调色板,每个改变的调色板数据块永“xxpc”来表征,新的调色板使用一个数据结构AVIPALCHANGE来定义。(注意:如果一个流的调色板中途改变,则应在这个流格式的描述中,也及时AVISTREMAHEADER结构的dwFlags中包含一个AVISF_VIDEO_PALCHANGES标记)另外,文字数据块可以使用随意的类型码表征。
三. 索引块:ID为“idxl”的子块,定义“movi”LIST块的索引数据,是可选块。
最后紧跟在“hdr”列表块和“movi”列表块之后的,就是AVI文件可选的索引块。这个索引块为AVI文件中每一个媒体数据块进行索引,并且记录它们在文件中的偏移(可能相对于“movi”列表,也可能相对于AVI文件开头)。索引块使用一个四字符码“idxl”来表征,索引信息使用一个数据结构AVIOLDINDEXl来定义。
typedef struct _avioldindex {
FOURCC fcc; // 必须为‘idx1’
DWORD cb; // 本数据结构的大小,不包括最初的8个字节(fcc和cb两个域)
struct _avioldindex_entry {
DWORD dwChunkId; // 表征本数据块的四字符码
DWORD dwFlags; // 说明本数据块是不是关键帧、是不是‘rec ’列表等信息
DWORD dwOffset; // 本数据块在文件中的偏移量
DWORD dwSize; // 本数据块的大小
} aIndex[]; // 这是一个数组!为每个媒体数据块都定义一个索引信息
} AVIOLDINDEX;
注意:如果一个AVI文件包含有索引块,则应在AVI信息头的描述中,也及时AVIMAINHEADER结构的dwFlags中包含一个AVI_HASINDEX标记
还有一种特殊的数据块,用一个四字符码“JUNK”来表征,它用于内部数据的对齐(填充),应用程序应该忽略这些数据块的实际意义。
一.使用AVI函数库的配置(VC6.0)
Project——>Settings——>Link——>object/library modules里加上 vfw32.lib Winmm.lib (注意空格),然后在使用的头文件里加上#include
AVIFileInit函数:初始化AVIFile函数库
AVIFileOpen函数:打开AVI文件
AVIFileGetStream函数:获得AVI文件中某数据流的信息
AVIStreamStart函数:获得起始帧数
AVIStreamLength函数:获得视频流长度
AVIStreamGetFrameOpen函数:在视频流中打开帧
AVIStreamGetFrame函数:解压当前帧
AVIStreamGetFrameClose函数:是否资源
AVIFileRelease函数:关闭AVI文件
AVIFileExit函数:关闭AVI函数库
三. 从AVI文件中读取DIB位图数据
(1)主要步骤:
1. 初始化AVI函数库,AVIFileInit()
2. 打开AVI文件,AVIFileOpen()
3. 获取视频流,AVIFileGetStream()
4. 从指定的视频流中解压视频帧,AVIStreamGetFrameOpen()
5. 获取流中指定帧的数据,AVIStreamGetFrame(pFrame,i),获取第i帧DIB图像
6. AVIStreamGetFrameClose(pFrame),释放资源
7. AVIFileExit(),退出AVI函数库
(2)关键
AVIStreamGetFrame函数每次返回一个DIB对象,即包括BITMAPINFO和位图数据的对象,由于是24位图位图,没有调色板,因而要得到真正的位图数据,可由以下代码得到:
lpDIB=(BYTE*)AVIStreamGetFrame(pFrame,i)+sizeof(BITMAPINFOHEADER);
StretchDIBits函数所要求的BITMAPINFO*对象,可由以下代码得到:
LPBITMAPINFOHEADER bih;
bih=(LPBITMAPINFOHEADER)AVIStreamGetFrame(pFrame,0);
BITMAPINFO* lpBitmapInfo=(BITMAPINFO*)bih;
(3)整体代码:
PAVIFILE pfile;
PAVISTREAM ppavi;
BYTE* lpDIB=NULL;
CDC* pSubDC=m_avi.GetDC();
HDC hSubDC=pSubDC->m_hDC;
AVIFILEINFO* pfinfo=new AVIFILEINFO;
LONG lSize=sizeof(AVIFILEINFO);
CString szFile=lpszPath;
//初始化AVI函数库
AVIFileInit();
//打开AVI文件
AVIFileOpen(&pfile,szFile,OF_READ,NULL);
//获取视频信息
AVIFileInfo(pfile,pfinfo,lSize);
//获得视频流
AVIFileGetStream(pfile,&ppavi,streamtypeVIDEO,0);
//从视频流中获取帧
PGETFRAME pFrame;
LONG StartFrame=AVIStreamStart(ppavi);
LONG FrameNum=AVIStreamLength(ppavi);
pFrame=AVIStreamGetFrameOpen(ppavi,NULL);
//获取BMP文件信息头
LPBITAMPINFOHEADER bih;
bih=(LPBITMAPINFOHEADER)AVIStreamGetFrame(pFrame,0);
LONG nHeight=bih->biHeight;
LONG nWidth=bih->biWidth;
int nBitCount=bih->biBitCount;
LONG LineBytes=(nWidth*nBitCount/8+3)/4*4;
//for循环读取位图数据
for(int i=StartFrame;isizeof(BITMAPINFOHEADER);
//将DIB显示到屏幕上
stretchDIBBits(hSubDC,0,0,nWidth,nHeight,0,0,nWidht,nHeight,lpDIB,(BITMAPINFO*)bih,DIB_RGB_COLORS,SRCCOPY);
Sleep(20);
}
delete pfinfo;
AVIStreamGetFrameClose(pFrame);
AVIFileExit();
(1)问题:现在我想直接获取指定帧的数据,比如第10帧,但是获取到的是一片黑色,好像是第1帧的图像。
如果我循环从0开始
for(int i=0; i<11; i++) …. 这样全部帧就出来了
答:原因么大概是压缩时隔一段时间指定一张关键帧,其它的帧就保存的与这张关键帧不同的地方,你要取的那帧如果不正好是关键帧,就无法解析成完整图像,需要与之前最近的那张关键帧组合在一起才行。你要是想取某一帧,首先需要对视频做解码操作。单独的对视频做抽帧操作拿到是某一帧的数据,这个数据需要和关键帧做相关的计算才能拿到完整的图像。
(2)AVIStreamGetFrameOpen(ps,NULL)返回NULL
答:http://www.glimix.com/archives/700
http://blog.csdn.net/sx5486510/article/details/17525859
(注意:博主问题也尚未解决)
参考:
http://www.cnblogs.com/GoodGoodWorkDayDayUp/archive/2011/03/31/2000700.html
https://wenku.baidu.com/view/e9f73c784b73f242336c5fdf.html