ffmpeg开发指南(二) -- 中文版

更新(2005年4月26号):有个读者提出:在 Kanotix (一个 Debian 的发行版)上面编译本例程,或者直接在 Debian 上面编译,头文件中avcodec.h 和avformat.h 需要加上前缀“ffmpeg”,就像这样:

#include <ffmpeg/avcodec.h>
#include <ffmpeg/avformat.h>

同样的, libdts 库在编译程序时也要像下面这样加入进来:

g++ -o avcodec_sample.0.4.9 avcodec_sample.0.4.9.cpp \
     -lavformat -lavcodec -ldts -lz

几个月前,我写了一篇有关使用ffmpeg下libavformat 和 libavcodec库的文章。从那以来,我收到过一些评论,并且新的ffmpeg预发行版(0.4.9-pre1) 最近也要出来了,增加了对在视频文件中定位的支持,新的文件格式,和简单的读取视频帧的接口。这些改变不久就会应用到CVS中,不过这次是我第一次在发行版中看到它们。(顺便感谢 Silviu Minut 共享长时间学习CVS版的ffmpeg的成果--他的有关ffmpeg的信息和demo程序在这里。)

在这篇文章里,我仅仅会描述一下以前的版本(0.4.8)和最新版本之间的区别,所以,如果你是采用新的 libavformat / libavcodec ,我建议你读前面的文章。

首先,说说有关编译新发行版吧。用我的编译器( SuSE 上的 gcc 3.3.1 ),在编译源文件 ffv1.c 时会报一个编译器内部的错误。我怀疑这是个精简版的gcc--我在编译 OpenCV 时也遇到了同样的事情--但是不论如何,一个快速的解决方法就是在编译此文件时不要加优化参数。最简单的方法就是作一个make,当编译时遇到编译器错误,进入 libavcodec 子目录(因为这也是 ffv1.c 所在之处),在你的终端中使用gcc命令去编译ffv1.c,粘贴,编辑删除编译器开关(译者注:就是参数)"-O3",然后使用那个命令运行gcc。然后,你可以变回ffmpeg主目录并且重新运行make,这次应该可以编译了。

都有哪些更新?
有那些更新呢?从一个程序员的角度来看,最大的变化就是尽可能的简化了从视频文件中读取个人的视频帧的操作。在ffmpeg 0.4.8 和其早期版本中,在从一个视频文件中的包中用例程av_read_packet()来读取数据时,一个视频帧的信息通常可以包含在几个包里,而另情况更为复杂的是,实际上两帧之间的边界还可以存在于两个包之间。幸亏ffmpeg 0.4.9 引入了新的叫做av_read_frame()的例程,它可以从一个简单的包里返回一个视频帧包含的所有数据。使用av_read_packet()读取视频数据的老办法仍然支持,但是不赞成使用--我说:摆脱它是可喜的。

这里让我们来看看如何使用新的API来读取视频数据。在我原来的文章中(与 0.4.8 API相关),主要的解码循环就像下面这样:

while(GetNextFrame(pFormatCtx, pCodecCtx, videoStream, pFrame))
{
     img_convert((AVPicture *)pFrameRGB, PIX_FMT_RGB24, (AVPicture*)pFrame,
         pCodecCtx->pix_fmt, pCodecCtx->width, pCodecCtx->height);

     // 处理视频帧(存盘等等)
     DoSomethingWithTheImage(pFrameRGB);
}

GetNextFrame() 是个有帮助的例程,它可以处理这样一个过程,这个过程汇编一个完整的视频帧所需要的所有的包。新的API简化了我们在主循环中实际直接读取和解码数据的操作:

while(av_read_frame(pFormatCtx, &packet)>=0)
{
     // 这是视频流中的一个包吗?
     if(packet.stream_index==videoStream)
     {
         // 解码视频流
         avcodec_decode_video(pCodecCtx, pFrame, &frameFinished,
             packet.data, packet.size);

         // 我们得到一帧了吗?
         if(frameFinished)
         {
             // 把原始图像转换成 RGB
             img_convert((AVPicture *)pFrameRGB, PIX_FMT_RGB24,
                 (AVPicture*)pFrame, pCodecCtx->pix_fmt, pCodecCtx->width,
                 pCodecCtx->height);

             // 处理视频帧(存盘等等)
             DoSomethingWithTheImage(pFrameRGB);
         }
     }

     // 释放用av_read_frame分配空间的包
     av_free_packet(&packet);
}

看第一眼,似乎看上去变得更为复杂了。但那仅仅是因为这块代码做的都是要隐藏在GetNextFrame()例程中实现的(检查包是否属于视频流,解码帧并释放包)。总的说来,因为我们能够完全排除 GetNextFrame (),事情变得更简单了。
我已经更新了demo程序使用最新的API。简单比较一下行数(老版本222行 Vs新版本169行)显示出新的API大大的简化了这件事情。

0.4.9的另一个重要的更新是能够在视频文件中定位一个时间戳。它通过函数av_seek_frame() 来实现,此函数有三个参数:一个指向 AVFormatContext 的指针,一个流索引和定位时间戳。此函数在给定时间戳以前会去定位第一个关键帧。所有这些都来自于文档。我并没有对av_seek_frame()进行测试,所以这里我并不能够给出任何示例代码。如果你成功的使用av_seek_frame() ,我很高兴听到这个消息。

捕获视频(Video4Linux and IEEE1394)
Toru Tamaki 发给我了一些使用 libavformat / libavcodec 库从 Video4Linux 或者 IEEE1394 视频设备源中抓捕视频帧的样例代码。对 Video4Linux,调用av_open_input_file() 函数应该修改如下:
AVFormatParameters formatParams;
AVInputFormat *iformat;

formatParams.device = "/dev/video0";
formatParams.channel = 0;
formatParams.standard = "ntsc";
formatParams.width = 640;
formatParams.height = 480;
formatParams.frame_rate = 29;
formatParams.frame_rate_base = 1;
filename = "";
iformat = av_find_input_format("video4linux");

av_open_input_file(&ffmpegFormatContext,
                  filename, iformat, 0, &formatParams);

For IEEE1394, call av_open_input_file() like this:

AVFormatParameters formatParams;
AVInputFormat *iformat;

formatParams.device = "/dev/dv1394";
filename = "";
iformat = av_find_input_format("dv1394");

av_open_input_file(&ffmpegFormatContext,
                  filename, iformat, 0, &formatParams);

继续。。。
如果我碰巧遇到了一些有关 libavformat / libavcodec 的有趣的信息,我计划在这里公布。所以,如果你有任何的评论,请通过这篇文章顶部给出的地址联系我。
标准弃权:我没有责任去纠正这些代码的功能和这篇文章中涉及的技术。

 

你可能感兴趣的:(ffmpeg开发指南(二) -- 中文版)