简介
前面讲到了在Android平台下使用FFmpeg进行RTMP推流(视频文件推流),里面主要是介绍如何解析视频文件并进行推流,今天要给大家介绍如何在Android平台下获取采集的图像,并进行编码推流。同时项目工程也是在之前的代码基础上新增功能。源码仓库地址FFmpegSample,这一节对应的代码版本是v1.2。大家注意不要下载错了版本。主要涉及的代码。
建议:这套代码和讲解中,有些地方我也还没研究透彻,但这个不影响我们要实现的功能,我之前也特别纠结一些细节,花了很多的时间。其实学习一门技术和框架是一个慢慢深入的过程,刚开始我们先跑起来,再深入,否则如果你还没入门,就开始纠结一些细节参数,然后又发现网上很难找到答案,那你的自信心就会受到打击,这也是我自己的体验,和大家分享一下。等到我们越来越熟悉FFmpeg和一些技术,那么之前的问题都会迎刃而解
这套代码我在4.4.2上运行时没问题的。所以如果有同学在5.0以上,如果涉及动态权限问题,大家加上即可。学习本章之前最好先看之前的文章,这里是一套连贯的教程
- RTMP服务器搭建(crtmpserver和nginx)
- 音视频编码相关名词详解
- 基于FFmpeg进行RTMP推流(一)
- 基于FFmpeg进行RTMP推流(二)
- Linux下FFmpeg编译以及Android平台下使用
- Android平台下使用FFmpeg进行RTMP推流(视频文件推流)
打开摄像头并设置参数
具体代码查看CameraActivity.java
private Camera getCamera() {
Camera camera;
try {
//打开相机,默认为后置,可以根据摄像头ID来指定打开前置还是后置
camera = Camera.open(1);
if (camera != null && !isPreview) {
try {
Camera.Parameters parameters = camera.getParameters();
//对拍照参数进行设置
for (Camera.Size size : parameters.getSupportedPictureSizes()) {
LogUtils.d(size.width + " " + size.height);
}
LogUtils.d("============");
for (Camera.Size size : parameters.getSupportedPreviewSizes()) {
LogUtils.d(size.width + " " + size.height);
}
parameters.setPreviewSize(screenWidth, screenHeight); // 设置预览照片的大小
parameters.setPreviewFpsRange(30000, 30000);
parameters.setPictureFormat(ImageFormat.NV21); // 设置图片格式
parameters.setPictureSize(screenWidth, screenHeight); // 设置照片的大小
camera.setParameters(parameters);
//指定使用哪个SurfaceView来显示预览图片
camera.setPreviewDisplay(sv.getHolder()); // 通过SurfaceView显示取景画面
camera.setPreviewCallback(new StreamIt()); // 设置回调的类
camera.startPreview(); // 开始预览
//Camera.takePicture()方法进行拍照
camera.autoFocus(null); // 自动对焦
} catch (Exception e) {
e.printStackTrace();
}
isPreview = true;
}
} catch (Exception e) {
camera = null;
e.printStackTrace();
Toast.makeText(this, "无法获取前置摄像头", Toast.LENGTH_LONG);
}
return camera;
}
Camera.open(int cameraId)
这里是创建一个Camera对象对应具体的硬件摄像头,如果摄像头已经被其他app打开,就会抛出RuntimeException异常。
cameraId是camera的Id。我们可以通过getNumberOfCameras()
获取摄像头的数量,那id的范围就是0~(getNumberOfCameras()-1)。一般情况下传0就直接获取到后置摄像头,1就获取到前置摄像头。当然有些设备可能有些不同。
Camera.Parameters
这个类用于存储和设置摄像头的参数信息,当然Camera有很多默认参数,所以我们只需要通过camera.getParameters()
获取该对象,然后并设置我们需要修改的属性即可。我们看一些常见的属性设置
-
setPreviewSize
设置预览图像的大小
-
setPictureSize
设置照片的大小
-
setPreviewFpsRange
设置Fps,帧率。但我发现并没有什么卵用。每次修改后采集的频率还是没变,擦!
-
setPictureFormat
设置采集到图像的像素格式,Android推荐NV21。那我们就用这个,这个参数很重要,后面编码我们会详细讲解。
最后不要忘了调用setParameters
进行设置。否则你就白忙活了。
预览和获取采集图像数据
预览
第一个问题,用什么来承载预览图像。Android提供了SurfaceView和GLSurfaceView。这里为了方便大家上手,我们先选择使用SurfaceView稍微简单一点,对SurfaceView大家不熟的可以查找相关资料。接下来就是使用SurfaceView
-
布局中添加SurfaceView。这里我做了一个继承类
MySurfaceView
-
获取SurfaceHolder并设置回调
SurfaceView里有一个SurfaceHolder用来控制SurfaceView的相关操作。比如设置SurfaceView的Callback,用来监听SurfaceView的创建,变化和销毁。这里只需要实现
SurfaceHolder.Callback
的接口@Override public void surfaceCreated(SurfaceHolder holder) { setStartPreview(mCamera, mHolder); } @Override public void surfaceChanged(SurfaceHolder holder, int format, int width, int height) { setStartPreview(mCamera, mHolder); } @Override public void surfaceDestroyed(SurfaceHolder holder) { releaseCamera(); }
然后设置到SurfaceHolder中
mHolder.addCallback(this)
-
SurfaceView与Camera关联
因为我们要讲图像预览到SurfaceView上,那么必定有地方存在关联。这里很简单,就是调用Camera的
setPreviewDisplay
,将SurfaceView的SurfaceHolder设置进去即可。 -
开始预览
直接调用camera的
startPreview
开始进行预览。那么什么时候调用这个方法呢?- 设置一个按钮,点击之后我们就调用这个方法进行预览
- SurfaceView的创建回调方法中
surfaceCreated
中进行调用,因为图像要预览到SurfaceView中,所以必须得SurfaceView已成功创建。
获取采集数据
前面我们已经知道怎么预览图像了。接下来就是获取采集数据。这个也很容易就是调用Camera的setPreviewCallback
设置预览回调。我们实现一下这个接口
public class StreamIt implements Camera.PreviewCallback {
@Override
public void onPreviewFrame(final byte[] data, Camera camera) {
long endTime = System.currentTimeMillis();
executor.execute(new Runnable() {
@Override
public void run() {
encodeTime = System.currentTimeMillis();
FFmpegHandle.getInstance().onFrameCallback(data);
LogUtils.w("编码第:" + (encodeCount++) + "帧,耗时:" + (System.currentTimeMillis() - encodeTime));
}
});
LogUtils.d("采集第:" + (++count) + "帧,距上一帧间隔时间:"
+ (endTime - previewTime) + " " + Thread.currentThread().getName());
previewTime = endTime;
}
}
很简单,这个接口就是讲原始数据进行回调。这里大家也看到了,我把采集的时间间隔和编码消耗的时间打印出来了。
编码
前面把基础的如何采集摄像头数据讲了一下,接下来就是进行视频数据编码。
开启线程编码
因为编码毕竟会比较耗时,所以我们需要放到线程中处理,这里我用了一个单线程池,避免每次开启和销毁线程产生的开销。为了保证图片按顺序编码,这里使用单线程池。
ExecutorService executor = Executors.newSingleThreadExecutor();
获取到采集的数据后就可以丢进去进行编码
executor.execute(new Runnable() {
@Override
public void run() {
encodeTime = System.currentTimeMillis();
FFmpegHandle.getInstance().onFrameCallback(data);
LogUtils.w("编码第:" + (encodeCount++) + "帧,耗时:" + (System.currentTimeMillis() - encodeTime));
}
});
这里大家也看出来了调用FFmpegHandle.getInstance().onFrameCallback(data);
进行编码。
初始化编码相关操作
这里我们使用的是FFmpeg,所以在编码前我们会先做一些初始化以及参数设置工作,所以我们在FFmpegHandle中增加一个native方法public native int initVideo(String url);
对应到C++层,也就是ffmpeg_handle.cpp
AVFormatContext *ofmt_ctx;
AVStream *video_st;
AVCodecContext *pCodecCtx;
AVCodec *pCodec;
AVPacket enc_pkt;
AVFrame *pFrameYUV;
int count = 0;
int yuv_width;
int yuv_height;
int y_length;
int uv_length;
int width = 480;
int height = 320;
int fps = 15;
/**
* 初始化
*/
extern "C"
JNIEXPORT jint JNICALL
Java_com_wangheart_rtmpfile_ffmpeg_FFmpegHandle_initVideo(JNIEnv *env, jobject instance,
jstring url_) {
const char *out_path = env->GetStringUTFChars(url_, 0);
logd(out_path);
//计算yuv数据的长度
yuv_width = width;
yuv_height = height;
y_length = width * height;
uv_length = width * height / 4;
av_register_all();
//output initialize
avformat_alloc_output_context2(&ofmt_ctx, NULL, "flv", out_path);
//output encoder initialize
pCodec = avcodec_find_encoder(AV_CODEC_ID_H264);
if (!pCodec) {
loge("Can not find encoder!\n");
return -1;
}
pCodecCtx = avcodec_alloc_context3(pCodec);
//编码器的ID号,这里为264编码器,可以根据video_st里的codecID 参数赋值
pCodecCtx->codec_id = pCodec->id;
//像素的格式,也就是说采用什么样的色彩空间来表明一个像素点
pCodecCtx->pix_fmt = AV_PIX_FMT_YUV420P;
//编码器编码的数据类型
pCodecCtx->codec_type = AVMEDIA_TYPE_VIDEO;
//编码目标的视频帧大小,以像素为单位
pCodecCtx->width = width;
pCodecCtx->height = height;
pCodecCtx->framerate = (AVRational) {fps, 1};
//帧率的基本单位,我们用分数来表示,
pCodecCtx->time_base = (AVRational) {1, fps};
//目标的码率,即采样的码率;显然,采样码率越大,视频大小越大
pCodecCtx->bit_rate = 400000;
//固定允许的码率误差,数值越大,视频越小
// pCodecCtx->bit_rate_tolerance = 4000000;
pCodecCtx->gop_size = 50;
/* Some formats want stream headers to be separate. */
if (ofmt_ctx->oformat->flags & AVFMT_GLOBALHEADER)
pCodecCtx->flags |= CODEC_FLAG_GLOBAL_HEADER;
//H264 codec param
// pCodecCtx->me_range = 16;
//pCodecCtx->max_qdiff = 4;
pCodecCtx->qcompress = 0.6;
//最大和最小量化系数
pCodecCtx->qmin = 10;
pCodecCtx->qmax = 51;
//Optional Param
//两个非B帧之间允许出现多少个B帧数
//设置0表示不使用B帧
//b 帧越多,图片越小
pCodecCtx->max_b_frames = 0;
// Set H264 preset and tune
AVDictionary *param = 0;
//H.264
if (pCodecCtx->codec_id == AV_CODEC_ID_H264) {
// av_dict_set(¶m, "preset", "slow", 0);
/**
* 这个非常重要,如果不设置延时非常的大
* ultrafast,superfast, veryfast, faster, fast, medium
* slow, slower, veryslow, placebo. 这是x264编码速度的选项
*/
av_dict_set(¶m, "preset", "superfast", 0);
av_dict_set(¶m, "tune", "zerolatency", 0);
}
if (avcodec_open2(pCodecCtx, pCodec, ¶m) < 0) {
loge("Failed to open encoder!\n");
return -1;
}
//Add a new stream to output,should be called by the user before avformat_write_header() for muxing
video_st = avformat_new_stream(ofmt_ctx, pCodec);
if (video_st == NULL) {
return -1;
}
video_st->time_base.num = 1;
video_st->time_base.den = fps;
// video_st->codec = pCodecCtx;
video_st->codecpar->codec_tag = 0;
avcodec_parameters_from_context(video_st->codecpar, pCodecCtx);
//Open output URL,set before avformat_write_header() for muxing
if (avio_open(&ofmt_ctx->pb, out_path, AVIO_FLAG_READ_WRITE) < 0) {
loge("Failed to open output file!\n");
return -1;
}
//Write File Header
avformat_write_header(ofmt_ctx, NULL);
return 0;
}
首先需要声明一些全局的变量,方便后面编码使用AVFormatContext、AVStream等。
-
进行FFmpeg初始化
这个和之前讲到的一样av_register_all()
-
创建输出格式上下文
avformat_alloc_output_context2
这些之前都讲到过,就不错累述 -
获取编码器
pCodec = avcodec_find_encoder(AV_CODEC_ID_H264)
获取编码器。这里我们使用H264进行视频编码。如果编码器获取失败就没有下文了 -
创建编码器上下文
pCodecCtx = avcodec_alloc_context3(pCodec)
-
设置编码器参数
这些参数我个参数的设置上都有加注释,大家查看即可。同时参考音视频编码相关名词详解。这讲几个主要的参数
- pix_fmt 像素的格式这里我们使用的AV_PIX_FMT_YUV420P,也就是YUV平面格式,三个平面分别存放Y、U、V数据。
- codec_type 编码器编码的数据类型
- framerate 帧率
- time_base 帧率的基本单位
- gop_size GOP的大小
-
AVDictionary设置
-
前面讲了一些常规参数的设置,这里还有一些重要参数设置
if (pCodecCtx->codec_id == AV_CODEC_ID_H264) { // av_dict_set(¶m, "preset", "slow", 0); /** * 这个非常重要,如果不设置延时非常的大 * ultrafast,superfast, veryfast, faster, fast, medium * slow, slower, veryslow, placebo. 这是x264编码速度的选项 */ av_dict_set(¶m, "preset", "superfast", 0); av_dict_set(¶m, "tune", "zerolatency", 0); }
一定要注意
preset
这个参数的设置。否则你会发现你编码的延迟特别大,网上有许多朋友遇到这个问题。
-
-
使用给定的编码器和参数初始化编码上下文
avcodec_open2(pCodecCtx, pCodec, ¶m)
-
创建视频流
video_st = avformat_new_stream(ofmt_ctx, pCodec)
这个就和之前的推文件流一样了。创建并设置相关的参数 -
打开输出上下文
avio_open(&ofmt_ctx->pb, out_path, AVIO_FLAG_READ_WRITE)
-
写入输出头信息
avformat_write_header(ofmt_ctx, NULL)
开始编码
在获取到采集的时候后我们通过线程池调用执行了FFmpegHandle.getInstance().onFrameCallback(mData);
接下来我们重点看到onFrameCallback方法。当然这也是一个navive方法。我们看到c++层的实现。
Java_com_wangheart_rtmpfile_ffmpeg_FFmpegHandle_onFrameCallback(JNIEnv *env, jobject instance,
jbyteArray buffer_) {
// startTime = av_gettime();
jbyte *in = env->GetByteArrayElements(buffer_, NULL);
int ret = 0;
pFrameYUV = av_frame_alloc();
int picture_size = av_image_get_buffer_size(pCodecCtx->pix_fmt, pCodecCtx->width,
pCodecCtx->height, 1);
uint8_t *buffers = (uint8_t *) av_malloc(picture_size);
//将buffers的地址赋给AVFrame中的图像数据,根据像素格式判断有几个数据指针
av_image_fill_arrays(pFrameYUV->data, pFrameYUV->linesize, buffers, pCodecCtx->pix_fmt,
pCodecCtx->width, pCodecCtx->height, 1);
//安卓摄像头数据为NV21格式,此处将其转换为YUV420P格式
////N21 0~width * height是Y分量, width*height~ width*height*3/2是VU交替存储
//复制Y分量的数据
memcpy(pFrameYUV->data[0], in, y_length); //Y
pFrameYUV->pts = count;
for (int i = 0; i < uv_length; i++) {
//将v数据存到第三个平面
*(pFrameYUV->data[2] + i) = *(in + y_length + i * 2);
//将U数据存到第二个平面
*(pFrameYUV->data[1] + i) = *(in + y_length + i * 2 + 1);
}
pFrameYUV->format = AV_PIX_FMT_YUV420P;
pFrameYUV->width = yuv_width;
pFrameYUV->height = yuv_height;
//例如对于H.264来说。1个AVPacket的data通常对应一个NAL
//初始化AVPacket
av_init_packet(&enc_pkt);
// __android_log_print(ANDROID_LOG_WARN, "eric", "编码前时间:%lld",
// (long long) ((av_gettime() - startTime) / 1000));
//开始编码YUV数据
ret = avcodec_send_frame(pCodecCtx, pFrameYUV);
if (ret != 0) {
logw("avcodec_send_frame error");
return -1;
}
//获取编码后的数据
ret = avcodec_receive_packet(pCodecCtx, &enc_pkt);
// __android_log_print(ANDROID_LOG_WARN, "eric", "编码时间:%lld",
// (long long) ((av_gettime() - startTime) / 1000));
//是否编码前的YUV数据
av_frame_free(&pFrameYUV);
if (ret != 0 || enc_pkt.size <= 0) {
loge("avcodec_receive_packet error");
avError(ret);
return -2;
}
enc_pkt.stream_index = video_st->index;
AVRational time_base = ofmt_ctx->streams[0]->time_base;//{ 1, 1000 };
enc_pkt.pts = count * (video_st->time_base.den) / ((video_st->time_base.num) * fps);
enc_pkt.dts = enc_pkt.pts;
enc_pkt.duration = (video_st->time_base.den) / ((video_st->time_base.num) * fps);
__android_log_print(ANDROID_LOG_WARN, "eric",
"index:%d,pts:%lld,dts:%lld,duration:%lld,time_base:%d,%d",
count,
(long long) enc_pkt.pts,
(long long) enc_pkt.dts,
(long long) enc_pkt.duration,
time_base.num, time_base.den);
enc_pkt.pos = -1;
// AVRational time_base_q = {1, AV_TIME_BASE};
// //计算视频播放时间
// int64_t pts_time = av_rescale_q(enc_pkt.dts, time_base, time_base_q);
// //计算实际视频的播放时间
// if (count == 0) {
// startTime = av_gettime();
// }
// int64_t now_time = av_gettime() - startTime;
// __android_log_print(ANDROID_LOG_WARN, "eric", "delt time :%lld", (pts_time - now_time));
// if (pts_time > now_time) {
// //睡眠一段时间(目的是让当前视频记录的播放时间与实际时间同步)
// av_usleep((unsigned int) (pts_time - now_time));
// }
ret = av_interleaved_write_frame(ofmt_ctx, &enc_pkt);
if (ret != 0) {
loge("av_interleaved_write_frame failed");
}
count++;
env->ReleaseByteArrayElements(buffer_, in, 0);
return 0;
}
像素格式转换
在设置摄像头采集的图像格式时候我们设置的是NV21。而我们编码需要的是AV_PIX_FMT_YUV420P。所以这需要进行转换。我们先看下两个像素格式的区别
-
NV21
是一个YUV 4:2:0数据,应该说是平面和打包混合存储。有两个平面,第一个平面存放Y数据第二个平面VU数据交替存储
-
AV_PIX_FMT_YUV420P
那不用说是我们熟悉的YUV 4:2:0的像素数据,它是纯平面存储。总共三个平面,分别存放,Y、U、V数据。
我们还需要了解,以为采集的数据YUV是4:2:0。所以Y:(U或V)的大小是4:1。而U:V是1:1。所以当图像宽是width,高是height时,Y分量的大小就是width×heitht,而U是width×heitht/4,V也是U是width×heitht/4。
知道上面的存储格式后我们就知道怎么转换了。
首先复制Y分量的数据
memcpy(pFrameYUV->data[0], in, y_length);
然后遍历VU数据并存放到data[1]和data[2]平面中
for (int i = 0; i < uv_length; i++) {
//将v数据存到第三个平面
*(pFrameYUV->data[2] + i) = *(in + y_length + i * 2);
//将U数据存到第二个平面
*(pFrameYUV->data[1] + i) = *(in + y_length + i * 2 + 1);
}
H264编码
首先我们需要了解两个数据结构AVFrame、AVPacket
AVFrame存放的是原始数据、AVPacket存放的是编码后的数据。所以前面格式转换也是将数据存放到pFrameYUV中。
-
初始化AVPacket
av_init_packet(&enc_pkt);
-
开始编码
ret = avcodec_send_frame(pCodecCtx, pFrameYUV);
-
接受编码后的数据
ret = avcodec_receive_packet(pCodecCtx, &enc_pkt);
是不是很简单,这样编码后的数据就存到了enc_pkt中。到这里只是完成的编码工作,接下来还有一些参数需要设置
PTS、DTS、duration
PTS是显示时间戳,DTS解码时间戳,duration是当当前帧和下一帧的时间间隔,。这个很重要,不然播放会出现问题。
首先我们要知道时间基数,也就是你按什么时间单位算。
AVRational time_base = ofmt_ctx->streams[0]->time_base;
这里的值是{1,1000},这应该就是毫秒。知道时间基础,同时根据fps我们就知道每一帧的时间间隔是1000/fps。
那第n帧的pts就是n×(1000/fps)。对应代码
enc_pkt.pts = count * (video_st->time_base.den) / ((video_st->time_base.num) * fps);
dts和pts设置成一样,标示解码时间和显示时间一致。至于为什么,其实我也没太明白,如果不一致该怎么计算?我们先不管,以后再研究。
duration那就容易了,就是(video_st->time_base.den) / ((video_st->time_base.num) * fps)
这里的三个参数这是可能不太准确,但我们先这样,想把功能跑起来再说,不然我们纠结这些就永无止境了。后面等我们深入了,也就会明白。
输出视频数据
ret = av_interleaved_write_frame(ofmt_ctx, &enc_pkt);
释放资源
在结束编码推流后我们也需要释放相关的资源
if (video_st)
avcodec_close(video_st->codec);
if (ofmt_ctx) {
avio_close(ofmt_ctx->pb);
avformat_free_context(ofmt_ctx);
ofmt_ctx = NULL;
}
return 0;