「音视频直播技术」Android下视频H264编码

今天为大家介绍一下音视频直播技术中的视频编码。

在移动端通过Camera采集到视频数据后,我们不会直接将它发送出去。
因为采集后的视频数据量非常大,比如 1280x720 分辨率的一帧数据,就有可能达到6M大小(码率越高,图像越清晰)。
这6M数据如果送到网上传输,会给网络带来非常大的负担。

另外,人眼对图像的识别是有限的。拿手机屏幕来说,1K屏与2K屏对于人眼来说是看不出来它们之间的区别的,视频也是同样的道理。
基于以上理论,就有了视频的压缩编码技术,通过对视频的有损压缩来达到减少数据大小的目的。

目前视频缩码最常用的是 H264,其它的还有 H265,VP8, VP9等,但用的人还比较少。


编码结构与方式

下图是视频编码的结构,结构很清楚。
「音视频直播技术」Android下视频H264编码_第1张图片在Android系统下视频编码有硬编和软编两种方式。
顾名思义,硬编是通过手机提供的硬件模块进行编码;软编就是通过软件程序进行编码。
硬编的好处是编码快,不占用CPU资源。缺点是Android机型比较多,坑也比较多。
软编正好与硬编相反,它的优点是无论什么机型都一样处理。缺点则是占用大量CPU资源。

我们今天介绍的是硬件编码。


一、如何获取Camera中采集到的数据

从Camera获取视频数据有两种方式,
一种是通过向Camera设置预览Callback来读取原始数据;另一种高效的方式是通过MediaCodec的Surface获取数据。

而第二种更高效,更灵活。今天我们介绍的就是第二种方式。当然大家可以很容易从网上找到第一种获取数据的方式。

从Camera获取数据的基本方法如下:

  1. 创建 EGL 环境(如果使用 GLSurfaceView则可省略该步骤)。
  2. 构建 OpenGL ES程序,通过它将原始数据渲染到Surface中。
  3. 生成纹理,并打开Camera预览。
  4. 创建编码器,将编码器中的Surface与EGL关联。
  5. Camera捕获数据后,调用 EGL的swapBuffer方法,就可以拿到数据了。

1. 首先,创建EGL环境。

EglCore是对 EGL 操作的封装。

    ......
    
    mEglCore = new EglCore(null, EglCore.FLAG_RECORDABLE);
    mDisplaySurface = new WindowSurface(mEglCore, holder.getSurface(), false);
    mDisplaySurface.makeCurrent();
    
    ......

2. 创建 OpenGL ES程序

Texture2dProgram是对 OpenGL ES程序的封装,以后我们会再做介绍。

   ......
    
    mFullFrameBlit = new FullFrameRect(
            new Texture2dProgram(Texture2dProgram.ProgramType.TEXTURE_EXT));
    ......
    

3. 根据 OpenGL ES产生的外部纹理生成纹理对象,并打开Camera预览。

	......
            
    mTextureId = mFullFrameBlit.createTextureObject();
    mCameraTexture = new SurfaceTexture(mTextureId);//生成纹理对象
    mCameraTexture.setOnFrameAvailableListener(this);
    
    Log.d(TAG, "starting camera preview");
    try {
        mCamera.setPreviewTexture(mCameraTexture);
    } catch (IOException ioe) {
        throw new RuntimeException(ioe);
    }
    mCamera.startPreview();
    
    ......
    

4. 构造H264编码器,将编码器的 Surface 与 EGL环境关联。

    ......
    
    try {
        //CircularEncoder是 H264编码器的wraper类,编码器的构造见下一节
        mCircEncoder = new CircularEncoder(VIDEO_WIDTH, VIDEO_HEIGHT, 6000000,
                mCameraPreviewThousandFps / 1000, 7, mHandler);
    } catch (IOException ioe) {
        throw new RuntimeException(ioe);
    }

    //通过下面的代码将 EGL 与 Surface关联  
    mEncoderSurface = new WindowSurface(mEglCore, 
                      mCircEncoder.getInputSurface(),  //MediaCodec Surface
                      true);
    ......

5. 将渲染后的数据输出到编码器的Surface中

	......

	mEncoderSurface.makeCurrent(); //关联 EGLContext 与 EGLSurface
	GLES20.glViewport(0, 0, VIDEO_WIDTH, VIDEO_HEIGHT);
	mFullFrameBlit.drawFrame(mTextureId, mTmpMatrix);  //渲染
	mEncoderSurface.setPresentationTime(mCameraTexture.getTimestamp());
	mEncoderSurface.swapBuffers(); //输出到编码器的 Surface 中
	
	......

6. 构造H264编码器

构造H264编码器实际就是设置编码器的媒体类型、宽高、帧率、GOF等。

......

// TODO: these ought to be configurable as well
private static final String MIME_TYPE = "video/avc";    // H.264 Advanced Video Coding
private static final int FRAME_RATE = 30;               // 30fps
private static final int IFRAME_INTERVAL = 5;           // 5 seconds between I-frames

private Surface mInputSurface;
private MediaCodec mEncoder;
private MediaCodec.BufferInfo mBufferInfo;

......
    
mBufferInfo = new MediaCodec.BufferInfo();

MediaFormat format = MediaFormat.createVideoFormat(MIME_TYPE, width, height);

// Set some properties.  Failing to specify some of these can cause the MediaCodec
// configure() call to throw an unhelpful exception.
format.setInteger(MediaFormat.KEY_COLOR_FORMAT, 
                MediaCodecInfo.CodecCapabilities.COLOR_FormatSurface);
format.setInteger(MediaFormat.KEY_BIT_RATE, bitRate);
format.setInteger(MediaFormat.KEY_FRAME_RATE, FRAME_RATE);
format.setInteger(MediaFormat.KEY_I_FRAME_INTERVAL, IFRAME_INTERVAL);

// Create a MediaCodec encoder, and configure it with our format.  Get a Surface
// we can use for input and wrap it with a class that handles the EGL work.
mEncoder = MediaCodec.createEncoderByType(MIME_TYPE);
mEncoder.configure(format, null, null, MediaCodec.CONFIGURE_FLAG_ENCODE);
mInputSurface = mEncoder.createInputSurface();
mEncoder.start();

.....

7. 视频编码

视频编码就更简单了,就是一个死循环不断的从编码器中查询编码状态。如果编码状态大于0, 则说明现在已经有编好的数据了。

「音视频直播技术」Android下视频H264编码_第2张图片

......

ByteBuffer[] encoderOutputBuffers = mEncoder.getOutputBuffers();
while (true) {

    int encoderStatus = mEncoder.dequeueOutputBuffer(mBufferInfo, TIMEOUT_USEC);
    
    ......
    
    if (encoderStatus > 0) {
    
        ByteBuffer encodedData = encoderOutputBuffers[encoderStatus];
            
        ......
                
        // adjust the ByteBuffer values to match BufferInfo (not needed?)
        encodedData.position(mBufferInfo.offset);
        encodedData.limit(mBufferInfo.offset + mBufferInfo.size);
           
         ......
        
        mEncoder.releaseOutputBuffer(encoderStatus, false);
            
        ......

    }
}
......

通过上面的分析我们可以清楚的知道硬件编码主要就是三大步:

  1. 创建编码器
  2. 从Camera获取数据。
  3. 循环从编码器中取数据。




本文转自:「音视频直播技术」Android下视频H264编码

其他好文:

视频直播技术–Android视频采集(Camera1)
音视频直播技术–Android视频采集(Camera2)
音视频直播技术–视频渲染之EGL

你可能感兴趣的:(07--Android,Media)