利用 MediaCodec 进行转码

前面的文章简单介绍了 MediaCodec 的使用说明，这篇文章会说明如何使用 MediaCodec 进行视频转码。

首先关于转码的流程：

视频文件 ——> 解封装 ——> 解码 ——> 编码 ——> 封装 ——> 转码后的视频文件

那么转换到 MediaCodec 中对应的流程即：

视频

MediaExtractor 解封装 video 数据，
MediaCodec 解码器解码压缩视频数据，并输入到 Surface
Surface 中的原始视频数据输入到 MediaCodec 编码器进行编码
对编码器输出数据进行封装（不分块的情况下：使用 MediaMuxer 进行封装。分块的情况下：使用 FFmpeg muxer 进行封装）

音频

MediaExtractor 解封装 audio 数据，
MediaCodec 解码器解码压缩视频数据
解码后的 ByteBuffer 数据输入 MediaCodec 编码器进行编码
对编码器输出数据进行封装（不分块的情况下：使用 MediaMuxer 进行封装。分块的情况下：使用 FFmpeg muxer 进行封装）

先简单介绍下前面流程中提到的 MediaExtractor & MediaMuxer

MediaExtractor

主要用于提取音视频相关信息，分离音视频。读取音视频文件，然后按照一定的格式输出出来。

使用步骤（参考官方示例）：

MediaExtractor extractor = new MediaExtractor();
// 设置数据源
extractor.setDataSource(...);
// 文件轨道总数
int numTracks = extractor.getTrackCount();
for (int i = 0; i < numTracks; ++i) {
  MediaFormat format = extractor.getTrackFormat(i);
  String mime = format.getString(MediaFormat.KEY_MIME);
  if (weAreInterestedInThisTrack) {
    // 因为 MediaExtractor 需要选定轨道之后，才能读取数据。所以针对 video & audio 如果想要同步处理的话，则需要创建两个MediaExtractor分别读取
    extractor.selectTrack(i);
  }
}

// 读取数据到 inputBuffer 
ByteBuffer inputBuffer = ByteBuffer.allocate(...)
while (extractor.readSampleData(inputBuffer, ...) != 0) {
  // 数据对应索引
  int trackIndex = extractor.getSampleTrackIndex();
  // 数据时间戳
  long presentationTimeUs = extractor.getSampleTime();
  ...
  // 前进到下一帧(不存在下一帧，则返回 false)
  extractor.advance();
}
// 释放
extractor.release();
extractor = null;

MediaMuxer

主要用于封装编码后的视频流和音频流到文件容器中（目前支持 MP4、Webm、3GP文件封装格式）

使用步骤：

// 创建 MP4 封装格式的封装器
MediaMuxer muxer = new MediaMuxer("temp.mp4", OutputFormat.MUXER_OUTPUT_MPEG_4);
// More often, the MediaFormat will be retrieved from MediaCodec.getOutputFormat()
// or MediaExtractor.getTrackFormat().
MediaFormat audioFormat = new MediaFormat(...);
MediaFormat videoFormat = new MediaFormat(...);
int audioTrackIndex = muxer.addTrack(audioFormat);
int videoTrackIndex = muxer.addTrack(videoFormat);
ByteBuffer inputBuffer = ByteBuffer.allocate(bufferSize);
boolean finished = false;
BufferInfo bufferInfo = new BufferInfo();
muxer.start();
while(!finished) {
  // getInputBuffer() will fill the inputBuffer with one frame of encoded
  // sample from either MediaCodec or MediaExtractor, set isAudioSample to
  // true when the sample is audio data, set up all the fields of bufferInfo,
  // and return true if there are no more samples.
  finished = getInputBuffer(inputBuffer, isAudioSample, bufferInfo);
  if (!finished) {
    int currentTrackIndex = isAudioSample ? audioTrackIndex : videoTrackIndex;
    // 写入文件
    muxer.writeSampleData(currentTrackIndex, inputBuffer, bufferInfo);
  }
};
muxer.stop();
muxer.release();

使用 Surface 作为解码的输出以及编码的输入

MediaCodec 通过 Surface 可以实现编解码的硬件加速。

编码器通过调用 createInputSurface() 方法获取一个 Surface 作为 encoder的输入。

解码器在调用 configure() 方法时传入 Surface 参数，解码后的数据直接输出到 Surface。

前面简单介绍了 MediaCodec 的大致流程，下面展开具体介绍：

MediaCodec 转码流程.png

MediaCodec 选择异步方式，前面的文章已经介绍过异步方式下如何调用，主要是四个方法：

public void onInputBufferAvailable(); // codec 存在可用输入缓冲区，将需要处理的数据输入缓冲区
public void onOutputBufferAvailable();// codec 存在可用输出缓冲，取出完成编解码的数据进行下一步处理
public void onError(); // 编解码出错
public void onOutputFormatChanged(); // 输出的 MediaFormat 发生了改变

参考着上面的流程图，介绍下每个主要的步骤

视频：

创建 MediaExtractor, 用于获取输入视频的 MediaFormat 以及读取视频压缩数据
配置视频输出相关参数（码率、宽&高、帧率等）MediaFormat, 创建 video 编码器，并获取 encoder 的输入 Surface
通过 MediaExtractor 获取输入视频的 MediaFormat, 创建 video 解码器，并在 configure 时传入 Surface 作为输出目标
当 decoder 存在可用输入缓冲时，通过 MediaExtractor 读取 video 压缩数据，传入 decoder 进行处理（queueInputBuffer）
当 decoder 存在可用输出缓冲时，调用 releaseOutputBuffer(index, true) 将数据输出到 Surface，

encoder 存在可用输入缓冲时，会直接从 Surface 获取数据（这部分会自动处理，不用做额外工作）
encoder 存在可用输出缓冲时，getOutputBuffer(index) 获取 video 压缩数据，进行封装

音频：

创建 MediaExtractor, 用于获取输入音频的 MediaFormat 以及读取音频压缩数据
配置音频输出相关参数（采样率、比特率、信道数量等）MediaFormat, 创建 audio 编码器
通过 MediaExtractor 获取输入音频的 MediaFormat, 创建 audio 解码器
当 decoder 存在可用输入缓冲时，通过 MediaExtractor 读取 audio 压缩数据，传入 decoder 进行处理（queueInputBuffer）
当 decoder 存在可用输出缓冲时，getOutputBuffer(index) 获取音频原始数据，并存入本地缓存

encoder 存在可用输入缓冲时，将本地缓存中的音频原始数据 queInputBuffer 输入编码器
encoder 存在可用输出缓冲时，getOutputBuffer(index) 获取 audio 压缩数据，进行封装

Tips:

转码中存在视频截取的场景，MediaCodec 中没有类似 FFmpeg 中 "-ss、-t" 可以控制截取起点和时长的参数，所以需要在向解码器输入参数时人为进行截取：

// seek 到指定时间(mode - 指定时间的前一帧、后一帧、最靠近的一帧)
public native void seekTo(long timeUs, @SeekMode int mode);

首先： 调用 MediaExtractor.seekTo 方法 seek 到视频截取开始时间

然后： 在向解码器中传输压缩数据时，判断是否处理了足够时长的数据，下面直接通过代码来看：

while (!mVideoReadDone) {
    // 读取视频数据到解码器输入缓冲
    int size = mVideoExtractor.readSampleData(decoderInputBuffer, 0);
    long pst = mVideoExtractor.getSampleTime();
    // 判断当前帧的时间戳是否已经超过要截取的时长
    if (length != 0 && pst > start + length) {
        // 到达剪辑时间
        mVideoReadDone = true;
        } else {
            if (start > 0) {
                // 如果需要截取视频，需要重新计算时间戳(因为当前帧记录的还是截取之前的时间戳)
                videoPst += videoSampleTime;
                pst = videoPst;
            }
            if (size >= 0) {
                // 将解码器缓冲送入解码器
                codec.queueInputBuffer(index, 0, size, pst,
                                mVideoExtractor.getSampleFlags());
            }

            // 视频数据是否已读取完
            mVideoReadDone = !mVideoExtractor.advance();
        }
        if (mVideoReadDone) {
            // 视频数据读完 或 到达剪辑时间
            logdw(LOG_LEVEL_DEBUG, "Video extractor: EOS");

            // send EOS to decoder
            codec.queueInputBuffer(index, 0, 0, 0,
                    MediaCodec.BUFFER_FLAG_END_OF_STREAM);
        }
        if (size >= 0) {
            break;
        }
}

视频封装：

MediaMuxer:

在使用 MediaMuxer 进行音视频封装时需要注意：需要先添加 video & audio track，然后才能向 muxer 写入压缩数据。

public abstract void onOutputFormatChanged(
                @NonNull MediaCodec codec, @NonNull MediaFormat format);

在编码器输出数据之前，会先输出压缩数据的 MediaFormat，因此要在 video & audio 编码器都输出 OutputFormat 之后，并添加到 MeidaMuxer 之后，再调用 start 方法启动 Muxer:

// 记录下 video & audio 的track，后面写入数据时需要用到
mOutputVideoTrack = mMuxer.addTrack(mEncoderVideoFormat);
mOutputAudioTrack = mMuxer.addTrack(mEncoderAudioFormat);
    
mMuxer.start();

当编码器输出压缩数据后：

public void onOutputBufferAvailable(MediaCodec codec, int index, MediaCodec.BufferInfo info)

就可以将 video & audio 压缩数据写入 MediaMuxer 进行封装：

// video 
ByteBuffer videoOutputBuffer = mVideoEncoder.getOutputBuffer(index);
mMuxer.writeSampleData(mOutputVideoTrack, videoOutputBuffer, info);

// audio
ByteBuffer audioOutputBuffer = mAudioEncoder.getOutputBuffer(index);
mMuxer.writeSampleData(mOutputAudioTrack, audioOutputBuffer, info);

FFmpeg： 关于使用 FFmpeg muxer 封装 MediaCodec 压缩数据在另外一篇文章中单独介绍。

利用 MediaCodec 进行转码

MediaExtractor

MediaMuxer

使用 Surface 作为解码的输出以及编码的输入

你可能感兴趣的:(利用 MediaCodec 进行转码)