Android音视频开发(三)——MediaExtractor和MediaMuxer的使用

了解了音视频的编解码过程,我们接下来使用一下经常跟MediaCodec一起搭配的MediaExtractor和MediaMuxer。最后会使用一个简单的demo来了解具体了解这两个工具类的使用过程。这一节我们就先不讲MediaCodec了,放到下节的demo。

Android音视频开发(三)——MediaExtractor和MediaMuxer的使用_第1张图片

一、MediaExtractor

Android提供了一个MediaExtractor类,可以用来分离容器中的视频track音频track

主要API介绍:

  • setDataSource(String path):即可以设置本地文件又可以设置网络文件
  • getTrackCount():得到源文件通道数 
  • getTrackFormat(int index):获取指定(index)的通道格式
  • getSampleTime():返回当前的时间戳 
  • readSampleData(ByteBuffer byteBuf, int offset):把指定通道中的数据按偏移量读取到ByteBuffer中;
  • advance():读取下一帧数据
  • release(): 读取结束后释放资源

MediaExtractor 的使用主要有这么几步:

  1. 设置数据源
  2. 获取通道数,切换到想要的轨道
  3. 循环读取每帧的样本数据
  4. 完成后释放资源

二、MediaMuxer

MediaMuxer的作用是生成音频或视频文件;还可以把音频与视频混合成一个音视频文件。

相关API介绍:

  • MediaMuxer(String path, int format):path:输出文件的名称  format:输出文件的格式;当前只支持MP4格式;
  • addTrack(MediaFormat format):添加通道;我们更多的是使用MediaCodec.getOutpurForma()或Extractor.getTrackFormat(int index)来获取MediaFormat;也可以自己创建;
  • start():开始合成文件
  • writeSampleData(int trackIndex, ByteBuffer byteBuf, MediaCodec.BufferInfo bufferInfo):把ByteBuffer中的数据写入到在构造器设置的文件中;
  • stop():停止合成文件
  • release():释放资源

参数

int MUXER_OUTPUT_3GPP

3GPP媒体文件格式

int MUXER_OUTPUT_HEIF

HEIF媒体文件格式

int MUXER_OUTPUT_MPEG_4

MPEG4媒体文件格式

int MUXER_OUTPUT_OGG

Ogg媒体文件格式

int MUXER_OUTPUT_WEBM

WEBM媒体文件格式

MediaMuxer的使用步骤:

  1. 设置目标文件路径和音视频格式
  2. 添加要合成的轨道,包括音轨和视轨
  3. 开始合成,循环写入每帧样本数据
  4. 完成后释放

三、MediaFormat

        用MediaCodec来进行编解码,在创建MediaCodec时需要调用configure方法进行配置,Mediaformat则是configure需要传入的一个参数。

 3.1 视频类型的Mediaformat

可以通过如下代码创建视频类型Mediaformat:

MediaFormat videoFormat = MediaFormat.createVideoFormat(videoType, width, height);

方法的参数类型:

  • videoType常用的有两种:

        MediaFormat.MIMETYPE_VIDEO_AVC(H.264
        MediaFormat.MIMETYPE_VIDEO_HEVC(H.265

  • widthheight需要根据底层支持的分辨率来设置,如果width和height设置的不符合要求会出现如下错误:
E/CameraCaptureSession: Session 1: Failed to create capture session; configuration failed

对于视频类型而言有下列四个配置是必须指定的:手动配置直接获取原视频的配置

// 指定编码器颜色格式 
videoFormat.setInteger(MediaFormat.KEY_COLOR_FORMAT,
    MediaCodecInfo.CodecCapabilities.COLOR_FormatSurface);

// 指定帧率
videoFormat.setInteger(MediaFormat.KEY_FRAME_RATE, 30);

// 指定比特率
videoFormat.setInteger(MediaFormat.KEY_BIT_RATE, 10000000);

//指定关键帧时间间隔,一般设置为每秒关键帧
videoFormat.setInteger(MediaFormat.KEY_I_FRAME_INTERVAL, 1);

 3.2 音频类型的Mediaformat

可以通过如下代码创建音频类型Mediaformat:

MediaFormat audioFormat = MediaFormat.createAudioFormat(audioType, sampleRate, channelCount);

方法的参数类型:

  • audioType:常用的是MediaFormat.MIMETYPE_AUDIO_AAC
  • sampleRate:采样率
  • channelCount:声道数量

单声道 channelCount=1 , 双声道 channelCount=2

对于音频类型而言有一个配置是必须指定的:

//音频比特率(码率)
audioFormat.setInteger(MediaFormat.KEY_BIT_RATE, BIT_RATE);

四、MediaCodec.BufferInfo 

        用于描述解码得到的byte[]数据的相关信息,每缓冲区元数据包括指定相关编解码器(输出)缓冲区中有效数据范围的偏移量和大小。

主要有四个属性:

  • int flags :与缓冲区关联的缓冲区标志
  • int offset :缓冲区中数据的起始偏移量
  • long presentationTimeUs :缓冲区的显示时间戳,以微秒计。这是从相应的输入缓冲区传入的表示时间戳中获得的。对于大小为0的缓冲区,应该忽略这一点。
  • int size :缓冲区中的数据量(以字节为单位)。如果这是0缓冲区中没有数据,可以丢弃。大小为0的缓冲区的唯一用途是携带流结束标记。

flags详解:

  • 与缓冲区关联的缓冲区标志。...的结合MediaCodec.BUFFER_FLAG_KEY_FRAMEMediaCodec.BUFFER_FLAG_END_OF_STREAM.
  • 作为关键帧的编码缓冲区标有MediaCodec.BUFFER_FLAG_KEY_FRAME.
  • 对应于输入缓冲区的最后一个输出缓冲区用MediaCodec.BUFFER_FLAG_END_OF_STREAM也将标有MediaCodec.BUFFER_FLAG_END_OF_STREAM。在某些情况下,这可能是一个空缓冲区,其唯一目的是携带流结束标记。

值是0或以下各项的组合MediaCodec.BUFFER_FLAG_SYNC_FRAMEMediaCodec.BUFFER_FLAG_KEY_FRAMEMediaCodec.BUFFER_FLAG_CODEC_CONFIGMediaCodec.BUFFER_FLAG_END_OF_STREAMMediaCodec.BUFFER_FLAG_PARTIAL_FRAME、以及Android . media . media codec . buffer _ FLAG _ MUXER _ DATA

  • BUFFER_FLAG_CODEC_CONFIG​  常数值:2:这表明如此标记的缓冲区包含编解码器初始化/编解码器特定数据,而不是媒体数据。
  • BUFFER_FLAG_END_OF_STREAM 常数值:4:这表示流的结束,即在此之后将没有缓冲器可用,当然,除非,flush()如下。
  • BUFFER_FLAG_KEY_FRAME 常数值:1:这表明如此标记的(编码的)缓冲区包含关键帧的数据。
  • BUFFER_FLAG_PARTIAL_FRAME 常数值:8:这表示缓冲区只包含一帧的一部分,解码器应该对数据进行批处理,直到在解码该帧之前出现一个没有该标志的缓冲区。
  • BUFFER_FLAG_SYNC_FRAME 常数值:1:这表明如此标记的(编码的)缓冲区包含关键帧的数据。API 21中不赞成使用此常量。 使用BUFFER_FLAG_KEY_FRAME相反,都是关键帧

五、MediaExtractor和MediaMuxer结合的demo

实现音视频的解封装和封装的过程:

//实现音视频的解封装和封装的过程
public class MediaCodecDemo extends Activity {

    //显示解封装后的视频和音频在SD卡保存的位置
    private TextView tv_out;
    private final String mVideoPath = Environment.getExternalStorageDirectory()
                                     + "/Pictures/送孟浩然之广陵.mp4";
    //解封装和封装在本地使用文件名
    private final String inputAudio = "audio1.aac";
    private final String outPutVideo = "video1.mp4";

    private static final String TAG1 ="解封装MediaExtractor:" ;

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_media_codec);

        initView();
        //提取视频分离出纯音频和纯视频文件
        extractorAndMuxerMP4(mVideoPath);
        //重新合成成音视频文件
        muxerMp4(inputAudio,outPutVideo);
    }

    private void initView() {
        tv_out = findViewById(R.id.tv_out);
    }
}

//提取视频分离出纯音频和纯视频文件
private void extractorAndMuxerMP4(String url){
    //提取数据(解封装)
    //1. 构造MediaExtractor
    MediaExtractor mediaExtractor = new MediaExtractor();
    try {
        //2.设置数据源,数据源可以是本地文件地址,也可以是网络地址:
        mediaExtractor.setDataSource(url);
        //3.获取轨道数
        int trackCount = mediaExtractor.getTrackCount();
        //遍历轨道,查看音频轨或者视频轨道信息
        for (int i = 0; i < trackCount; i++) {
            //4. 获取某一轨道的媒体格式
            MediaFormat trackFormat = mediaExtractor.getTrackFormat(i);
            String keyMime = trackFormat.getString(MediaFormat.KEY_MIME);
            if (TextUtils.isEmpty(keyMime)) {
               continue;
            }
            //5.通过mime信息识别音轨或视频轨道,打印相关信息
            //(默认的是先扫描到视频,在扫描到音频)
            if (keyMime.startsWith("video/")) {
                File outputFile = extractorAndMuxer(mediaExtractor, i, "/video.mp4");
                tv_out.setText("纯视频文件路径:" + outputFile.getAbsolutePath());

            } else if (keyMime.startsWith("audio/")) {
                File outputFile = extractorAndMuxer(mediaExtractor, i, "/audio.aac");
                tv_out.setText(tv_out.getText().toString() + "\n纯音频路径:" 
                                + outputFile.getAbsolutePath());
                tv_out.setVisibility(View.VISIBLE);
            }
        }
    } catch (IOException e) {
        e.printStackTrace();
    }
}

        通过getTrackFormat(int index)来获取各个track的MediaFormat,通过MediaFormat来获取track的详细信息,如:MimeType、分辨率、采样频率、帧率等等

    //确定是音轨或视频轨道后,文件输出
    private File extractorAndMuxer(MediaExtractor mediaExtractor, int i, String outputName) throws IOException{
        //获取传过来的MediaExtractor对应轨道的trackFormat
        MediaFormat trackFormat = mediaExtractor.getTrackFormat(i);
        MediaMuxer mediaMuxer;
        //选择轨道
        mediaExtractor.selectTrack(i);

        File outputFile = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC).getAbsolutePath() + outputName);
        if (outputFile.exists()) {
            //如果文件存在,就删除
            outputFile.delete();
        }
        //1. 构造MediaMuxer
        mediaMuxer = new MediaMuxer(outputFile.getAbsolutePath(), MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4);
        //2. 添加轨道信息 参数为MediaFormat
        mediaMuxer.addTrack(trackFormat);
        //3. 开始合成
        mediaMuxer.start();
        //4. 设置buffer
        ByteBuffer buffer = ByteBuffer.allocate(500 * 1024);//设置每一帧的大小
        MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo();

        //5.通过mediaExtractor.readSampleData读取数据流
        int sampleSize = 0;
        //循环读取每帧的样本数据
        //mediaExtractor.readSampleData(buffer, 0)把指定通道中的数据按偏移量读取到ByteBuffer中
        while ((sampleSize = mediaExtractor.readSampleData(buffer, 0)) > 0) {
            bufferInfo.flags = mediaExtractor.getSampleFlags();
            bufferInfo.offset = 0;
            bufferInfo.size = sampleSize;
            bufferInfo.presentationTimeUs = mediaExtractor.getSampleTime();
            //所有解码的帧都已渲染,我们现在可以停止播放了,虽然这里没有用到
            //一般的使用方法是判断 isEOS是否等于0;
            //int isEOS = bufferInfo.flags & MediaCodec.BUFFER_FLAG_END_OF_STREAM;
            //判断输出数据是否为关键帧的方法:
            //boolean keyFrame = (bufferInfo.flags & MediaCodec.BUFFER_FLAG_KEY_FRAME) != 0;
            //6. 把通过mediaExtractor解封装的数据通过writeSampleData写入到对应的轨道
            mediaMuxer.writeSampleData(0, buffer, bufferInfo);
            //读取下一帧数据
            mediaExtractor.advance();
        }
        Log.i(TAG1, "extractorAndMuxer: " + outputName + "提取封装完成");

        mediaExtractor.unselectTrack(i);
        //6.关闭
        mediaMuxer.stop();
        mediaMuxer.release();
        return outputFile;
    }

这里需要科普一下两个正数进行&运算:两个正数进行&运算的值永远小于或等于最小的数。

if ((info.flags & MediaCodec.BUFFER_FLAG_END_OF_STREAM) != 0) { 
    Log.i(TAG, "OutputBuffer BUFFER_FLAG_END_OF_STREAM");       
    break;                                                      
}

        我们知道BUFFER_FLAG_END_OF_STREAM代表的是2^2,也就是0100。因为是&运算,我们只用关注info.flags二进制第三位即可:为0即上面判断为false,为1即上面判断为true。

  • 正数与负数的与运算:负数的异或操作需要先把数转换成补码才行(头不变取反+1)

两个数互为相反数位与操作可有特殊用途,位与所剩恰为最低位。

两个数互为相反数异或可能有特殊用途,异或后,所剩最低位左移一位。

到此我们就将音视频解封装成了音频和视频,并且保存在了指定文件当中,我们分析一下流程:

  1. 构造MediaExtractor(不需要参数) —> 之后的操作使用try/catch包围 —> setDateSource(url)设置本地或者网络资源 —> getTrackConut()获取该资源的通道数 —> for循环通道数 —> 获取某一轨道的媒体格式:getTrackFormat(i)返回一个MediaFormat —> 判断是什么通道根据trackFormat.getString(MediaFormat.KEY_MIME)返回ketMime的startsWith("?") 。
  2. 接下来的操作就确定了音轨和视频轨道,同时确定文件的输出地点。
  3. 构造MediaMuxer (需要指定文件和格式)—> addTrack(trackFormat)添加轨道信息 参数为MediaFormat,注意这里的MediaFormat要是对应的轨道 —> start()开始合成 —> 设置ByteBuffer,用于缓存一帧数据 —> MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo()获取bufferInfo —> 通过mediaExtractor.readSampleData读取数据流,同时也作为一个while循环的判断条件 —> 配置bufferInfo的四个属性 —> 把通过mediaExtractor解封装的数据通过mediaMuxer.writeSampleData写入到对应的轨道 —> 读取下一帧audioExtractor.advance()。
  4. 循环结束之后mediaExtractor.unselectTrack(i)释放选择 —> mediaMuxer.stop()停止 —> 最后释放mediaMuxer和mediaExtractor。

接下来我们开始合成操作

    //把音轨和视频轨再合成新的视频
    private String muxerMp4(String inputAudio , String outPutVideo){
        File videoFile = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), "video.mp4");
        File audioFile = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), inputAudio);
        File outputFile = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), outPutVideo);


        if (outputFile.exists()) {
            outputFile.delete();
        }
        if (!videoFile.exists()) {
            Toast.makeText(this, "视频源文件不存在", Toast.LENGTH_SHORT).show();
            return "";
        }
        if (!audioFile.exists()) {
            Toast.makeText(this, "音频源文件不存在", Toast.LENGTH_SHORT).show();
            return "";
        }

        MediaExtractor videoExtractor = new MediaExtractor();
        MediaExtractor audioExtractor = new MediaExtractor();

        try {
            MediaMuxer mediaMuxer = new MediaMuxer(outputFile.getAbsolutePath(), MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4);
            int videoTrackIndex = 0;
            int audioTrackIndex = 0;

            //先添加视频轨道
            videoExtractor.setDataSource(videoFile.getAbsolutePath());
            int trackCount = videoExtractor.getTrackCount();

            for (int i = 0; i < trackCount; i++) {
                MediaFormat trackFormat = videoExtractor.getTrackFormat(i);
                String mimeType = trackFormat.getString(MediaFormat.KEY_MIME);
                if (TextUtils.isEmpty(mimeType)) {
                    continue;
                }
                if (mimeType.startsWith("video/")) {
                    videoExtractor.selectTrack(i);

                    videoTrackIndex = mediaMuxer.addTrack(trackFormat);
                    break;
                }
            }

            //再添加音频轨道
            audioExtractor.setDataSource(audioFile.getAbsolutePath());
            int trackCountAduio = audioExtractor.getTrackCount();
            for (int i = 0; i < trackCountAduio; i++) {
                MediaFormat trackFormat = audioExtractor.getTrackFormat(i);
                String mimeType = trackFormat.getString(MediaFormat.KEY_MIME);
                if (TextUtils.isEmpty(mimeType)) {
                    continue;
                }
                if (mimeType.startsWith("audio/")) {
                    audioExtractor.selectTrack(i);
                    audioTrackIndex = mediaMuxer.addTrack(trackFormat);
                    Log.i(TAG1, "muxerToMp4: audioTrackIndex=" + audioTrackIndex);
                    break;
                }
            }


            //再进行合成
            mediaMuxer.start();
            ByteBuffer byteBuffer = ByteBuffer.allocate(500 * 1024);
            MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo();
            int sampleSize = 0;

            while ((sampleSize = videoExtractor.readSampleData(byteBuffer, 0)) > 0) {

                bufferInfo.flags = videoExtractor.getSampleFlags();
                bufferInfo.offset = 0;
                bufferInfo.size = sampleSize;
                bufferInfo.presentationTimeUs = videoExtractor.getSampleTime();
                mediaMuxer.writeSampleData(videoTrackIndex, byteBuffer, bufferInfo);
                videoExtractor.advance();
            }

            int audioSampleSize = 0;

            MediaCodec.BufferInfo audioBufferInfo = new MediaCodec.BufferInfo();


            while ((audioSampleSize = audioExtractor.readSampleData(byteBuffer, 0)) > 0) {

                audioBufferInfo.flags = audioExtractor.getSampleFlags();
                audioBufferInfo.offset = 0;
                audioBufferInfo.size = audioSampleSize;
                audioBufferInfo.presentationTimeUs = audioExtractor.getSampleTime();
                mediaMuxer.writeSampleData(audioTrackIndex, byteBuffer, audioBufferInfo);
                audioExtractor.advance();
            }

            //最后释放资源
            videoExtractor.release();
            audioExtractor.release();
            mediaMuxer.stop();
            mediaMuxer.release();

        } catch (IOException e) {
            e.printStackTrace();
            return "";

        }
        return outputFile.getAbsolutePath();
    }

        因为这个与上面例子的流程大致相同,上面看懂了,下面基本上没什么问题,所以注释相对比较少。至于过程也就懒得分析了。

        我们在解封装的过程中同时使用到了MediaExtractor和MediaMuxer,包括合成的时候也用了这两个。不要想当然的认为MediaExtractor解封装出来两文件,两文件根据MediaMuxer就可以合成!!!

        最后遗留两个问题:

        1.解封装出来的是不同轨道的资源,可是当做文件输出时,除了文件名不同其他的操作都是一模一样,就连mediaMuxer的参数格式都是MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4,那音频文件是怎样合成成功的???

        AAC代表Advanced Audio Coding(高级音频编码),是一种由MPEG-4标准定义的有损音频压缩格式。而且解封装出来的音频acc和视频MP4改了后缀都可以正常播放。

        

        音频文件同样可以理解为一帧帧的说法,之后我回使用实时AAC音频帧并通过AudioTrack来播放,尽情期待。

        2.分解出来的轨道是固定的吗?还是根据自定义来的?他的个数只能是一个音频一个视频吗?

  • 分解出来的轨道不是固定的但一般是两个轨道(一个音频一个视频)
E/测试Demo: 轨道数量 = 2
E/测试Demo: 0编号通道格式 = video/avc
E/测试Demo: 1编号通道格式 = audio/mp4a-latm
  • 这个具体的顺序就是根据你使用mediaMuxer添加合成的顺序
  • 当然也可能有多个音频和视频在一个盒子里

你可能感兴趣的:(Android音视频进阶开发,音视频,Android,java)