android音视频混音,实现酷炫吊炸天KTV效果

前段时间项目有个需求是要实现一个类似于唱吧的ktv效果,用户对着麦克风唱歌,然后app录制用户的声音,唱完以后,会将用户的音频合成到带有bgm的视频中去,就跟我们去ktv唱歌是一个效果。
由于自己不懂C,使用FFMPEG的门槛太高,并且ffmepg引入的话,会加大安装包体积,所以就打算用android自带的系统类来实现。上网查阅了一系列资料以后就开始动手了。
首先,后台给我们返回的只有bgm视频,本着不重复造轮子的思路,先上网搜了下有没有系统的类,能直接实现用户的MP3和我们的bgm MP4合成输出,一系列google操作加上github操作,并没有(这里我要羡慕以下ios的开发者,同组的ios同事直接找到了系统自带的类,扔一个MP3文件和bgm视频,就可以直接合成,省心省力,羡慕...)。那么只能自己将用户的音频和bgm音频合成,然后再合成到不带有bgm的视频中去。捋一下思路,用户的MP3可以用系统自带的AudioRecoder录制得到,bgm音频和bgm视频,可以从后台拿到,那么就是将两段MP3混音,得到最终的音频数据,再跟bgm视频合成,就能得到最终的带有用户人声的视频啦。确定方向以后,就好办了。
首先关于MP3的数据操作,肯定是拿到pcm数据操作比较方便。利用AudioRecoder录音的时候,可以直接拿到pcm数据,然后就是bgm的音频拿到pcm数据,后台返回的bgm音频是MP3格式,那么MP3需要解码成pcm格式。MP3解码成pcm这一步就比较困难了,调用java的方法耗时相当严重(想写个C库,又不太懂,如果有大佬提供C库的转码,感激不尽,可私信联系),不懂C,就只能用java了。Java里面支持解码的类就是MediaCodec了,关于MediaCodec中的介绍,可以参考官网链接:https://developer.android.google.cn/reference/android/media/MediaCodec?hl=en
MediaCodec这个类是android官方的编解码类,实际上会调用底层的解码器,所以在这一步上面速度其实并不比IOS慢。简单介绍下MediaCodec的完整使用方法,一共分为3步。
1.创建和配置
2.编解码
3.销毁MediaCodec
这其中配置是蛮重要的一步,笔者刚开始写的时候,老是配置错误,导致输出的音频相差甚远,延缓了开发进度。
当我们成功将背景mp3解码成pcm以后,再将2段PCM混音,笔者采用的平均混音算法(最常见的一种,不懂的同学自行搜索,前辈们的分享非常多)。然后将PCM编码成AAC格式,这一步也是采用MediaCodec来完成,是所有步骤里面最耗时的一步(具体编码速度跟手机性能相关)。最后,利用MediaExTractor和MediaMuxer将aac音频和无声Mp4重新封装成一个新的Mp4输出即可。其中,MediaExTractor和MediaMuxer使用方法参考官方文档(自行架梯查阅),非常的简单。
MediaExtractor链接:https://developer.android.google.cn/reference/android/media/MediaExtractor?hl=en
MediaMuxer链接:https://developer.android.google.cn/reference/android/media/MediaMuxer?hl=en

你可能感兴趣的:(android音视频混音,实现酷炫吊炸天KTV效果)