iOS-使用Lame转码:PCM->MP3

本文是iOS 使用AUGraph录音同时播放(并转码成MP3)中关于使用Lame将PCM转码成MP3的详细说明。看看时间戳真是触目惊心,时隔一年我才来填坑,惭愧忏愧。

有录音需求的朋友请先阅读上半部分,如果只需要转码MP3,看本文就够了。

下载DEMO
DEMO做了两件事情:

  • 一边录音一边转码成MP3
  • 将Wav文件转码成MP3文件

区别在于前者直接将内存中的数据转为Mp3,后者要先把文件读进内存再转码。

编译Lame库

1、下载Lame源码:lame.sourceforge.net
2、下载编译脚本:lame-ios-build
最近19大,Lame官网我都上不去了,嫌麻烦的可以直接到我的Github上去下载编译好的Lame库,两个文件分别是lame.hlibmp3lame.a,拖进项目即可食用。

准备

转码文件的话要先搞清楚PCM源的几个参数:

  • 采样率
  • 单声道/双声道
  • 每个采样点的位数

我DEMO中的测试音频信息如下,采样率44.1kHz,双声道(Stereo),16bit


wav_info.png

开始使用

代码节选自LameConver.m

lame_t lame; //1.声明一个全局变量
@implementation LameConver
/**
 wav文件转mp3文件

 @param wavPath wav文件路径(输入)
 @param mp3Path mp3文件路径(输出)
 */
- (void)converWav:(NSString *)wavPath toMp3:(NSString *)mp3Path successBlock:(successBlock)block{
    
    @try {
        FILE *fwav = fopen([wavPath cStringUsingEncoding:NSASCIIStringEncoding], "rb");
        fseek(fwav, 1024*4, SEEK_CUR); //跳过源文件的信息头,不然在开头会有爆破音
        FILE *fmp3 = fopen([mp3Path cStringUsingEncoding:NSASCIIStringEncoding], "wb");
        
        lame = lame_init(); //初始化
        lame_set_in_samplerate(lame, 44100.0); //设置wav的采样率
        lame_set_num_channels(lame, 2); //声道,不设置默认为双声道
        lame_init_params(lame);
        
        const int PCM_SIZE = 640 * 2; //双声道*2 单声道640即可
        const int MP3_SIZE = 8800; //计算公式pcm_size * 1.25 + 7200
        short int pcm_buffer[PCM_SIZE];
        unsigned char mp3_buffer[MP3_SIZE];
        
        int read, write;
        
        do {
            //将文件读进内存
            read = fread(pcm_buffer, sizeof(short int), PCM_SIZE, fwav);
            if (read == 0) {
                //当read为0,说明pcm文件已经全部读取完毕,调用lame_encode_flush即可。
                write = lame_encode_flush(lame, mp3_buffer, MP3_SIZE);
            } else { //当read不为0,调用lame_encode_buffer_xxx进行转码
                //双声道千万要使用lame_encode_buffer_interleaved这个函数
                //32位、单声道需要调用其他函数,具体看代码后面的说明
                write = lame_encode_buffer_interleaved(lame, pcm_buffer, read/2, mp3_buffer, MP3_SIZE);
            }
            //保存mp3文件
            fwrite(mp3_buffer, write, 1, fmp3);
        } while (read != 0);
        //记得各种关闭
        lame_close(lame);
        fclose(fmp3);
        fclose(fwav);
    } @catch (NSException *exception) {
        NSLog(@"catch exception");
    } @finally {
        block(); //成功转码后调用
    }
}

- (void)

整个过程分为三步:

  1. 声明Lame全局变量
  2. 初始化Lame并设置各种转码参数
  3. 开始转码

第2步只设置了采样率和声道,实际上还有很多参数可以设置:

  • lame_set_quality(lame_global_flags *, int); 设置压缩品质,quality=0..9. 0=best (very slow). 9=worst. 品质越好转码速度越慢
  • lame_set_out_samplerate(lame_global_flags *, int);设置输出MP3的采样率
  • lame_set_VBR(lame_global_flags *, vbr_mode);设置VBR类型
  • ......

lame.h头文件中可以看到很多可设置参数,我没用到所以没有仔细看。有兴趣的可以去瞧瞧,注释也很全。

第3步中函数的调用,搞清楚输入源的声道和每个采样点的位数,调用对应的函数:

  • lame_encode_buffer单声道,16位
  • lame_encode_buffer_interleaved双声道,16位
  • lame_encode_buffer_float单声道,32位

Lame就是这么方便简单,到这里就结束啦。如果本文对你有帮助,请Star,非常感谢!

fopen

补充一个fopen的知识点
头文件:#include
定义函数:FILE * fopen(const char * path,const char * mode);
函数参数说明:
path:字符串包含欲打开的文件路径及文件名。
mode:字符串则代表着流形态,取值如下:

  • r 打开只读文件,该文件必须存在。
  • r+打开可读写的文件,该文件必须存在。
  • w打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。
  • w+打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。
  • a以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。
  • a+ 以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。

上述的形态字符串都可以再加一个b字符,如rbw+bab+等组合,加入b字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。

返回值:
文件顺利打开后,指向该流的文件指针就会被返回,如果文件打开失败则返回NULL。

参考

stackoverflow
文件操作函数fread,fwrite,fseek,fopen,fclose解析

你可能感兴趣的:(iOS-使用Lame转码:PCM->MP3)