音频基础知识
组成
音频文件的组成:文件格式(或者音频容器) + 数据格式(或者音频编码)。
文件格式(或音频容器)是用于形容文件本身的格式。
我们可以通过多种不同的方法为真正的音频数据编码。例如CAF文件便是一种文件格式,它能够包含MP3格式,线性PCM以及其它数据格式的音频。
数据格式(或音频编码)
我们将从音频编码开始阐述(而不是文件格式),因为编码是最重要的环节。
线性PCM:
这是表示线性脉冲编码调制,主要是描写用于将模拟声音数据转换成数字格式的技术。简单地说也就是未压缩的数据。因为数据是未压缩的,所以我们便可以最快速地播放出音频,而如果空间不是问题的话这便是iPhone音频的优先代码选择。
音频文件计算大小
声卡对声音的处理质量可以用三个基本参数来衡量,即采样频率、采样位数和声道数。
采样频率:
是指单位时间内的采样次数。采样频率越大,采样点之间的间隔就越小,数字化后得到的声音就越逼真,但相应的数据量就越大。声卡一般提供11.025kHz、22.05kHz和44.1kHz等不同的采样频率。
采样位数:
是记录每次采样值数值大小的位数。采样位数通常有8bits或16bits两种,采样位数越大,所能记录声音的变化度就越细腻,相应的数据量就越大。
声道数
是指处理的声音是单声道还是立体声。单声道在声音处理过程中只有单数据流,而立体声则需要左、右声道的两个数据流。显然,立体声的效果要好,但相应的数据量要比单声道的数据量加倍。
声音数据量的计算公式为:
数据量(字节/秒)= (采样频率(Hz)× 采样位数(bit)× 声道数)/ 8
单声道的声道数为1,立体声的声道数为2。
【例1】请计算对于5分钟双声道、16位采样位数、44.1kHz采样频率声音的不压缩数据量是多少?
根据公式:数据量=(采样频率×采样位数×声道数×时间)/8
得,数据量(MB)=[44.1×1000×16×2×(5×60)] /(8×1024×1024)=50.47MB
计算时要注意几个单位的换算细节:
时间单位换算:1分=60秒
采样频率单位换算:1kHz=1000Hz
数据量单位换算:1MB=1024×1024=1048576B
【例2】请计算对于双声道立体声、采样频率为44.1kHz、采样位数为16位的激光唱盘(CD-A),用一个650MB的CD-ROM可存放多长时间的音乐?
已知音频文件大小的计算公式如下:
文件的字节数/每秒=采样频率(Hz)X采样位数(位)X声道数/8
根据上面的公式计算一秒钟时间内的不压缩数据量:(44.1×1000×16×2)/8=0.168MB/s
那么,一个650MB的CD-ROM可存放的时间为:(650/0.168)/(60×60)=1.07小时。
学习之前必须了解一些音频框架之类的东西,比如文件格式与数据格式(编码格式),比特率,采样率,轨道,声道,FFT(傅里叶快速变化),频谱等。查了网上很多资料,到现在还是一知半解啊。。。擦擦擦。。。。接着要整体了解下ios为我们提供处理音频的基础技术:核心音频(core Audio)
有5个框架:
1.Core Audio.framework
2.AudioToolbox.framework
3.AudioUnit.framework
4.AVFoundation.framework
5.OpenAL.framework
由于核心音频本身是一个很大的话题,涉及到很多领域的不同服务。因此,我们又将核心音频分割成较小的模块,方便我们去理解API以及框架
1.AudioToolbox.framework:
(1)音频队列服务(Audio
Queue service)(2)音频会话服务(Audio session service)
(3)音频文件服务
(4)音频文件流式服务
(5)音频转化服务
(6)系统声音服务 (7)扩展的音频文件服务
2.AudioUnit.framework:音频单元服务
3.OpenAL.framework:
OpenAL
4.AVFoundation.framework:
(1)AVAudioPlayer(2)AVAudioRecorder(3)AVAudioSession
5.CoreAudio:这个框架并不提供服务,仅提供其他框架可以使用的头文件和数据类型
一、音频播放
1.AVAudioPlayer
(1)在AVFoundation.framework框架中
(2)属性
(3)方法
(4)如何使用
2.音频服务(System
Sound Services)
3.音频队列(Audio
Queue Services)
4.OpenAL
5.MPMusciPlayController
6.音频单元服务
7.系统声音播放等
二、音频录制
1.AVAuidoRecorder
2.Audio
Queue Services等
三、音频剪切(截取)
NSString*path = [[NSBundle mainBundle] pathForResource:@"陈奕迅 - 想哭" ofType:@"mp3"];
NSURL *songURL =[NSURL fileURLWithPath:path];
AVURLAsset *songAsset = [AVURLAsset URLAssetWithURL:songURL options:nil];
2.创建音频文件
NSArray *dirs = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask,YES);
NSString *documentsDirectoryPath = [dirs objectAtIndex:0];
NSString *exportPath = [[documentsDirectoryPath
stringByAppendingPathComponent:EXPORT_NAME] retain];EXPORT_NAME为导出音频文件名
if ([[NSFileManager defaultManager] fileExistsAtPath:exportPath]) {
[[NSFileManager defaultManager] removeItemAtPath:exportPath error:nil];
}
NSURL *exportURL = [NSURL fileURLWithPath:exportPath];
AVAssetWriter *assetWriter = [[AVAssetWriter assetWriterWithURL:exportURL
fileType:AVFileTypeCoreAudioFormat
error:&assetError]
retain];
if (assetError) {
NSLog (@"error: %@", assetError);
return;
}
3.创建音频输出会话
AVAssetExportSession *exportSession = [AVAssetExportSession exportSessionWithAsset:songAsset presetName:AVAssetExportPresetAppleM4A];
4.设置音频截取时间区域 (CMTime在Core Medio框架中,所以要事先导入框架)
CMTime startTime = CMTimeMake([_startTime.text floatValue], 1);
CMTime stopTime = CMTimeMake([_endTime.text floatValue], 1);
CMTimeRange exportTimeRange = CMTimeRangeFromTimeToTime(startTime, stopTime);
5.设置音频输出会话并执行
exportSession.outputURL = [NSURL fileURLWithPath:filePath]; // output path
exportSession.outputFileType = AVFileTypeAppleM4A; // output file type
exportSession.timeRange = exportTimeRange; // trim time range
[exportSession exportAsynchronouslyWithCompletionHandler:^{
if (AVAssetExportSessionStatusCompleted == exportSession.status) {
NSLog(@"AVAssetExportSessionStatusCompleted");
}else if (AVAssetExportSessionStatusFailed == exportSession.status) {
a failure may happen because of an event out
of your control
for example, an interruption like a phone call
comming in
make sure and handle this case appropriately
NSLog(@"AVAssetExportSessionStatusFailed");
}else {
NSLog(@"Export Session Status: %d",exportSession.status);
}
}];
总得来说:我们再APP的目录下创建了音频文件,然后创建了一个音频的AVAsset对象(AVAsset代表一个抽象的媒体,包含标题,文件大小等等),接着创建一个AVAsset的输出会话AVAssetExportSession,最后就是设置我们要剪切(截取)的时间区域CMTimeRange,然后执行AVAssetExportSeesion的回调函数exportAsynchronouslyWithCompletionHandler。