[素材资源] 音频格式

http://www.mp3-tech.org/

简介

关于音频压缩,编码和解码的定义有很多含混的概念。 这部分文字将对关于音频编码等概念进行概要的介绍 

音频压缩的目的
直到音频压缩技术出现,以往存储高品质数字音频数据占用了大量的硬盘空间。 举个简单的例子: 
假设你要采样1分钟你所喜欢的歌存并储在硬盘 因为要获得CD音质,你使用44.1kHz采样率,立体声,16比特模式采样。 
44100 Hz 表示每秒钟将采样44100 个数值输入到你的声卡。 因为有2个声道,所以还要把这个数值乘以2 并且再乘以另一个数值 2,因为每个数值占有2字节(byte)空间(这就是16位的意思) 最终,这首1分钟的歌将占用 44100 samples/s*2 channels*2 bytes/sample*60 s/min约等于10Mbytes 硬盘空间。 
如用你想使用56k moden 在网络上下载这样一个仅仅1分钟的音频文件,将花费约30分钟——仅仅是下载1分钟的音乐。 
本文中的数字音频编码或称作数字音频压缩是一门将音频存储空间(通道波段带宽)最小化的艺术。 现在可感知音频编码技术(例如MPEG LayerIII)利用了人耳的特点(对声音的感知)在稍微或者不损失可感知音质的条件下将文件大小缩小了11倍。因此,这种计划是追求高质量低比特率的核心技术程序,例如游戏的音轨,数字录音机,网络音乐,数字网络广播系统等。 

音频压缩的两部分
音频压缩实际上包含两个部分。 第一部分被称之为编码,这是一个将数字音频数据(通常为WAVE文件)转为被称为比特流(bitstream)的高压缩形式。 如果你要在声卡上播放这种比特流,你需要进行另一部分操作——被称为解码 解码将比特流重新放大还原成WAVE文件。 
实现第一部分效果的程序被称为编码器。 LAME就是这样一个编码器。 实现第二部分效果的程序被称为解码器。 Xmms就是一个著名的MPEG3解码器,另外还有 mpg123。 你可以在www.mp3-tech.org 上找到它们。 

压缩比例,比特率和音质
至此一直没有明确提到的以下问题: 最终被编码再解码后的文件并不是与原来相同的声音文件。 可以说所有含有信息量的数据被压榨出来, 两者不是相同的文件,但是它们或多或少听起来是一样的,关键取决于你压缩程度的高低。 
通常说来,使用较低的压缩比例,获得的音质比较好,反之亦然。 表1.1将列出了不同压缩比例可获得的音效概况 
因为压缩比例这种说法往往不好度量,当涉及到压缩强度的时候专业人员会使用比特率这一概念。 比特率表示一秒钟压缩音频流所占用的平均比特数。 通常使用kbps作为单位,写作kbits/s,或者1000 bits/s 。如果要计算音频文件每秒钟所占用的字节数,可以简单的将其每秒钟的比特数除以8获得。

表 1.1 比特率对应音质

比特率    带宽    类似或更好的音质

16 kbps  4.5 kHz 短波收音

32 kbps 7.5 kHz 调频收音

96 kbps 11 kHz 调频立体声

128 kbps 16 kHz 接近于CD

160-180 kbps 20 kHz 可感觉到声场
(变动比特率)
256 kbps 22 kHz 工作室

一些命令行样例
• 128kbps 固定比特率编码
lame sample.wav sample.mp3
• 128kbps固定比特率联合立体声编码,高音质(推荐):
lame -h sample.wav sample.mp3
• 112kbps 平均比特率编码
lame --abr 112 sample.wav sample.mp3
• 快速编码,低音质(忽略精神声学分析)
lame -f sample.wav sample.mp3
• 变动比特率(使用 –V n 调节音质/文件容量)
lame -h -V 6 sample.wav sample.mp3
• 原始pcm单声道输出22.05kHz,24kbps: 
cat inputfile | lame -r -m m -b 24 -s 22.05 -- > output
• 44.1kHz原始单声道pcm向下采样到22.05kHz
cat inputfile | lame -r -m m -b 24 --resample 22.05 -- > output

————————————————————————————————————

固定比特率/平均比特率/变动比特率 3种编码模式

LAME可以用它的3种编码模式对你的音乐文件进行编码操作: 固定比特率(CBR),平均比特率(ABR)和变动比特率(VBR).

固定比特率(CBR)
这是一种固定编码模式,也是最基本的模式 在这种模式中,比特率在整个文件中保持一致。 这就意味着你的mp3文件中的每一部分将在压缩是使用相同的位数。 编码一段复杂的音乐片段或是简单的音乐片段的时候,编码器将使用相同的比特率,所以这段mp3的音质是变动的。 复杂部分的音质将低于简单部分的。 这种模式的最大优势在于文件最终的大小不会变动而且可以精确计算出。

平均比特率(ABR)
在这种模式下,你可以制定一种预定的比特率,编码器将试着不断维持这种平均比特率同时在你的音乐的某些片断需要更高数位压缩的时候使用较高的比特率。 这种编码的音质将比CBR编码好,而且最终文件的平均大小仍然可以预测,因此比起CBR模式,我们高度推荐这种编码模式。

变动比特率(VBR)
在这种模式中,你可以在0(高音质/低变形)至9(低音质/高变形)之间制定你希望的音质效果。 编码器在压缩你的音乐时选择最佳的比特数对应于其每一部分,从而尽可能维持整个文件符合说给定的音质。 这种编码模式的最大优点在于你能够指定你所希望达到的音质等级,但是问题在于这样将使最终的文件大小完全不可预知。

嵌入式预设指令

Lame 构造了一些嵌入式预设。 这些预设是为了提供尽可能最高的音质而设计的。
它们大多经历了严格的听觉测试调试与检测,并且实现了这一设计目的。 为了符合最新的发展,这些预设不断的更新,LAME将尽可能为你提供现在最佳的音质。

如果你对音质很苛求,强烈推荐你使用这些预设而非其它任何你可能使用的自定义参数。 如果要调用预设,请用以下格式:
lame --preset 预设名称

变动比特率模式
--preset medium
对于大多数人和大多数音乐来说,这种预设将提供几乎非常清晰的声音。
根据音乐的复杂程度,最终的压缩比特率将被控制在150-180kbps 之间。
--preset standard
对绝大多数人和音乐来说,这个预设通常会提供清晰的高音质的音乐。
根据音乐的复杂程度,最终的压缩比特率将被控制在170-210kbps 之间。
--preset extreme
如果你有一个金耳朵并且有相当好的播放设备,这种预设将能提供比"standard"模式稍微更好一点的音质。
根据音乐的复杂程度,最终的压缩比特率将被控制在200-240kbps 之间。
使用新的VBR算法的话,任何以上VBR预设也可以使用快速模式。 用这种模式编码将快一点,但它的音质将略微差一点。 如果要使用快速模式,请使用以下参数:
lame --preset fast preset_name

固定比特率 320kbps
--preset insane
这种预设通常远远高于决大多数人通常所需要的标准,但是如果你一定要追求这种绝对高的音质而且不在乎它所占用的文件大小,这是你的最好选择。 这是所有可用预设中最高音质的预设模式。

平均比特率模式
--preset <kbps>
使用这种预设将在指定比特率的基础上给你提供最佳音质。 根据你输入的比特率,该模式将为这个特定的要求决定最优参数设置。
在实现过程中,该预设不会像VBR模式一样灵活,而且在较高比特率时通常不会达到与VBR模式一样高的音质。
如果你想使用固定比特率模式编码,这些预设同样适用于CBR模式,请使用以下格式:
lame --preset cbr <kbps>

你可能感兴趣的:([素材资源] 音频格式)