256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评

主流有损音频格式横评

  • 转载声明
  • 一、准备工作
    • 1.1 Adobe Audition CS6 设置
      • 1.1.1配置说明
      • 1.1.2频谱图简介
      • 1.1.3测试音频的频谱图对比
        • a. 原wav文件的频谱图。
        • b. 无损FLAC的图片
        • c. 无损FLAC的对比图片
    • 2. Beyond Compare设置
      • 2.1 容差说明
    • 3. 注意事项
  • 二、256K大混战
    • 2.1 频谱图对比
      • a. MP3 VBR V0
      • b. Ogg q8.2
      • c. Nero aac vbr 0.69
      • d. Nero aac vbr q0.74
      • e. Nero aac vbr q0.75
      • f. Qaac tvbr 110
      • g. Qaac cvbr 256
  • 三、320K间的对决
    • 3.1 频谱图对比
      • a. Faac q500
      • b. mp3 cbr 320
      • c. Ogg q9.0
      • d. Nero aac vbr 0.83
      • e. Qaac tvbr 127
      • f. Qaac cvbr 320
  • 四、猜测与验证
    • 4.1 谁才是AAC最强?
    • 4.2 验证我们的猜测
      • a. Nero aac vbr 1.00
      • b. Nero aac abr 512k
      • c. Nero aac abr 2-pass 512k
      • d. Nero aac cbr 512k
    • 4.3. 结论
    • 4.4 有损极限的对决
      • a. Ogg q10
      • b. Opus vbr 512
  • 五、总结

转载声明

By 咣輝のま裔http://blog.sina.com.cn/u/1669168344
转载请注明作者信息,谢谢。
(原文图片挂了,另外排版不好看,我给修改下,如有冒犯请联系删除!)

一、准备工作

无聊做下各种音频格式的测试,发上来给大家分享下,独家首创,不喜勿喷,谢谢。

这次用到的工具主要有Adobe Audition CS6和Beyond Compare
需要软件的请自行网上搜索

1.1 Adobe Audition CS6 设置

首先,打开Adobe Audition CS6
256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第1张图片
在首选项里把频谱频率显示的分辨率选到最高,也就是16384,这样做能使频谱变得精致,更精确的反映音频的素质。

接着 右键右边的频率栏
256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第2张图片
选择完全线性,然后再选择 更多对数 5次左右。

1.1.1配置说明

虽然如果选择完全对数显示比较夸张,但是频率间的差距都是用对数来比较的,而不是差值。100hz和500hz;20100hz和20500hz之间都只差400hz,一个差距很大,一个只是差了一点而已。
大家平常都用着完全线性这种显示来鉴别无损等等,确实高频部分比较直观,但是如果用这个来体现有损音频的品质,就极其的不合适了。(自行脑补声学和对数。。。)
Audition提供了21个级别,如果说完全对数的显示方式为level 0 ,完全线性的显示方式为level 20的话,Audition cs5.5 和cs6默认的显示方式为level 7,也就是更接近于对数。而Audition 3 的默认是完全线性的。
一般来说为了直观的表现音频的整体素质,推荐设置为level 10 到level 15之间,而不是绝对线性这种不合适的设定。

So,我在这里设为level 15,希望大家一定要注意,别跟我说我后面的频谱有问题哦!!!

说到这里大家肯定觉得我又要开始看频谱了。

我只想说看频谱什么的都弱爆了。你能看出什么差距来么?高频被砍了一刀,中频坑坑洼洼。某某某这么小的码率,居然频谱如此好看,真是太强了。看似不错就真的不错了么?

1.1.2频谱图简介

这是一个音频数据的直观视图。横轴时间,纵轴频率,还用颜色的明暗展现了振幅的大小(声音的大小)声音的要素都在这里了,频谱足以从视觉的角度完全的展现音频的素质。
但是肉眼凡胎,跟你听音乐一样,除了特别明显的地方,你又能看出多少差别。某些看似不错的频谱隐藏着许多你看不出的差别。

1.1.3测试音频的频谱图对比

废话不多说,这次测试用的无损音频是 杜雯媞和王艺翔唱的 “雪”
这首歌属于男女对唱,频谱比较丰满,直达22k,有低潮,有高潮,高潮部分波形图直达0db,比较适合用来有损格式的测试。

a. 原wav文件的频谱图。

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第3张图片

b. 无损FLAC的图片

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第4张图片

c. 无损FLAC的对比图片

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第5张图片
图挂了?这黑压压的是什么?
这是WAV和FLAC频谱的对比图片,黑色表示没有差别

这图怎么来的?
首先用Adobe Audition 打开wav和flac文件,分别截取频谱图(用qq截得,能根据窗口截图,保证两次截图对齐),保存为无损格式(切记),比如bmp或者png。

2. Beyond Compare设置

接着要介绍我刚刚说的Beyond Compare。这是一个文件对比软件,能比较各种文件。自行搜索下载。
安装完以后,选择刚刚保存的wav和flac频谱的截图,右键比较即可。

打开后记得如下设置。
256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第6张图片
箭头处选上。

2.1 容差说明

表示允许的颜色差值最大值。最大255,即2的8次方减一,这涉及到位图的结构,我就不详细解释了。

总之,容差相当于你对声音大小的敏感程度。越低的码率,应该设置越大来便于观察。

为了保持一致性和可对比性,本文全部设为3。大家也可以设置成其他值观察对比。

3. 注意事项

最后提醒下各位,某些有损格式和wav在时间长度上有毫秒级的差别,这是为了对齐到某个时间长度照成的。这会使得频谱横轴不同,照成显示上的略微差别,虽然Audition CS6也可以打开各种有损格式,但我们还是应该自己手动转换回wav格式,这时时间长度会恢复。

好了FLAC打完酱油可以走了。。。

二、256K大混战

文件格式 大小 平均码率
MP3 VBR V0 6.85M 254 kbps
Ogg q8.2 6.96M 258 kbps
Nero aac vbr 0.69 6.93M 256 kbps
Qaac tvbr 110 6.72M 248 kbps
Qaac cvbr 256 7.01M 258 kbps

2.1 频谱图对比

接下来我要上各个有损格式的频谱跟原音频频谱的对比图片了,黑色表示基本没差,红色表示有差别,容差一律为3

a. MP3 VBR V0

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第7张图片
点评:同码率对比,mp3格式在4K以下表现最为优秀,4K以上逐渐削弱,到了16K以上削弱加剧。整体听感略微发闷。

b. Ogg q8.2

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第8张图片
点评:19K以后开始削弱,整体平衡,中规中矩,表现好于mp3

c. Nero aac vbr 0.69

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第9张图片

点评:10K以下的表现让人眼前一亮,10K到18k表现良好,18K以后基本切掉。如果你的纵轴是完全线性的,那你可能不会觉得Nero aac有多优秀。但在我看来,恰恰得益于抛弃了18k以上,使其在人耳敏感的部分发挥出了最佳的水平,推荐格式

最后再插一句,觉得听不到18k以上的童鞋,推荐用vbr q0.74,其18k以下的水准能达到vbr q0.82左右的水平。
觉得自己能听的到18K以上,又想频谱好看,又想体积小,就用vbr q0.75吧。

d. Nero aac vbr q0.74

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第10张图片

e. Nero aac vbr q0.75

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第11张图片

f. Qaac tvbr 110

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第12张图片

g. Qaac cvbr 256

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第13张图片
点评:首先要澄清一点,相同参数下qaac = qtaacenc = iTunes AAC。直接比较ACC文件的2进制值,除了文件头部的信息不同外,音频部分的数据完全相同。

有些童鞋说苹果用的是qtaacenc,苹果用的是qaac,等等,我想你们不要本末倒置了,qaac和qtaacenc充其量只是一个命令行前端(a command line frontend),真正负责编码的是QuickTime。所以相同参数下编出的音频完全一样是毫无悬念的。

相信看过本文早先版本的同学,肯定知道我使用旧版QuickTime照成的尴尬,我就不说了。还是更新到最新比较好。

Qaac tvbr和Qaac cvbr的区别就体现在低潮的水平上。Qaac cvbr的低潮表现更好一点(红点更少),当然这是多用了10 kbps的码率换来的,两者高潮部分一个红点不差,真的是一个红点也不差。

Qaac 在256k的表现胜过同码率的mp3和ogg。至于跟Nero acc比哪个强,我想各位看官心里都有自己的想法。我只告诉你,用耳朵去听吧,哪怕是心理安慰也好。如果连耳朵都分辨不出来,又何必在意这些呢?

三、320K间的对决

文件格式 大小 平均码率
Faac q500 8.04M 297 kbps
mp3 cbr 320 8.62M 320 kbps
Ogg q9.0 8.54M 317 kbps
Nero aac vbr 0.83 8.62M 318 kbps
Qaac tvbr 127 8.48M 313 kbps
Qaac cvbr 320 8.79M 324 kbps

3.1 频谱图对比

a. Faac q500

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第14张图片
点评:整体比较平庸,但细心观察你就会发现,1k以下水平明显变差,不过16k以上水平不错,结果就是,频谱肉眼看起来很好看。实际上1k以下明显比16k以上来得重要。
估计也就跟Qaac tvbr 110处于同一个档次,我实在是不敢恭维。

b. mp3 cbr 320

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第15张图片
点评:4k以下的还原依旧无敌,16K以上明显衰减,20K以上被截断。可以看作v0的升级版,谁说v0跟320k没差的?顺便鄙视那些看着频谱说着256k apple aac秒杀320k mp3的童鞋。

就听感来说同一编码器编出来的音频都比较相似,因为它们对高中低频段的取舍是一样的,码率就差在还原的精度与闸值上。

c. Ogg q9.0

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第16张图片
点评:依旧是中庸的表现,总体胜过前两者。ogg就是这样,比上不足,比下有余。

d. Nero aac vbr 0.83

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第17张图片
点评:ogg相对于Faac 和mp3来说表现已经很不错了,但跟Nero aac一比就分出了高下。相当优秀有木有?10k以下总是如此抢眼,弄的他10k以上都有点尴尬,其实10k以上表现也是不错的,推荐格式。

e. Qaac tvbr 127

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第18张图片

f. Qaac cvbr 320

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第19张图片
点评:这,这完全就是ogg的升级版。。。可怜的ogg一直给apple acc欺负。跟Nero aac比谁比较强呢?我只能说风格不同,两者互有胜负,旗鼓相当,难分高下。总之一句话,Nero aac都被推荐了,这没有不被推荐的理由,请看官自行选择

四、猜测与验证

4.1 谁才是AAC最强?

文件格式 大小 平均码率
Nero aac vbr 1.00 10.7M 396 kbps
Nero aac abr 512k 11M 407 kbps
Nero aac abr 2-pass 512k 13.2M 489 kbps
Nero aac cbr 512k 13.8M 512 kbps

在开始对比频谱之前,先跟我做个实验。

随机选20首无损,分别转换为对应格式的整轨,接着用rar最好模式进行压缩

文件格式 大小 RAR文件大小
WAV 864MB 598MB
Nero aac vbr 1.00 246MB 246MB
Nero aac abr 512k 251MB 251MB
Nero aac abr 2-pass 512k 301MB 251MB
Nero aac cbr 512k 314MB 218MB

WAV文件可以被压缩,大家都知道,这不是重点。
vbr 1.00和abr 512k 压缩前后大小基本不变,它们的码率是实打实的。abr 2-pass 512k 压缩后和abr 512k体积相当,可以想象他们实际水平差不多。亮点来了,cbr 512k压缩后体积最小,都能赶上WAV到无损的压缩比了。其实这很容易想象,cbr本来就是为网络传播的兼容性考虑的,算法上自然受到码率限制。而nero 的cbr算法并没有让那些低潮部分表现得更好,而只是做了简单的无用数据填充,来达到统一码率的目的。

问题:谁才是最强?
猜测:显然从压缩后的体积上看abr 512k和abr 2-pass 512k的表现会差不多。由于vbr面向质量的算法,不受最低码率的限制,理论上能达到最佳的音质体积比,效果上应该跟abr 512k处于同一水平。至于cbr 512k,估计是最差的,那臃肿的体积看了就心痛。

4.2 验证我们的猜测

a. Nero aac vbr 1.00

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第20张图片
点评:相当给力有木有,红点已经少到一种水平了,绝不是上面那些320k码率能够匹敌的。

b. Nero aac abr 512k

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第21张图片
点评:虽然红点的位置有所不同,但你能看出哪个更强一点么?反正我是觉得没什么差距。

c. Nero aac abr 2-pass 512k

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第22张图片
点评:点评同上,外加一句,这个增加的体积是在开玩笑么?

d. Nero aac cbr 512k

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第23张图片
点评:cbr 512k终于害羞的露出了它的真面目,弱爆了有木有?这就是现实,体积大不一定就是最好的,有时候还可能是最差的。其实很多时候你的耳朵已经无法分辨谁强谁弱了,而你的心理因素起了决定性作用。

4.3. 结论

Nero aac vbr 1.00是当之无愧的aac综合实力最强,我可以信心十足的告诉你。
vbr笑道:cbr 512k那丫就是战5渣。
vbr众人附和道:cbr 512k什么的弱爆了。
cbr 512k党辩到:这一定是图形的载入方式不对。。。

4.4 有损极限的对决

文件格式 大小 平均码率
Ogg q10 12M 447 kbps
Opus vbr 512 12.9M 480 kbps

a. Ogg q10

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第24张图片
点评:除了20k以上淡淡的一条线以外,整体都没什么红点了,称不上完美,但也不是那么好超越的。
是谁说的faac q500跟ogg q10体积差一倍的,水准却差不多来着?一个码率300 kbps左右,一个450 kbps左右好么。差距明显么?那还真明显,当然faac高频频谱党眼力有限,分辨率再提升10倍也许能够察觉到。

b. Opus vbr 512

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评_第25张图片
点评:12k以下基本黑丫丫一片,我和我的小伙伴都惊呆了。12k到20k跟nero aac vbr q1.00的水平接近。20k以上人耳已经听不见,一律一刀切,这成了高频频谱党最大的遗憾,哈哈哈。

顺便说下,这是从opus 48KHz转回44.1KHz后的对比。因为opus会把音频转为48KHz,当然这并不会照成多少失真,从上面的对比图就可以看出来。

Opus是还在不断发展的格式,根据我的测试,各种码率下的综合表现与Nero aac vbr接近,当然除了那20k的一刀切。

五、总结

码率带来的音质的提升并不像你用肉眼从频谱中看到的那样,简单的弥补那些听不见的超声波,而是高中低全频段的整体提升带来的,这是一个量变到质变的过程。

最后,如果让我给你推荐一个音频有损编码方式的话,我推荐你用Nero AAC VBR或者Qaac tvbr,这也是本文得出的结论。超过400k码率我建议你直接听无损了吧(如果你把容差设为0的话,上面的对比图将惨不忍睹,当然这已经不是金耳朵的范畴了,这是神耳朵。对于神耳朵,只有无损能满足你)。

终于看完了,如果你觉得本文写的不错,看了之后有所收获,欢迎转载。

你可能感兴趣的:(音视频编码,音频编码)