音视频技术(二)音频编码

二、音频编码


1.压缩编码

        之前的文章中,我们提到过计算CD音质的数据采样,每分钟需要存储空间约为10.1MB。从存储的角度或者网络实时传播的角度,这个数据量都是太大了,对于存储和传输都是非常具有挑战的,所以我们需要通过压缩编码

2.压缩编码的可能性

        压缩编码的基本指标就是压缩比,压缩比通常小于1(如果等于或者大于1,是不是就失去的压缩的意义了,压缩目的就是为了减少数据体量).压缩算法分为2种,有损压缩和无损压缩.

无损压缩:解压后的数据可以完全复原.在常用的压缩格式中,用的较多的都是有损压缩.

有损压缩:解压后的数据不能完全复原,会丢失一部分信息.压缩比越小,丢失的信息就会越多,信号还原的失真就会越大.

压缩编码的原理实际上就是压缩冗余的信号.冗余信号就是指不能被人耳感知的信号.包括人耳听觉范围之外的音频信号以及被掩盖掉的音频信号.


人耳掩盖效应:

        主要表现在频域掩盖效应与时域掩盖效应.无论是在时域还是频域上,被掩盖掉的信息都认为是冗余信息,不进行编码处理

        掩蔽效应指人的耳朵只对最明显的声音反应敏感,而对于不明显的声音,反应则较不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。应用此原理,人们发明了mp3等压缩的数字音乐格式,在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段声音,而对于较高和较低的频率的声音则简略记录,从而大大压缩了所需的存储空间。在人们欣赏音乐时,如果设备对高频响应得比较好,则会使人感到低频响应不好,反之亦然。


3、无损编码、无损压缩编码和有损压缩编码有什么区别?

1.无损编码

        从本质上讲是无压缩的音频,可以获得更好的音频质量,并覆盖人耳可以听到的全部频率。

        未压缩音频文件最大的缺点是它的大小,一般一首歌曲通常在25-40 MB之间。一些便携式音乐播放器或设备可能不支持未压缩的音频格式。

优点:没有压缩,无损,完整的音频,对计算机性能上的占用小,更容易在后期工作中使用

缺点:文件很大,有些便携式设备可能不支持它


无损压缩编码

        “无损压缩”这个名字可能听起来像是一个矛盾的事情。我更喜欢将其解释为“节省空间的无损”。它先将音乐文件压缩,然后在播放过程中解压缩。这样可以缩小文件大小,但音频质量仍然无损,可实现全频率播放。

        无损压缩音频文件,可以是无损音频文件的1/2到1/3,甚至更小。无损压缩文件的缺点,是它更占计算机性能(与未压缩和压缩的有损相比。)它们还需要更多的计算机运算来进行解码。

优点:文件较小,无损

缺点:更占计算机性能


有损压缩

        压缩有损音频格式,可能是你在听音乐时使用的最常见的音频文件。(例如.MP3和.AAC。)这是因为压缩的有损音频文件在便携式设备中具有最大的支持,并且它们具有最小的文件大小(意味着你可以在更小的空间中,存储更多的歌曲。)

      但是,所有压缩都需要付出代价,与无损格式相比,有限的频率范围和明显的音频伪像,使音质大打折扣。有损压缩的音频文件,也不适合音乐循环,因为编解码器在文件的开头和结尾添加了短空格,循环会产生卡顿。

优点:最小的文件大小,广泛的播放支持

缺点:有损,音质差,不适合后期处理和编辑


当涉及到剪辑使用音频格式时,尽可能使用.WAV或.AIFF等未压缩格式是最好的选择。


4.常见的音频格式

无损的文件格式: .WAV,.AIFF

无损压缩文件格式: .FLAC,ALAC(Apple Lossless)

有损压缩文件式: .MP3,.AAC,.WMA,.OGG

WAV编码格式

WAV编码的一种实现方式(其实它有非常多实现方式,但都是不会进行压缩操作).就是在源PCM数据格式的前面加上44个字节.分别用来描述PCM的采样率,声道数,数据格式等信息.

特点:音质非常好。

适合场合:多媒体开发的中间文件,保存音乐和音效素材

MP3编码格式

MP3编码具有不错的压缩比,而且听感也接近于WAV文件,当然在不同的环境下,应该调整合适的参数来达到更好的效果.

特点:音质在128Kbit/s以上表现不错,压缩比比较高.大量软件和硬件都支持.兼容性高.

适合场合:高比特率下对兼容性有要求的音乐欣赏.

AAC编码格式

AAC是目前比较热门的有损压缩编码技术,并且衍生了LC-AAC,HE-AAC,HE-AAC v2 三种主要编码格式.

LC-AAC 是比较传统的AAC,主要应用于中高码率的场景编码(>= 80Kbit/s)

HE-AAC 主要应用于低码率场景的编码(<= 48Kbit/s)

特点:在小于128Kbit/s的码率下表现优异,广泛应用于互联网视频中

适合场景:于128Kbit/s以下的音频编码,多用于互联网视频中的音频轨的编码

Ogg编码格式

Ogg编码是一种非常有潜力的编码,在各种码率下都有比较优秀的表现.尤其在低码率场景下.Ogg除了音质好之外,Ogg的编码算法也是非常出色.可以用更小的码率达到更好的音质.128Kbit/s的Ogg比192Kbit/s甚至更高码率的MP3更优质.但目前由软件还是硬件支持问题,都没法达到与MP3的使用广度.

特点:可以用比MP3更小的码率实现比MP3更好的音质,高中低码率下均有良好的表现,兼容不够好,流媒体特性不支持.

你可能感兴趣的:(音视频技术(二)音频编码)