音频开发 -- 音频基础

一、音频播放流程

音乐播放器在播放音频时的流程:
1.读入音频文件,使用解码器将各种格式的音频文件解压,还原为原始的音频流。此阶段音质受解码器影响,当采用无损音频格式时不受任何影响。
2.对音频流进行预处理、均衡器、声音特效等操作。此阶段音质受播放软件、音效插件等影响。
3.将处理结果输出至声卡,由声卡进行数模转换,输出音频信号。此阶段音质受硬件影响,包括声卡、功放电路、播放设备等。

二、常见音频格式

音频文件的生成过程是将声音信息采样、量化和编码产生数字信号的过程,人耳所能听到的声音,是从最低的频率20HZ一直到最高的频率20KHZ,因此音频文件格式的最大带宽是20KHZ。根据奈奎斯特的理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音,所以音频文件的采样率一般在40~50KHZ,比如最常见的CD音质采样率44.1KHZ。

对声音进行采样、量化过程被称为脉冲编码调制(Pulse Code Modulation),简称PCM。PCM数据是最原始的音频数据,完全无损,所以PCM数据虽然音质优秀但体积庞大,为了解决这个问题先后诞生了一系列的音频格式,这些音频格式运用不同的方法对音频数据进行压缩,其中有无损压缩和有损压缩两种。

  • 无损音频格式:WAV
  • 无损压缩音频格式:APE、FLAC
    能够在保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。
  • 有损压缩音频格式:MP3、WMA、OGG
    有损音乐是利用了人类对声波中的某些频率成分不敏感的特性,允许音频数据压缩过程中损失一定的信息,虽然不能完全恢复原始数据,却换来了大得多的压缩比,可以极大减少存储空间。

常见音频格式

三、MP3文件结构

目前最为常用的音频格式是MP3,MP3是一种有损压缩的音频格式,设计这种格式的目的就是为了大幅度的减小音频的数据量,它舍弃PCM音频数据中人类听觉不敏感的部分。

MP3格式中的码率(BitRate)代表了MP3数据的压缩质量,现在常用的码率有128kbit/s、160kbit/s、320kbit/s等,这个值越高声音质量也就越高。MP3编码方式常用的有两种固定码率(Constant bitrate,CBR)和可变码率(Variable bitrate,VBR)。MP3格式中的数据通常由两部分组成,一部分为ID3用来存储歌名、演唱者、专辑、音轨数等信息,另一部分为音频数据。音频数据部分以帧(frame)为单位存储,每一个帧都有自己的帧头,其中存储了采样率等解码必须的信息,所以每一个帧都可以独立于文件存在和播放,这个特性加上高压缩比使得MP3文件成为了音频流播放的主流格式。帧头之后存储着音频数据,这些音频数据是若干个PCM数据帧经过压缩算法压缩得到的,对CBR的MP3数据来说每个帧中包含的PCM数据帧是固定的,而VBR是可变的。

MP3文件结构1
MP3文件结构2
MP3 tag相关

四、基本概念

  • 采样频率
  • 量化位数
  • 码率
  • 声道
  • 音轨
  • 声卡
  • MP3
  • HIFI

你可能感兴趣的:(音频开发 -- 音频基础)