音频开发 -- 音频基础

一、音频播放流程

音乐播放器在播放音频时的流程：
1.读入音频文件，使用解码器将各种格式的音频文件解压，还原为原始的音频流。此阶段音质受解码器影响，当采用无损音频格式时不受任何影响。
2.对音频流进行预处理、均衡器、声音特效等操作。此阶段音质受播放软件、音效插件等影响。
3.将处理结果输出至声卡，由声卡进行数模转换，输出音频信号。此阶段音质受硬件影响，包括声卡、功放电路、播放设备等。

二、常见音频格式

音频文件的生成过程是将声音信息采样、量化和编码产生数字信号的过程，人耳所能听到的声音，是从最低的频率20HZ一直到最高的频率20KHZ，因此音频文件格式的最大带宽是20KHZ。根据奈奎斯特的理论，只有采样频率高于声音信号最高频率的两倍时，才能把数字信号表示的声音还原成为原来的声音，所以音频文件的采样率一般在40~50KHZ，比如最常见的CD音质采样率44.1KHZ。

对声音进行采样、量化过程被称为脉冲编码调制（Pulse Code Modulation），简称PCM。PCM数据是最原始的音频数据，完全无损，所以PCM数据虽然音质优秀但体积庞大，为了解决这个问题先后诞生了一系列的音频格式，这些音频格式运用不同的方法对音频数据进行压缩，其中有无损压缩和有损压缩两种。

无损音频格式：WAV
无损压缩音频格式：APE、FLAC
能够在保存原文件的所有数据的前提下，将音频文件的体积压缩的更小，而将压缩后的音频文件还原后，能够实现与源文件相同的大小、相同的码率。
有损压缩音频格式：MP3、WMA、OGG
有损音乐是利用了人类对声波中的某些频率成分不敏感的特性，允许音频数据压缩过程中损失一定的信息，虽然不能完全恢复原始数据，却换来了大得多的压缩比，可以极大减少存储空间。

常见音频格式

三、MP3文件结构

目前最为常用的音频格式是MP3，MP3是一种有损压缩的音频格式，设计这种格式的目的就是为了大幅度的减小音频的数据量，它舍弃PCM音频数据中人类听觉不敏感的部分。

MP3格式中的码率（BitRate）代表了MP3数据的压缩质量，现在常用的码率有128kbit/s、160kbit/s、320kbit/s等，这个值越高声音质量也就越高。MP3编码方式常用的有两种固定码率(Constant bitrate，CBR)和可变码率(Variable bitrate，VBR)。MP3格式中的数据通常由两部分组成，一部分为ID3用来存储歌名、演唱者、专辑、音轨数等信息，另一部分为音频数据。音频数据部分以帧(frame)为单位存储，每一个帧都有自己的帧头，其中存储了采样率等解码必须的信息，所以每一个帧都可以独立于文件存在和播放，这个特性加上高压缩比使得MP3文件成为了音频流播放的主流格式。帧头之后存储着音频数据，这些音频数据是若干个PCM数据帧经过压缩算法压缩得到的，对CBR的MP3数据来说每个帧中包含的PCM数据帧是固定的，而VBR是可变的。

MP3文件结构1
MP3文件结构2
MP3 tag相关

四、基本概念

采样频率
量化位数
码率
声道
音轨
声卡
MP3
HIFI

音频开发 -- 音频基础

一、音频播放流程

二、常见音频格式

三、MP3文件结构

四、基本概念

你可能感兴趣的:(音频开发 -- 音频基础)