音频PCM介绍

一、音频基础知识

1)pcm文件:对声音进行采样、量化过程被称为脉冲编码调制(Pulse Code Modulation),简称PCM。PCM数据时最原始的音频数据,完全无损,所以PCM数据虽然音质优秀但体积庞大,为了解决这个问题先后诞生了一系列的音频格式,这些音频格式运用不同的方法对音频数据进行压缩,其中有无损压缩(ALAC、APE、FLAC)和有损压缩(MP3、AAC、OGG、WMA)两种。

2)声道数:即声音的通道数目,很好理解,有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的也处理成两个喇叭输出同一个声道的声音),立体声的PCM可以使两个喇叭都发声(一般左右声道有分工),更能感受到空间效果

3)采样位数:即采样值或取样值(就是将采样样本幅度量化)。它是用来衡量声音波动变化的一个参数,也可以说是声卡的分辨率。它的数值越大,分辨率也就越高,所发出声音的能力越强。在计算机中采样位数一般有8位和16位之分,但有一点请大家注意,8位不是说把纵坐标分成8份,而是分成2的8次方即256份,同理,16位是把纵坐标分成2的16次方,即65536份

4)采样频率:即采样率,指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多,由于人耳的分辨率很有限,太高的频率并不能分辨出来。在16位声卡中有224kHz、44kHz等几级,其中22kHz相当于普通FM广播的音质,44kHz已相当于CD音质了,目前的常用采样频率都不超过48kHz

5)存储量:即PCM文件所占容量,存储量=(采样频率*采样位数*声道*时间)/8(单位:字节数)

6)WAV:Waveform Audio File Format(WAVE,又或者是因为扩展名而被大众所知的WAV),是微软与IBM公司所开发在个人电脑存储音频流的编码格式,在Windows平台的应用软件收到广泛的支持,所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可认为WAV的音频流进行编码。WAV也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了,在Windows平台下,基于PCM编码的WAV是被支持的最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA

7)wav文件格式:在文件的前44字节放置标头(header),使播放器或编辑器能够简单掌握文件的基本信息,其内容以区块(chunk)为最小单位,每一区块长度为4字节

8)DAI:即Digital Audio Interfaces,数字音频接口,DAI表示在板级或板间传输数字音频信号的方式。相比于模拟接口,数字音频接口抗干扰能力更强,硬件设计简单

二、工作流程

1)AudioRecord完成音频PCM数据的采集

2)AudioTrack API完成音频PCM数据的播放

3)AudioRecord采集的PCM数据转换成wav文件

以上三个流程参考链接:https://blog.csdn.net/a13027629517/article/details/108429989?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_title~default-1.no_search_link&spm=1001.2101.3001.4242.2

你可能感兴趣的:(Linux/RTOS,音视频)