FAAC源码阅读(5)——AAC编码模块的功能

1、心理声学模型
心理声学模型主要利用了下面的声学原理:最小掩蔽阈值、临界子带频率分析、频域掩蔽、时域掩蔽和感知熵。心理声学原理把整个信号频带按照人耳的听觉特性划分出临界子带,然后计算出各临界子带的信噪比,并计算出各个临界子带的最小掩蔽阈值以及感知熵,从而计算出掩蔽比,根据掩蔽比对每个频带进行比特分配,掩蔽比的值大则分配的比特数多,反之则少。量化时,在保持相应音频质量和相应码率的同时,低于掩蔽阈值的量化噪声江北掩蔽掉,音频信号的冗余也得以除去。心理声学模型用在编码过程中,支队人耳可以听到的部分进行编码和传输,对人耳听不到的部分不编码。
2、增益控制
增益控制模块用在可分级采样频率框架中,他的主要作用是对输入信号进行增益控制,将信号做某个程度的衰减,降低其峰值大小,以减少前回声的发生。它由多相正交滤波器PQF、增益检测器和增益修正器组成。PQF把输入信号分离到4个相等带宽的频带中,除了最低频带不做增益控制外,其余频带利用增益检测或增益修改使能量控制或衰减,因为它能将声音信号做某种程度上的控制与衰减,使原来信号的能力范围变小。在MDCT之前,可以将信号看作较平稳的信号,可以降低前回声发生的机会。增益检测器将产生增益控制数据,包括需要进行调节的频段数、需要调节长短的数量、表示每段中增益调节位置和级别的索引;增益修正器对每个PQF频段的信号加窗,利用增益控制函数对这些信号进行增益控制。也就是说,在经过上述增益控制后,必须将其衰减变化得能力转换成增益控制参数,最后再将此参数传至解码器端。完成增益控制后,对应每个PQF子带的MDCT进行计算,器窗口长度是初始MDCT的1/4.解码器端也有增益控制模块,通过忽略PQF的高子带信号获得低采样率输出信号。
3、滤波器组(Filter Bank)
滤波器组的首要任务是把声音取样划分为段,利用时域滤波器改变这些分段的数据,使分段之间的转换更平滑。它把输入信号从时域变换到频域,这个模块采用了改进离散余弦变换MDCT(MDCT在理论上可以完全消除混叠)。
4、瞬时噪声整形TNS(Temporal Noise Shapping)
5、联合立体声编码(Joint Stereo Coding)
6、预测(Prediction)
7、量化器
8、无噪声编码
9、多比特转换

你可能感兴趣的:(FAAC源码阅读(5)——AAC编码模块的功能)