语音编码算法AMR NB , AMR WB 和AMR WB+的区别

网上有些分析AMR NB 和AMR WB区别的资料,为节省篇幅,就不一一转过来了,可以参考如下

http://www.rosoo.net/a/201101/10759.html

还有科技论文在线的:AMR-NB 与AMR-WB 语音编码标准技术的对比研究

不过我感觉这些对比都是对比的表面现象,没有对比AMR NB和AMR WB的本质不同,AMR NB和AMR WB语音编解码都是使用的是多码率宽带代数码激励线性预测ACELP(Algebraic Code Excitation Linear Prediction)。

 
AMR NB的语音带宽范围:300-3400Hz,8KHz采样
AMR WB的语音带宽范围: 50-7000Hz,16KHz采样
AMR-WB+的采样速率是在16~48 kHz之间。这使得它的语音带宽更宽(24 kHz)

AMR WB与AMR NB的不同之处在于AMR WB在16k取样率的运作,两个频率带50~6400Hz 和6400~7000Hz 进行编码,用来降低复杂度,将位算法集中到更重要的频率区。低频带使用ACELP算法进行编码。 添加几个特征来达到一个高的主观质量。 线性预测(LP)算法是在每隔20ms 的帧要进行一次线性预测算法,每5ms搜索一次自适应码本。这个过程是在12.8Kbs 速率下进行的.高频带是在解码器端使用低带和随机激励的参数重建的, 目的是调整与在声音基础上的低频有关的高
频带. 高频带的声频通过使用由低带LP 过滤器产生的LP 滤波器进行重建.

下面来看看AMR WB+,AMR WB+不像现有编码器仅采用单一算法,而是对处理语音和音效分别采用ACELP(Algebraic Code Excited Linear Prediction)编码技术和变换码激励(TCX)编码技术,这种混合模式能提供比AMR WB同更好的音频质量。
对于单声道编码, AMR WB+采用混合的ACELP/TCX编码模型。AMR WB+编解码器能接受单声道或立体声的输入信号,采样频率在16~48 kHz之间。单声道信号可分解成2个频带:一个是低频信号,采样率低至12.8 kHz,即AMR WB的内部频率;另一个则是高频信号,含有6.4 kHz以上的所有频率。混合的ACELP/ TCX编码模型应用于低频信号,并利用一种频宽延伸(BWE)法对高频信号进行编码,撷取出能代表频谱封包与增益的参数,信号经过量化后再传送至解码器。解码器会使用外推法求算出高频信号的结构。每个子帧都进行增益校正与运算,然后再进行传输,藉此确保低频带与高频带之间6.4 kHz衔接处的连续性。由于只传输少量的参数,因此BWE总比特率仅有0.8 Kb/s。
对于立体声编码,AMR WB+立体声编码和单声道编码一样会分割频带。低频带立体声信号编码采用一套新的半参数技术。两个声道经过压缩混合后形成一个单声道信号,再用上述的AMR—WB+核心编解码器进行编码。高频带部分(6.4 kHz以上)则在两个立体声声道上运用参数型BWE进行编码,这与对单声道信号的高频部分进行编码是一样的。编解码器能在6~48 Kb/s的比特率下运作,并能在更高的频率中支援所有可听的频谱。有别于在7 kHz频带下运作的AMR WB,AMR WB+能将编码频宽延伸至19 kHz。因此即使在语音信号上亦能发挥超越AMR WB的效能(AMR WB频宽14 kHz)。

 

你可能感兴趣的:(算法)