解码一帧Layer3第5步:立体声处理 -- class Layer3的ms_stereo和i_stereo方法
MP3采用的立体声编码方式有中侧立体和强度立体声两种。
1.中侧立体声(Middle/Side stereo)简称MS_stereo,在这种模式中,用中/侧声道规格化值Mi/Si取代左/右声道的值Li/Ri,重建左/右声道的值Li/Ri用下述公式:
变换前Mi值在左声道,Si值在右声道。应用上述公式把Mi/Si频谱值变换为Li/Ri并放到左/右声道,就完成了中侧立体声解码。
2.强度立体声(intensity stereo) 在MP3编码一帧结束后,有损压缩把频谱中表现音乐细节的高频成份压缩掉了。为了保留频谱中的高频部分,把这些高频数据编码附加到频带的后面部分。以长块为例,用rzero_bandL保存非零哈夫曼值的频带数,则从rzero_bandL至21的频带为强度立体声的编码数据。
压制MP3时采用强度立体声编码,能提升音乐的细节,使压缩后的MP3听起来层次上更丰富。但是,很遗憾地告诉你,强度立体声是专利算法,受法律保护滴,很多MP3压缩器都没的这个功能,所以用强度立体声编码的MP3并不多见。
对采用强度立体声编码的MP3,是否其进行强度声解码,不是训练有素的耳朵,听不出差别,反正我在调试程序时硬就没听出关闭强度立体声解码前后的区别。ISO/IEC 11172-3不对混合块中的长块作强度立体声处理,但很多MP3解码程序都作了处理,源码中把处理混合块中的长块的强度立体声的代码注释掉了,如果你愿意的话,可以取消掉注释把它加进来。是否对混合块中的长块作强度立体声处理,我也听不出什么差别,音乐细胞不发达呀,尽管我很喜欢听。记得去年的某个时候,我把以前买的CD拿出来听,好久没听过了,特亲切。放CD没的MP3方便,于是上网一顿海搜,找到MP3压缩器的No.1--LAME,用VBR模式的128Kpbs--320Kpbs,540M的CD压缩至不到60M,听起来和CD没的什么差别,觉得MP3编码真是个好,于是又上网海搜,想了解下MP3的技术细节,但是很遗憾,其中泛泛而谈的多,深入介绍其细节的少。好奇心的驱使下,想搞明白MP3的那些事,很长一段时间,业余时间就耗这上面了。也是有感于很多涉及MP3解码的关键技术的论文,都不是免费的,我就想把我弄清的部分公开出来,算是一个科谱宣传吧(这话说的:)可能你比我还懂的多)。
联合立体声,请复习《(二)用JAVA编写MP3解码器——帧头信息解码》,对联合立体声(jiont stereo)作了简介。
【提示】以下代码是Layer3.java的一部分,应遵守《(一)用JAVA编写MP3解码器——前言》中的许可协议。
今天就说到这,下回再说,上源码。class Layer3内的立体声解码方法的源码如下:
//5. //>>>>STEREO=============================================================== /* * 在requantizer方法内已经作了除以根2处理, ms_stereo()内不再除以根2. */ private void ms_stereo() { int sb, ss; float tmp0, tmp1; int rzero_xr = (rzero_index[0] > rzero_index[1]) ? rzero_index[0] : rzero_index[1]; int rzero_sb = (rzero_xr + 17) / 18; for (sb = 0; sb < rzero_sb; sb++) for (ss = 0; ss < 18; ss++) { tmp0 = xr[0][sb][ss]; tmp1 = xr[1][sb][ss]; xr[0][sb][ss] = tmp0 + tmp1; xr[1][sb][ss] = tmp0 - tmp1; } rzero_index[0] = rzero_index[1] = rzero_xr; } private static float[][] lsf_is_coef; private static float[] is_coef; /* * 解码一个频带强度立体声,MPEG 1.0 */ private void is_lines_1(int is_pos, int idx0, int max_width,int idx_step) { float xr0; int sb32 = idx0 / 18; int ss18 = idx0 % 18; for (int w = max_width; w > 0; w--) { xr0 = xr[0][sb32][ss18]; xr[0][sb32][ss18] = xr0 * is_coef[is_pos]; xr[1][sb32][ss18] = xr0 * is_coef[6 - is_pos]; ss18 += idx_step; if (ss18 >= 18) { ss18 -= 18; sb32++; } } } /* * 解码一个频带强度立体声,MPEG 2.0/2.5 */ private void is_lines_2(int tab2, int is_pos, int idx0, int max_width,int idx_step) { float xr0; int sb32 = idx0 / 18; int ss18 = idx0 % 18; for (int w = max_width; w > 0; w--) { xr0 = xr[0][sb32][ss18]; if (is_pos == 0) xr[1][sb32][ss18] = xr0; else { if ((is_pos & 1) == 0) xr[1][sb32][ss18] = xr0 * lsf_is_coef[tab2][(is_pos - 1) >> 1]; else { xr[0][sb32][ss18] = xr0 * lsf_is_coef[tab2][(is_pos - 1) >> 1]; xr[1][sb32][ss18] = xr0; } } ss18 += idx_step; if (ss18 >= 18) { ss18 -= 18; sb32++; } } } /* * 强度立体声(intensity stereo)解码 * 公式: * lsf_is_coef -- coefficients for LSF intensity stereo,ISO 13818-3,sesion 2.4.3.2 * lsf_is_coef[0][i] = (1 / sqrt(sqrt(2)))^(i + 1) * lsf_is_coef[1][i] = (1 / sqrt(2)) ^(i + 1) * i=0..14 * * is_coef -- coefficients for intensity stereo,iso11172-3,sesion 2.4.3.4.9.3 * is_coef[i] = tan(i * (PI / 12)) * is_coef[i] = is_coef[i] / (1 + is_coef[i]) * i=0..6 */ private void i_stereo(final int gr) { if(objSI.ch[0].gr[gr].mixed_block_flag != objSI.ch[1].gr[gr].mixed_block_flag || objSI.ch[0].gr[gr].block_type != objSI.ch[1].gr[gr].block_type) return; GRInfo gr_info = objSI.ch[1].gr[gr]; //信息保存在右声道. int is_p, idx, sfb; if(objHeader.getVersion() == Header.MPEG1) { //MPEG 1.0 if(gr_info.block_type == 2) { //MPEG 1.0, short block/mixed block int w3; //int do_long = 0; //if(gr_info.mixed_block_flag == 1) // do_long = 1; for (w3 = 0; w3 < 3; w3++) { sfb = rzero_bandS[w3]; //混合块sfb最小为3 //if (sfb > 3) // do_long = 0; for (; sfb < 12; sfb++) { idx = 3*intSfbIdxShort[sfb] + w3; is_p = scfS[1][w3][sfb]; if(is_p >= 7) continue; is_lines_1(is_p,idx,intWidthShort[sfb],3); } } /*if(do_long == 1) { for (sfb = rzero_bandL; sfb < 8; sfb++) { is_p = scfL[1][sfb]; if(is_p < 7) is_lines_1(is_p,sfbIndexOfEndL[sfb],intWidthLong[sfb],1); } }*/ } else { //MPEG 1.0, long block for (sfb = rzero_bandL; sfb <= 21; sfb++) { is_p = scfL[1][sfb]; if(is_p < 7) is_lines_1(is_p,intSfbIdxLong[sfb],intWidthLong[sfb],1); } } } else { //MPEG 2.0/2.5 final int tab2 = gr_info.scalefac_compress & 0x1; if(gr_info.block_type == 2) { //MPEG 2.0/2.5, short block/mixed block int w3; //int do_long = 0; for (w3 = 0; w3 < 3; w3++) { sfb = rzero_bandS[w3]; //混合块sfb最小为3 //if (sfb > 3) // do_long = 0; for (; sfb < 12; sfb++) { idx = 3*intSfbIdxShort[sfb] + w3; is_p = scfS[1][w3][sfb]; is_lines_2(tab2, scfS[1][w3][sfb], idx, intWidthShort[sfb],3); } } //if(do_long == 1) // for (sfb = rzero_bandL; sfb < 8; sfb++) // is_lines_2(tab2, scfL[1][sfb], sfbIndexOfEndL[sfb], intWidthLong[sfb],1); } else { //MPEG 2.0/2.5, long block for (sfb = rzero_bandL; sfb <= 21; sfb++) is_lines_2(tab2, scfL[1][sfb], intSfbIdxLong[sfb], intWidthLong[sfb],1); } } } //<<<<STEREO===============================================================