Android的音频系统的代码中,应用程序对每个音频流的音量做出调整后,最终会转换为一个系数K,所有的音频数据在输出到硬件之前,都要乘以系数K,只要应用程序发出调整音量的调用,中间层的Audio System就会重新计算系数K的值。对应用程序来说,音量控制通常都是按照线性进行调整的,比如对于具有15级音量的音频流来说,我们预期每级的音量变化都是相当的,也就是说:从第5级调到第6级,和从第7级调到第8级,我们期望人耳可以感觉到同样大小的音量变化。但是,在Android的代码中,我们看到了计算系数K的公式,它相当奇怪,代码位于frameworks/base/media/libmedia/audiosystem.cpp中:
/*****************************************************************************************************/
声明:本博内容均由http://blog.csdn.net/droidphone原创,转载请注明出处,谢谢!
/*****************************************************************************************************/
要理解上面代码中的公式,我们先要了解人耳的声心理学模型。根据人耳的声心理学的研究,人耳对声音大小的感知程度并不是线性的,而是呈对数关系。对数形式的单位是dB,在音频领域,通常我们会定义一个标准电平V0,那么电平X的转换公式是:
dB=20log(X/V0);
例如:我们给喇叭输出满负荷最大音量时的电平是1V,如果有15级音量,如果按线性进行调整,1/15 = 66.6mV,我们就得到每级音量的调整量是:
66.6mV,133.2mV,200mV,......,866.8mV,933.4mV,1000mV;
如果按照这个步长进行调整,人耳感觉到的音量变化就不是连续的。
另一种方式是按对数进行调整,在数字音频领域,通常0dB代表最大音量,0dB意味着不对数据进行任何的变换处理,输出等于输入,所以20log(V0/V0)=20log(1)=0dB。这意味着最大音量以下的dB值为一个负数,现在我们把1V认为是0dB,最低音量是-28dB,那么对应15级音量的dB值就是:
对应的电平值是( 使用公式Vx=10^(dB/20)*V0 ):-28dB,-26dB,-24dB,......,-4dB,-2dB,0dB;
39mV,50mV,63mV,......,630mV,794mV,1000mV;
线性音量和对数音量的调整曲线
回到Android的代码中,它也使用了对数的调节方式,它先是定义了每次调节音量的步长值为0.5dB:
static const float dBPerStep = 0.50f;
然后他定义了一个计算用的中间常数:
这个一开始有点难于理解,尤其是奇怪的系数:2.302585093。所有这些定义都是为了得到用于与音频数据相乘的系数K,Android中有多种音频流,每种音频流的默认音量调节步数都不一样,有的是7步,有的是5步,有的是15步,为了便于计算的统一,计算前都会先把相应的步数映射为0-100步之间,因为步长已经定义为0.5dB,所以各级音量对应的dB数如下:static const float dBConvert = -dBPerStep * 2.302585093f / 20.0f;
音量级别 | 0 | 1 | 2 | 3 | ...... | 97 | 98 | 99 | 100 |
dB数 | mute | -49.5dB | -49dB | -48.5dB | ...... | -1.5dB | 1.0dB | 0.5dB | 0dB |
很显然,知道了音量为哪个步数级别后,相应的dB值也会知道,那么我们要做的就是把dB值转换为系数K值,K值实际上就是公式dB=20log(X/V0)中的比值:X/V0,根据此公式反推,音量级别为volume对应的K值:
(1) dB = -dBPerStep * ( 100 - volume );
又因为:
把(1)式代入(2)式:(2) dB/20 = log(Vx/V0) = log(K);
(3) -dBPerStep * ( 100 - volume ) / 20 = log(K);
为了得到K,两边取以10为底的指数:
使用(6)式即可得到系数K,需要计算以10为底的幂,可是这与Android使用的计算公式有些差异,Andrioid使用的公式是:(4) 10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) = 10 ^ ( log(K) );
(5) K = 10 ^ ( log(K) ) = 10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) ;
(6) K = 10 ^ ( dBConvert * ( 100 - volume ) ) ; // 令:dBConvert = -dBPerStep / 20;
这是因为它没有使用以10为底的幂运算,而是使用以自然常数e为底的幂运算,因为:(7) exp(float(100 - volume) * dBConvert);
我们把dBConvert 重新定义为-dBPerStep * 2.302585093/ 20后,式子(6)和式子(7)实际上是完全等价的。也就是说:(8) ln( 10) = 2.302585093;
这下终于知道2.302585093这个奇怪数字的来历啦!!从代码的注释中,我们可以知道,只要改变dBPerStep的大小,就可以决定系统的最小音量了:(9) e^2.302585093 = e^ln(10) = 10;
至于最大软件数字音量,就是0dB,不能改变,要改就修改底层的音频驱动的硬件音量吧!!最小音量 = -99 * dBPerStep;默认情况下是-49.5dB,K值为:0.00334965439;