在学习语音增强材料的时候,第一章不讲其他,直接开门见山地为Sound Fields And Room Acoustics,主要讲述声波的传输、统计模型以及房间的脉冲响应和时空特性。声波传播模型、房间脉冲响应及时空特性是我研究生阶段的主要课程之一,还算比较熟悉,但统计模型就涉及到一些随机过程的知识了,我打包票,此方面绝对在我研究生课程Kuttruff的《室内声学》中学习过,奈何后来工作学习的过程中用到地方太少以致遗忘的太快,脑阔里一点关于此的存货也没有了。不幸的是,忘掉的这些恰巧对学习理解自适应滤波、维纳滤波、阵列原理等非常重要。好在,仍有机会重温复习,幸甚!
声传播的过程,即波动的过程,是一个涉及到空间、时间的物理过程。根据波阵面的不同,可以简单的做一些分类。常见的有球面波和平面波(还有线型声源扩散,波阵面为圆柱面)。很好理解,石头落入水中荡起的涟漪好比是球面波的横截面,其波阵面是球形。而平面波则更好理解了。两张图,下面左侧为球面波的截面,右侧为平面波的截面。
实际上我们身处的声学环境,大部分均是球面波声场,可认为发声源是一点源。但是,可以看到,当距离声源足够远时(左图两个黑点),圆弧近似看作为直线,此时认为左侧的场景同右侧一样,是为平面波。这就好比我们站在地球上,感觉不到地球上圆的一样。以上就是平面波假设,是我们研究阵列及其他一些算法的重要前提假设。
我们假设声场中任一点的信号是一个时空域的随机采样过程。描述声场中任意两点不同时刻信号之间的相关系数为两点信号相乘的期望,可以写作为:
而在匀强声场中,上述则可改写为:
在研究声场时,更一般的假设则是:静态且各向同性的,因此上述距离d 可以加个绝对值。
声场的空间交叉功率谱密度,直接借鉴随机信号的功率谱密度,由维纳钦金定理,信号的功率度密度等于信号自相关系数的傅立叶变换:
而归一化的空间交叉功率谱(Normalized Spatial Cross-PSD)写作:
上式,也即幅度均方相关系数(Magnitude Squared Coherence,MSC),用以描述空间声场的相关性:
1.当MSC = 1时,声场为Coherence Sound,完全相关声场
2.当MSC = 0时, 声场为Incoherent Sound,完全不相关声场,比如麦克风的底噪、电流噪音
有了上述,自然可以推导出平面波及球面波的MSC,球面波只取决于两点之间的距离,也即传播到两点的时差。而平面波则取决于两点之间连线与声波传播方向的角度。
一类比较特殊的声场——扩散场(混响室),其MSC:
这在后面求解阵列指向性因数的时候要一直用到。
可以看到
1.低频时,MSC近似为1,可以认为是空间相关声场,高频时MSC接近于0,可以认为是空间无关声场。
2.两点之间的距离是MSC的重要决定参数,这个是肯定的,几乎所有于频率有关的参数,都要牵涉到距离。毕竟距离与波长挂钩,而波长和频率成反比。
3.这种扩散声场近似可以认为是车内噪声场、后期混响场等典型声场。
其他的混合声场,都可以用上述模型进行加权逼近,不过用到的不多。
关于这部分,我其实算是科班出身,我研究生主攻建筑声学,其中一门重要的课程就是上述提到过的Kuttruff的《Room Acoustics》,授课老师即是鄙人之导师,所以备课预习格外认真,且老师授课方式很新颖,无论是授课方式还是教学内容,我都印象深刻,受益匪浅。所以,下面也不仔细说了,流水账翻一翻吧。
上图,左侧小人是声源,可以认为是喇叭,右边的小人是听众,可以认为是麦克风,麦克风接受到的信号除了直达声,还有经过墙面一次反射延后到达的一次反射声,经过墙面二次反射延后到达的二次反射声。。。
墙面反射一次(或者传播途径远),可以认为声波能量产生了一定比列的损失(乘以损失系数),延后到达即认为产生一次时延,假设声源发出的信号为 ,接收到的信号则为:
上式是不是和滤波器的差分方程很像?!没错,这就是房间的脉冲响应(Impulse Response),是房间传递函数在时域上的表现形式。别小瞧这个式子,时域卷积运算的时候为什么反转序列移序相乘再相加,参透上式即可得彀中玄妙。
下图1即是脉冲响应的时域形式,图2为其时谱图,是一个房间典型的脉冲响应。这个IR在房间声学里作用非常之巨大,是一切研究的基础,可由此导出非常多的建筑声学参量,比如混响时间、早期衰变时间、时间重心等等等,这部分可参考任一本建筑声学教材。。这部分就不多赘述了,属于数字信号处理的范畴,是基础知识。