关于语音增强中混响与回声、近场与远场的区分

混响与回声

混响(Reverberation)与回声(echo)都是指声音经过反射后到达目标位置(人耳、录音设备等)并被接收的现象,但是它们之间有明显的区别。其中,混响一般是在室内等相对狭小空间内的反射现象,它多径效应明显,声音传递的路径复杂,且延时较小(小于50ms),反射声音与直达声音无法明显区分,但是会对声音产生拖尾衰减的效果。一般来讲,混响会使得语音清晰程度有所下降,但是一定程度的混响对音质有提升作用。混响设计是室内音响系统设计非常重要的参数。而回声则一般时在较开阔空间内的声音的反射,其延时较大,音素和音节能与直达语音清楚分离。回声对于音响系统的影响是负面的,因此需要避免。

近场与远场

对麦克风阵列来讲,近场和远场的语音传输模型是不一样的,一般远场模型为平面波,而近场模型为球面波,因此正确区分近场和远场是一件很有必要的事情。
对均匀线性阵列而言,若阵列孔径(相邻麦克风之间的距离)为 d ,声音信号中最高频率分量为 fmax ,声速为 v ,则有最小波长 λmin=vfmax ,则可定义阈值距离

dth=2d2λmin=2d2fmaxv
若声源与麦克风阵列中心点的距离 r 大于 dth 则为远场,反之则为近场。
不妨取 v=340m/s fmax=8kHz (对应 16kHz 采样),当 d=1cm (对应于单耳助听器)时有 dth4.7mm ,此时对于应用场景可全部作为远场处理。而当 d=20cm (对应于双耳助听器)时有 dth1.9m ,此时对于远场和近场应做区分处理。

你可能感兴趣的:(语音增强)