《在近端对回传音频的检测和抑制》笔记

标签(空格分隔): 未分类


综述

这个专利是Polycom的一份国际专利,主要是目的是使用信号匹配的方法在远端/扬声器链路(farend)在做一次回声消除。
下面图2是其结构图。
《在近端对回传音频的检测和抑制》笔记_第1张图片
图2的结构图比现有的方案图1多了一个远端回声检测和消音模块。我们知道,扬声器20放出来的声音,经过声学回路11会产生回声,并且该回声会被麦克风40采集到。如果经过了回声消除器30,该回声没有被消除干净,出于对端16的通话者就会听到自己的回声。
现在,这么考虑一个情况和解决方案。在图片左边的人说话,如果对端16,没法处理好回声,那么在左边的人会从扬声器20听到自己的说话声。为了不让左边的说话人听到自己的回声(假设对端没有处理好),在图2中加入模块50。在模块50中使用可行的方法来检查该声音是否是左边说话人的声音,并对左边说话人的声音进行消除。达到消除回声的目的。Polycom专利描述的就是这个思想。

远端回声检测和消除

这个方案现在主要问题集中在如何检测远端传回来的回声。Polycom提出的检查流程如下:
《在近端对回传音频的检测和抑制》笔记_第2张图片
这个流程在专利中描述的比较详细,在此简单描述:
1、获取近端和远端信号,并对其使用滤波器组对其分频,把48k信号分成中心频率为400, 800,1200,1600, 2000hz的信号;
2、对这几个频率做20ms采样(获取一个点/是获取一段能量,没有理解文中的描述),获取相关能量;
3、在一定延时内,进行远近端能量的互相关分析,确定回传延时和时间。
4、处理回传回声(对其做相应的抑制)。

总结

这个方法目的是为了在左边人说话端做回声消除,克服一直以来回声消除只对别人有用的问题。但是这个专利有诸多妨碍它实现的客观问题。
1、编码器,解码器对音频损耗,这可能导致基于相关性的远端回声检测器失效;
2、如果通过了有损耗的网络,例如丢包,抖动存在,那么模块50计算的相关性会大打折扣;
3、由于一次端到端的rtt时间通讯时间(GSM 200-300ms, VoIP 400-1000ms)一般比较长,那么计算相关性的缓冲,和相关性计算精度都会受到限制。
因此,本专利使用应该比较受限。

你可能感兴趣的:(音频架构通用技术,声学回声消除,读书笔记,专利,回声消除,阅读笔记)