差分mic学习笔记

1.2 几种beamforming技术:

1.nested subarray
2.broadband using narrow decomoisition
3.filter-sum and Frost structure

1.3 差分mic和filter-sum的区别:

1.差分mic是通过设计零点来进行波束设计,addictive arrays技术需要指定噪声场
2.差分mic是信号和信号的多级差分的线性组合
3.由于白噪声增益的限制,差分mic阶数一般不超过2阶
4.差分mic在方向性噪声场景下,分频点下理论上的结果和mvdr是很类似的

开公式:

1. 差分基本形式:

h1+ejwτ0h2=1h1+ejwτ0α1,1h2=0(36)(37) (36) h 1 + e − j w τ 0 h 2 = 1 (37) h 1 + e − j w τ 0 α 1 , 1 h 2 = 0

其中 $\tau_0$为mic间的最大时延; 只有一个变量 $\alpha_{1,1}$是未知变量,该变量确定之后 $h_1$$h_2$也就确定了;

2.

如果对$\tau_0$$\tau_0\alpha_{1,1}$进行替换为未知变量$\tau_1$$\tau_2$,也就是目标方向是延时$\tau_1$确定,零陷方向由$\tau_2$确定,如上公式变为:

h1+ejwτ1h2=1h1+ejwτ2h2=0(42)(43) (42) h 1 + e − j w τ 1 h 2 = 1 (43) h 1 + e − j w τ 2 h 2 = 0

扩展:

如上结果联想到最基本的阻塞矩阵,其和差分mic有较大的相似性,但基本阻塞矩阵对无论是信号还是噪声在低频部分都有比较大的抑制,这是由于忽略差分mic的高通特性造成的。

3.

这时和mvdr进行比较:

argminH(J(H))J(H)=HTΦNHh1+ejwτ1h2=1(53)(54)(55) (53) arg ⁡ min H ⁡ ( J ( H ) ) (54) J ( H ) = H T Φ N H (55) h 1 + e − j w τ 1 h 2 = 1

其中 $[h1,h2]=H$$\Phi_N$为噪声协方差阵,如果噪声协方差阵是由 $\tau_2$决定的,那么此时mvdr和上面的讨论应该是很类似的;

问题:

根据文献:In contrast to additive arrays, DMAs assume the end-fire direction as the main-steering direction.This means that the main lobe (θ = 0◦) lies on the microphone array axis. With DMAs onlyphysically steering is possible, because electronically steering affects the shape of the beam pattern.

  2和3有着很类似的数学表示,为什么在差分mic下需要指定end-fire方向为端射方向.

18-03-03更新

对于如上问题,通过对2的仿真,可以做出如下的回答:
文章中提到这是物理的限制,从自己目前的已有知识对此观点仍然不理解,不过仔细看2中的公式,方程组只是对变量$\tau_1$$\tau_2$进行了设定,可以保证如上约束下方程求解成立,然而对于其他方向的声音的约束并体现不出来,也就是其它方向可能有增益很大的情况都是无法体现的;废话不多说,直接上波束图和代码:

function h = NullFormingDiff()
    micPos = [0.0,0.0,0.0;
              0.01,0.0,0.0];
    disT = norm(micPos(1,:) - micPos(2,:),2);
    c = 343;
    fs = 8000;
    frame = 512;
    tauA = disT/c;
    w =(0:fs/frame:fs/2-fs/frame)*2*pi;
    kd = w*tauA;
    tau = 0;
    cosTheta =-1:2/180:1-2/180;
    cosTheta = [cosTheta cosTheta(length(cosTheta):-1:1)];
    Hd = 1i*bsxfun(@times,repmat(kd/2,[360,1]),repmat(tau/tauA + cosTheta',[1,256]));
    logHd2 = 10*log10(abs(Hd));
    wc = pi/(tauA+tau);
    Weq = 1./(sin(pi/2.*w/wc));
    HdWeq =bsxfun(@times,Hd,Weq);
    logHdWeq2 = 10*log10(abs(HdWeq));

    alfha11 = -1;
    i = 1;
    for k = (0:4000/257:4000-4000/257)
        w = k*2*pi;
        h(i,:) = 1i/((alfha11 - 1)*tauA*w)*[1 -exp(1i*w*tauA*alfha11)];
        i = i + 1;
    end
    h(1,:) = 0;
    i = 1;
    w =(0:4000)*2*pi;
    for i = 1:361
        cosTheta = cos(i/180*pi);
        Bwtheta(:,i) = 1i./((alfha11 - 1)*tauA*w).*(1 - exp(-1i*w*tauA*(cosTheta-alfha11)));
        i = i + 1;
    end      

    tau1 = 1/2*tauA;
    tau2 = -1/2*tauA;
    for i = 1:361
        cosTheta = cos(i/180*pi);
        Bwtheta(:,i) = exp(-j*w*tau2)*1./(exp(-j*w*tau2)-exp(-j*w*tau1))+...
            exp(-j*w*tauA*cosTheta)./...
        (exp(-j*w*tau1)-exp(-j*w*tau2));
        i = i + 1;
    end   

end

$\tau_1 = 1/2*\tau_A$$\tau_2 = -1/2*\tau_A$的情况下波束图为:

从波束图中反映出的现象是在0度方向也就是端射方向波束增益达到为1.5,也就是在如2设计时并不能保证语音方向下($\tau_1$表征语音,约为60度,$\tau_2$表征噪声零陷,约为120度)增益最大,只是保证了此时不伤语音。

欢迎大家交流;
ltcxjtu,qq:1440935236

你可能感兴趣的:(speech)