学习一篇关于MMSE的语音信号增强的算法

基于高斯分布的 MMSE 语音增强算法估计


帧移:帧移后的每一帧信号都有上一帧的成分,防止两帧之间的不连续。语音信号虽然短时可以认为平稳,但是由于人说话并不是间断的,每帧之间都是相关的,加上帧移可以更好地与实际的语音相接近。


加窗:由于直接对信号(加矩形窗)截断会产生频率泄露,为了改善频率泄露的情况,加非矩形窗,一般都是加汉明窗,因为汉明窗的幅频特性是旁瓣衰减较大,主瓣峰值与第一个旁瓣峰值衰减可达40db。


频谱泄露(截断效应):信号为无限长序列,运算需要截取其中一部分(截断),于是需要加窗函数,加了窗函数相当于时域相乘,于是相当于频域卷积,于是频谱中除了本来该有的主瓣之外,还会出现本不该有的旁瓣,这就是频谱泄露!为了减弱频谱泄露,可以采用加权的窗函数,加权的窗函数包括平顶窗、汉宁窗、高斯窗等等。而未加权的矩形窗泄露最为严重。频谱泄露就是分析结果中,出现了本来没有的频率分量。


先验信噪比:先可以是方差,一阶统计量是均值,二阶统计量方差对应能量,但是具体计算的时侯不一定非得用方差。 
后验 观测信号的能量(signal+noise)与noise能量的比值,当然这个noise的能量是你估计出来的,只是一个估计值。。。 
就是比如你观察到的信号是 signal+ noise,此时的signal 与noise的能量比就是先验信噪比,当然一般算的是signal的估计值与noise的估计值的能量比。 
当然这个值是根据你的观测矢量算出来的。那还有一个后验的信噪比,指的是观测信号与noise的能量比。 



MMSE算法:

利用已经有的观测量 估计估计量的取值,减小关于估计量的不确定性



估值:

利用已有的观测量的信息,

估计估计量的取值,

减小关于估计量的不确定性。
























均方误差最小的估值问题

 

均方误差最小的估值问题

 

ξ

η

是两个随机矢量,

两者存在联合分布,

η

是观察矢量,

通过

η

ξ

进行

估值,求均方误差最小的估值ξ。

 

{

}

Y

η

K

ξ

Y

η

)

(

η

ξ

ξ

=

=

=

/

min

/

ˆ

2

2

E

E

,其中

1

2

(

,

)

n

K

k

k

k

τ

=

,……,

为任意矢量。

你可能感兴趣的:(通信相关)