e ( n ) = d ( n ) − d ^ ( n ) = d ( n ) − w H u ( n ) = d ( n ) − u T ( n ) w ∗ J ( w ) = E { ∣ e ( n ) ∣ 2 } = E { e ( n ) e ∗ ( n ) } = E { ∣ d ( n ) ∣ 2 } − E { d ( n ) u H ( n ) } w − w H E { u ( n ) d ∗ ( n ) } + w H E { u ( n ) u H ( n ) } w = σ d 2 − p H w − w H p + w H R w e(n)=d(n)-\hat{d}(n)=d(n)-w^Hu(n)=d(n)-u^T(n)w^*\\J(w)=E\{|e(n)|^2\}=E\{e(n)e^*(n)\}\\=E\{|d(n)|^2\}-E\{d(n)u^H(n)\}w-w^HE\{u(n)d^*(n)\}+w^HE\{u(n)u^H(n)\}w\\=\sigma_d^2-p^Hw-w^Hp+w^HRw e(n)=d(n)−d^(n)=d(n)−wHu(n)=d(n)−uT(n)w∗J(w)=E{∣e(n)∣2}=E{e(n)e∗(n)}=E{∣d(n)∣2}−E{d(n)uH(n)}w−wHE{u(n)d∗(n)}+wHE{u(n)uH(n)}w=σd2−pHw−wHp+wHRw
\quad J ( w ) J(w) J(w)是凸函数,且开口向上。
\quad 如何求得最优权向量呢?因为 J ( w ) J(w) J(w)是凸函数,因此对 J ( w ) J(w) J(w)求导为0的结果就是答案。 Δ J ( w ) = − 2 p + 2 R w = 0 R w 0 = p 因 为 R 非 奇 异 , 最 优 权 向 量 w 0 = R − 1 p \Delta J(w)=-2p+2Rw=0\\Rw_0=p\\因为R非奇异,最优权向量w_0=R^{-1}p ΔJ(w)=−2p+2Rw=0Rw0=p因为R非奇异,最优权向量w0=R−1p
\quad 这就是最小均方误差准则——使误差的平均功率最小。
R w 0 = p → R w 0 − p = 0 E { u ( n ) u H ( n ) } w 0 − E { u ( n ) d ∗ ( n ) } = 0 E { u ( n ) [ u H ( n ) w 0 − d ∗ ( n ) ] } = 0 E { u ( n ) e o ∗ ( n ) } = 0 → E { u ( n − i ) e o ∗ ( n ) } = 0 Rw_0=p \rightarrow Rw_0-p=0\\E\{u(n)u^H(n)\}w_0-E\{u(n)d^*(n)\}=0\\E\{u(n)[u^H(n)w_0-d^*(n)]\}=0\\E\{u(n)e^*_o(n)\}=0\rightarrow E\{u(n-i)e^*_o(n)\}=0 Rw0=p→Rw0−p=0E{u(n)uH(n)}w0−E{u(n)d∗(n)}=0E{u(n)[uH(n)w0−d∗(n)]}=0E{u(n)eo∗(n)}=0→E{u(n−i)eo∗(n)}=0
当 R w 0 = p 时 J m i n = σ d 2 − p H w 0 = σ d 2 − w 0 H R w 0 = σ d 2 − w 0 H E { u ( n ) u H ( n ) } w 0 = σ d 2 − w 0 H E { [ w 0 H u ( n ) ] [ w 0 H u ( n ) ] ∗ } 当Rw_0=p时J_{min}=\sigma_d^2-p^Hw_0=\sigma_d^2-w_0^HRw_0\\=\sigma_d^2-w_0^HE\{u(n)u^H(n)\}w_0=\sigma_d^2-w_0^HE\{[w_0^Hu(n)][w_0^Hu(n)]^*\} 当Rw0=p时Jmin=σd2−pHw0=σd2−w0HRw0=σd2−w0HE{u(n)uH(n)}w0=σd2−w0HE{[w0Hu(n)][w0Hu(n)]∗}
\quad J m i n = σ d 2 − E { ∣ d ^ ( n ) ∣ 2 } = σ d 2 − σ d ^ 2 J_{min}=\sigma_d^2-E\{|\hat{d}(n)|^2\}=\sigma_d^2-\sigma_{\hat{d}}^2 Jmin=σd2−E{∣d^(n)∣2}=σd2−σd^2,最小均方误差就是期望响应的平均功率与最优滤波器输出的估计信号的平均功率之差。
\quad 利用维纳霍夫方程求解需要计算矩阵 R R R的逆,计算量大。沿着 J ( w ) J(w) J(w)的负梯度方向调整 w w w可以寻到最优权向量。 w ( n + 1 ) = w ( n ) + Δ w , Δ w = − 1 2 μ Δ J ( w ( n ) ) Δ J ( w ( n ) ) = − 2 p + 2 R w w ( n + 1 ) = w ( n ) + μ [ p − R w ( n ) ] w(n+1)=w(n)+\Delta w,\Delta w=-\frac{1}{2}\mu \Delta J(w(n))\\ \Delta J(w(n))=-2p+2Rw\\ w(n+1)=w(n)+\mu[p-Rw(n)] w(n+1)=w(n)+Δw,Δw=−21μΔJ(w(n))ΔJ(w(n))=−2p+2Rww(n+1)=w(n)+μ[p−Rw(n)]
\quad 如果步长因子满足 0 < μ < 2 λ m a x , λ m a x 为 R 的 最 大 特 征 值 0<\mu < \frac{2}{\lambda_{max}},\lambda_{max}为R的最大特征值 0<μ<λmax2,λmax为R的最大特征值,那么最陡下降法会逐步逼近极小值。
\quad 如果步长满足上述式子,则均方误差 J ( n ) J(n) J(n)关于时间 n n n是一个单调递减函数,且 l i m n → ∞ J ( n ) = J m i n lim_{n\rightarrow \infty} J(n)=J_{min} limn→∞J(n)=Jmin。
\quad 梯度下降算法缺点在于当 P , R P,R P,R确定时,迭代过程和结果就确定了;与输入信号变换无关,不具有自适应性。
\quad 在LMS中,用n时刻的瞬时估计值 R ^ = u ( n ) u H ( n ) , p ^ = u ( n ) d ∗ ( n ) \hat{R}=u(n)u^H(n),\hat{p}=u(n)d^*(n) R^=u(n)uH(n),p^=u(n)d∗(n)代替统计量 R , p R,p R,p,则可得 Δ ^ J ( n ) = − 2 p ^ + 2 R ^ w ( n ) = − 2 u ( n ) e ∗ ( n ) \hat{\Delta}J(n)=-2\hat{p}+2\hat{R}w(n)=-2u(n)e^*(n) Δ^J(n)=−2p^+2R^w(n)=−2u(n)e∗(n)
\quad LMS算法的收敛条件与普通梯度下降相同,即 0 < μ < 2 λ m a x , λ m a x 为 R 的 最 大 特 征 值 0<\mu < \frac{2}{\lambda_{max}},\lambda_{max}为R的最大特征值 0<μ<λmax2,λmax为R的最大特征值。
\quad LMS算法的统计特性
\quad 如果 μ \mu μ增大,收敛速度增大,但稳态性能 M M M变差。一般使用变步长,先大后小。
\quad 步长 μ ( n ) \mu (n) μ(n)随着 e ( n ) e(n) e(n)的变化而变换: μ ( n + 1 ) = α μ ( n ) + λ ∣ e ( n ) ∣ 2 \mu(n+1)=\alpha \mu(n)+\lambda|e(n)|^2 μ(n+1)=αμ(n)+λ∣e(n)∣2
\quad 可以有效避免LMS算法噪声放大的问题: w ^ ( n + 1 ) = w ^ ( n ) + μ ∣ u ( n ) ∣ 2 u ( n ) e ∗ ( n ) \hat{w}(n+1)=\hat{w}(n)+\frac{\mu}{|u(n)|^2} u(n)e^*(n) w^(n+1)=w^(n)+∣u(n)∣2μu(n)e∗(n)
\quad 为了提升计算时的数值稳定性: w ^ ( n + 1 ) = ( 1 − μ α ) w ^ ( n ) + μ u ( n ) e ∗ ( n ) , 0 < α < 1 / μ \hat{w}(n+1)=(1-\mu\alpha)\hat{w}(n)+\mu u(n)e^*(n),0<\alpha <1/\mu w^(n+1)=(1−μα)w^(n)+μu(n)e∗(n),0<α<1/μ
\quad 对任意的非奇异变换矩阵 T 1 ∈ C M ∗ M T_1\in C^{M*M} T1∈CM∗M作用于观测向量 u 0 ( n ) u_0(n) u0(n),有 z 1 = T 1 u 0 ( n ) z_1=T_1u_0(n) z1=T1u0(n)。对观测数据 u 0 ( n ) u_0(n) u0(n)进行可逆的满秩变换,不会改变维纳滤波器的估计输出和最小均方误差。
\quad 我们需要根据 h m = [ θ 1 , ⋯ , θ M − m + 1 ] h_m=[\theta_1,\cdots,\theta_{M-m+1}] hm=[θ1,⋯,θM−m+1]构造阻塞矩阵 B m B_m Bm,使得 B m h m = 0 B_mh_m=0 Bmhm=0,下图是一种构造:
\quad 基于观测数据统计特性的多级维纳滤波器权值递推中需要计算逆矩阵 R m − 1 R_m^{-1} Rm−1,这里给出无需计算逆矩阵的递推法。