一、Boll的改进谱减法基本理论
1979年,S.F.Boll提出一种改进的谱减法。主要的改进点如下。
(1)在谱减法中使用信号的频谱幅值或功率谱
改进的谱减公式为
噪声段的平均谱值为
当y=1时,算法相当于用谱幅值做谱减法;当y=2时,算法相当于用功率谱做谱减法。式中,a为过减因子;β为增益补偿因子。
(2)计算平均谱值
在相邻帧之间计算平均值:
利用Yi(k)取代Xi(k),可以得到较小的谱估算方差。
(3)减少噪声残留
在减噪过程中保留噪声的最大值,从而在谱减法中尽可能地减少噪声残留,从而削弱“音乐噪声”。
此处,max|NR(k)|代表最大噪声残余。
二、基本谱减法的实验
Boll的改进谱减法函数SpectralSubIm
名称:SpectralSubIm
功能:基于Boll的改进谱减法语音降噪。
调用格式:
output = SpectralSubIm(signal,wind, inc, NIS, Gamma, Beta)
说明:输入参数signal是输入的含噪语音信号;wind为窗函数或窗长;inc是帧移;NIS是前导无话段帧数;Gamma和Beta是算法参数。output是降噪后的信号。
函数代码如下:
function output=SpectralSubIm(signal,wind,inc,NIS,Gamma,Beta)
nwin=length(wind);
if (nwin == 1) % 判断窗长是否为1,若为1,即表示没有设窗函数
W = wind; % 是,帧长=wind
wnd=hamming(W);
else
W = nwin; % 否,帧长=窗长
wnd=wind;
end
nfft=W;
y=enframe(signal,W,inc)';
Y=fft(y,nfft);
YPhase=angle(Y(1:fix(end/2)+1,:)); %含噪语音的相位
Y=abs(Y(1:fix(end/2)+1,:)).^Gamma; %功率谱
numberOfFrames=size(Y,2);
N=mean(Y(:,1:NIS)')'; %初始的能量谱均值D(k)
NRM=zeros(size(N)); %噪声残余量最大值
NoiseCounter=0;
NoiseLength=9; %噪声平滑因子
YS=Y; %平均谱值
for i=2:(numberOfFrames-1)
YS(:,i)=(Y(:,i-1)+Y(:,i)+Y(:,i+1))/3;
end
for i=1:numberOfFrames
[NoiseFlag, SpeechFlag, NoiseCounter, Dist]=vad_LogSpec(Y(:,i).^(1/Gamma),N.^(1/Gamma),NoiseCounter); %基于频谱距离的VAD检测
if SpeechFlag==0
N=(NoiseLength*N+Y(:,i))/(NoiseLength+1); %更新并平滑噪声
NRM=max(NRM,YS(:,i)-N); %更新最大的噪声残余
X(:,i)=Beta*Y(:,i);
else
D=YS(:,i)-N; %谱减
if i>1 && i
信噪比计算函数SNR_Calc
名称:SNR_Calc
功能:计算信噪比。
调用格式:
snr=SNR_Calc(x,xn)
说明:输入信号x是输入的纯净语音信号;xn是输入的含噪信号。输出参数snr是计算的信噪比。
函数程序如下:
function snr=SNR_Calc(I,In)
% 计算带噪语音信号的信噪比
% I 是纯语音信号
% In 是带噪的语音信号
% 信噪比计算公式是
% snr=10*log10(Esignal/Enoise)
I=I(:)'; % 把数据转为一列
In=In(:)';
Ps=sum((I-mean(I)).^2); % 信号的能量
Pn=sum((I-In).^2); % 噪声的能量
snr=10*log10(Ps/Pn); % 信号的能量与噪声的能量之比,再求分贝值
案例、使用Boll改进的谱减法给带噪语音降噪
程序如下:
clear all; clc; close all;
[xx,fs]=audioread('C5_2_y.wav'); % 读入数据文件
xx=xx-mean(xx); % 消除直流分量
x=xx/max(abs(xx)); % 幅值归一化
SNR=10; % 设置信噪比
signal=awgn(x,SNR,'measured','db'); % 叠加噪声
snr1=SNR_Calc(x,signal); % 计算叠加噪声后的信噪比
N=length(x); % 信号长度
time=(0:N-1)/fs; % 设置时间刻度
IS=.15; % % 设置前导无话段长度
wlen=200; % 设置帧长为25ms
inc=80; % 设置帧移为10ms
Gamma=1; %幅度加权(改进谱减法的参数)
Beta=.03;
NIS=fix((IS*fs-wlen)/inc +1); % 求前导无话段帧数
output=SpectralSubIm(signal,wlen,inc,NIS,Gamma,Beta); % 调用SSBoll79函数做谱减
output=output/max(abs(output));
ol=length(output); % 把output补到与x等长
if ol
运行结果如下:
实验使用到的语音数据下载链接如下:
传统语音增强——最小方均(LMS)自适应滤波算法-数据集文档类资源-CSDN下载
参考文献:语音信号处理实验教程;梁瑞宇、赵力、魏昕(编著)