语音预处理(二)

分帧加窗
MATLAB

%不同窗函数的显示
[x,Fs]=wavread('R.wav');  
N=50;
nn=0:(N-1);
subplot(311);
w = ones(N,1);                                          %矩形窗实现
stem(nn,w,'k')
xlabel('点数');ylabel('幅度');title('(a)矩形窗')

subplot(312);
 w = 0.54 - 0.46*cos(2*pi*(0:N-1)'/(N-1));     %汉明窗实现
stem(nn,w,'k')
xlabel('点数');ylabel('幅度');title('(b)汉明窗')
subplot(313)
w = 0.5*(1 - cos(2*pi*(0:N-1)'/(N-1)));     %汉宁窗实现
stem(nn,w,'k')
xlabel('点数');ylabel('幅度');title('(c)汉宁窗')

端点检测

filedir=[];                % 设置路径
filename='1.wav';   % 设置文件名
fle=[filedir filename];    % 构成完整的路径和文件名
[x,Fs]=audioread(fle);       % 读入数据文件
sound(x,Fs);
%%x=x(:,1);%单声道
wlen=200; inc=80;          % 给出帧长和帧移
win=hanning(wlen);         % 给出海宁窗
N=length(x);               % 信号长度
X=enframe(x,win,inc)';     % 分帧
fn=size(X,2);              % 求出帧数
time=(0:N-1)/Fs;           % 计算出信号的时间刻度
for i=1 : fn
    u=X(:,i);              % 取出一帧
    u2=u.*u;               % 求出能量
    En(i)=sum(u2);         % 对一帧累加求和
end
subplot 211; plot(time,x); % 画出时间波形 
title('语音波形');
ylabel('幅值'); xlabel(['时间/s' 10 '(a)']);
frameTime=frame2time(fn,wlen,inc,Fs);   % 求出每帧对应的时间
subplot 212; plot(frameTime,En)     % 画出短时能量图
title('短时能量');
 ylabel('幅值'); xlabel(['时间/s' 10 '(b)']);

语音预处理(二)_第1张图片

filedir=[];                       % 设置路径
filename='118.wav';          % 设置文件名
fle=[filedir filename];           % 构成完整的路径和文件名
[xx,Fs]=audioread(fle);             % 读入数据文件
x=xx-mean(xx);                    % 消除直流分量
wlen=200; inc=80;                 % 设置帧长、帧移
win=hanning(wlen);                % 窗函数
N=length(x);                      % 求数据长度
X=enframe(x,win,inc)';            % 分帧
fn=size(X,2);                     % 获取帧数
zcr1=zeros(1,fn);                 % 初始化
for i=1:fn
    z=X(:,i);                     % 取得一帧数据
    for j=1: (wlen- 1) ;          % 在一帧内寻找过零点
         if z(j)* z(j+1)< 0       % 判断是否为过零点
             zcr1(i)=zcr1(i)+1;   % 是过零点,记录1次
         end
    end
end
time=(0:N-1)/Fs;                  % 计算时间坐标
frameTime=frame2time(fn,wlen,inc,Fs);  % 求出每帧对应的时间
% 作图
subplot 211; plot(time,x); grid;
title('语音波形');
ylabel('幅值'); xlabel(['时间/s' 10 '(a)']);
subplot 212; plot(frameTime,zcr1); grid;
title('短时平均过零率');
ylabel('幅值'); xlabel(['时间/s' 10 '(b)']);

语音预处理(二)_第2张图片

function Seg=segment(signal,W,SP,Window)

% SEGMENT chops a signal to overlapping windowed segments
% A= SEGMENT(X,W,SP,WIN) returns a matrix which its columns are segmented
% and windowed frames of the input one dimentional signal, X. W is the
% number of samples per window, default value W=256. SP is the shift
% percentage, default value SP=0.4. WIN is the window that is multiplied by
% each segment and its length should be W. the default window is hamming
% window.
% 06-Sep-04
% Esfandiar Zavarehei

if nargin<3
    SP=.4;
end
if nargin<2
    W=256;
end
if nargin<4
    Window=hamming(W);
end
Window=Window(:); %make it a column vector

L=length(signal);
SP=fix(W.*SP);
N=fix((L-W)/SP +1); %number of segments

Index=(repmat(1:W,N,1)+repmat((0:(N-1))'*SP,1,W))';
hw=repmat(Window,1,N);
Seg=signal(Index).*hw;

相关的程序其他博客里有连载,没找到的话给我留言,我补充上

你可能感兴趣的:(语音预处理(二))