ICA 分类语音分离

独立成分分析(IndependentComponent AnalysisICA)是近年来提出的非常有效的数据分析工具,它主要用来从混合数据中提取出原始的独立信号。它作为信号分离的一种有效方法而受到广泛的关注。最早应用于盲源信号分离(Blind Source Separation,BBS)。


起源于“鸡尾酒会问题”,描述如下:

在嘈杂的鸡尾酒会上,许多人在同时交谈,可能还有背景音乐,但人耳却能准确而清晰的听到对方的话语。这种可以从混合声音中选择自己感兴趣的声音而忽略其他声音的现象称为“鸡尾酒会效应”。


这里我就举这个鸡尾酒会的例子用matlab实现

代码中实现了三个声音的随机混合,并利用fastICA算法进行信号复原,有兴趣的可以下来文件跑下


实现部分只用了3中声音

下载路径:http://download.csdn.net/detail/yeyang911/9139349



代码部分:

I1 = wavread('source1.wav');
I2 = wavread('source2.wav');
I3 = wavread('source3.wav');
subplot(4,3,1),plot(I1),title('输入信号1');
subplot(4,3,2),plot(I2),title('输入信号2');
subplot(4,3,3),plot(I3),title('输入信号3');

% 将其组成矩阵
II1 = I1';
II2 = I2';
II3 = I3';
S=[II1;II2;II3];    
Sweight=rand(size(S,1));      

MixedS=Sweight*S;     % 将混合矩阵重新排列并输出

subplot(4,3,4),plot(MixedS(1,:)),title('混合信号1');
subplot(4,3,5),plot(MixedS(2,:)),title('混合信号2');
subplot(4,3,6),plot(MixedS(3,:)),title('混合信号3');

% wavwrite(MixedS(1,:),8000,8,'1mixwav1.wav');%保存wav数据
% wavwrite(MixedS(1,:),8000,8,'1mixwav2.wav');
% wavwrite(MixedS(1,:),8000,8,'1mixwav3.wav');


MixedS_bak=MixedS;                  
%%%%%%%%%%%%%%%%%%%%%%%%%%  标准化  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
MixedS_mean=zeros(3,1);
for i=1:3
    MixedS_mean(i)=mean(MixedS(i,:));
end                                        % 计算MixedS的均值

for i=1:3
    for j=1:size(MixedS,2)
        MixedS(i,j)=MixedS(i,j)-MixedS_mean(i);
    end
end

%%%%%%%%%%%%%%%%%%%%%%%%%%%  白化  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

MixedS_cov=cov(MixedS');                    % cov为求协方差的函数
[E,D]=eig(MixedS_cov);                      % 对信号矩阵的协方差函数进行特征值分解
Q=inv(sqrt(D))*(E)';                        % Q为白化矩阵
MixedS_white=Q*MixedS;                      % MixedS_white为白化后的信号矩阵
IsI=cov(MixedS_white');                     % IsI应为单位阵            

%%%%%%%%%%%%%%%%%%%%%%%% FASTICA算法  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
X=MixedS_white;                            % 以下算法将对X进行操作
[VariableNum,SampleNum]=size(X);
numofIC=VariableNum;                       % 在此应用中,独立元个数等于变量个数
B=zeros(numofIC,VariableNum);              % 初始化列向量w的寄存矩阵,B=[b1  b2  ...   bd]
for r=1:numofIC
    i=1;maxIterationsNum=100;               % 设置最大迭代次数(即对于每个独立分量而言迭代均不超过此次数)
    IterationsNum=0;
    b=rand(numofIC,1)-.5;                  % 随机设置b初值
    b=b/norm(b);                           % 对b标准化 norm(b):向量元素平方和开根号
    while i<=maxIterationsNum+1
        if i == maxIterationsNum           % 循环结束处理
            fprintf('\n第%d分量在%d次迭代内并不收敛。', r,maxIterationsNum);
            break;
        end
        bOld=b;                          
        a2=1;
        u=1;
        t=X'*b;
        g=t.*exp(-a2*t.^2/2);
        dg=(1-a2*t.^2).*exp(-a2*t.^2/2);
        b=((1-u)*t'*g*b+u*X*g)/SampleNum-mean(dg)*b;
                                           % 核心公式
        b=b-B*B'*b;                        % 对b正交化
        b=b/norm(b); 
        if abs(abs(b'*bOld)-1)<1e-9        % 如果收敛,则
             B(:,r)=b;                     % 保存所得向量b
             break;
         end
        i=i+1;        
    end
%    B(:,r)=b;                                % 保存所得向量b
end

%%%%%%%%%%%%%%%%%%%%%%%%%%  ICA计算的数据复原并构图  %%%%%%%%%%%%%%%%%%%%%%%%%
ICAedS=B'*Q*MixedS_bak;                     % 计算ICA后的矩阵

% 将混合矩阵重新排列并输出
subplot(4,3,7),plot(ICAedS(1,:)),title('ICA解混信号1');
subplot(4,3,8),plot(ICAedS(2,:)),title('ICA解混信号2');
subplot(4,3,9),plot(ICAedS(3,:)),title('ICA解混信号3');


% wavwrite(ICAedS(1,:),8000,8,'1dstwav1.wav');%保存wav数据
% wavwrite(ICAedS(2,:),8000,8,'1dstwav2.wav');
% wavwrite(ICAedS(3,:),8000,8,'1dstwav3.wav');

下面为显示效果图:

ICA 分类语音分离_第1张图片


你可能感兴趣的:(matlab)