最近在进行运动想象分类的时候想利用FBCSP(Filter Bank Common Sptial Pattern)进行特征提取,但在网上搜索一番都没有找到实现FBCSP的matlab代码,所以打算自己用matlab编码。
FBCSP是基于CSP(Common Sptial Pattern)的空域提取方法通过对频带分片加之特征选择算法实现的。
下面为FBCSP的原理图:
如上图所示,其中Stage 1为对频带进行切片;
Stage 2对切边后的各个子频带进行CSP滤波;
Stage 3对进行CSP滤波后的特征进行特征选择;
Stage 4对特征选择后的数据放到分类器里面分类。
用到的测试数据为BCIcomp2002的二分类运动想象数据集,因为官方给出的数据没有测试集标签,所以我把训练集及其标签拆分为100:40变为训练集和测试集,即前100个trials为训练集,后40个trials的数据用于测试,把分割后的数据保存到XY_data.mat中。其范式如下图所示:
因为代码写的比较创促,所以打算用参考文献[1]的互信息特征选择算法还没有写,打算以后补充上。分类算法用matlab的svm工具箱,其中-c设置为2,-g设置为0.1250,也尝试过用网格搜索法确定-c -g的参数但最后出来的效果似乎不是很好。运行结果如下所示:
主文件test.m
// An highlighted block
load XY_data.mat
train_data=x_train_new(128*4:end,:,:); %训练集(抛弃前4s)
train_label=y_train_new; %训练集标签
test_data=x_test_new(128*4:end,:,:); %测试集(抛弃前4s)
test_label=y_test_new; %测试集标签
sampleRate=128; %定义采样率
[result,proj,classNum]=FBCSP(train_data,train_label,sampleRate,2); %对训练集数据进行FBCSP
% result=MIfeature_select(result,k); %对所得训练集数据进行互信息特征选择
model=libsvmtrain(train_label,result,'-c 2 -g 0.1250'); %训练模型
fea=FBCSPOnline(test_data,proj,classNum,sampleRate,2); %对测试集数据进行FBCSP
%fea=MIfeature_select %对测试集数据进行MIfeature_select
libsvmpredict(test_label,fea,model);
FBCSP.m函数
%author:mao date:2020-10-8
%programme:the Filter Bank Common Sptial Pattern algorithm
%input:train_data 3维 EEG数据。其中,第一维是采样点,第二维是通道数量,第三维度是trials大小
% train_label train_data对应的标签
% sampleRate 采样率
% m CSP的m参数
%output:features_train 融合后各子频带后的特征数组
% projMAll 由各子频带计算所得的投影矩阵
% classNum 待分类的类别数量
function [features_train,projM_All,classNum]=FBCSP(train_data,train_label,sampleRate,m)
[q,p,k]=size(train_data);%获取总的trial次数
%% acquire and combine feature of different frequency bands
features_train=[]; %声明训练集csp特征融合数组
filter_data=zeros(size(train_data));
freq=[8 12 16 20 24 28 32]; %设置子频带频率
classNum=max(train_label); %获取类别数量
projM_All=zeros(p,p,max(train_label)*(size(freq,2)-1)); %申请个频带的拼接投影矩阵空间
for i=1:size(freq,2)
lower=freq(i); %获取低频
if lower==freq(size(freq,2))
break;
end
higher=freq(i+1);%获取高频
%对各子频带进行滤波
filter_tmp=[];
for j=1:k %对每个trial进行循环滤波,filter()函数可以滤波3维数据?
filter_tmp=filter_param(train_data(:,:,j),lower,higher,sampleRate,4);
filter_data(:,:,j)=filter_tmp;
end
% 计算csp滤波器,用csp滤波器进行特征提取
projM=cspProjMatrix(filter_data,train_label); %要循环保存投影矩阵用于在线CSP滤波
projM_All(:,:,1+(i-1)*classNum:i*classNum)=projM; %存储当前频带投影矩阵
feature=[]; %声明本子频带特征矩阵
for b=1:k %循环提取特征
feature(b,:)=cspFeature(projM,filter_data(:,:,b),m); %第三个参数m不要超过通道数的一半,不然会出现重复特征
end
tmp_data=feature;
features_train=[features_train,tmp_data]; %拼接个自频带特征矩阵
end
FBCSPOnline.m函数
%author:mao date:2020-10-8
%programme:the Filter Bank Common Sptial Pattern algorithm
%input:train_data 3维 EEG数据。其中,第一维是采样点,第二维是通道数量,第三维度是trials大小
% 2维 EEG数据。其中,第一位是采样点,第二维是通道数量
% projMAll 由训练集计算所得个子频带CSP投影矩阵
% classNum 待分类的类别数
% sampleRate 采样率
% m CSP的m参数
%output:features 融合后各子频带后的特征数组
function features_train=FBCSPOnline(train_data,projMAll,classNum,sampleRate,m)
if ndims(train_data)==3 %输入EEG数据为3维
%% acquire and combine feature of different frequency bands
[q,p,k]=size(train_data);%获取总的trial次数
filter_data=zeros(size(train_data));
features_train=[]; %声明训练集csp特征融合数组
freq=[8 12 16 20 24 28 32]; %设置子频带频率
for i=1:size(freq,2)
lower=freq(i); %获取低频
if lower==freq(size(freq,2))
break;
end
higher=freq(i+1);%获取高频
%对各子频带进行滤波
filter_tmp=[];
for j=1:k %对每个trial进行循环滤波,matlab中的filter()函数可以滤波3维数据?
filter_tmp=filter_param(train_data(:,:,j),lower,higher,sampleRate,4);
filter_data(:,:,j)=filter_tmp;
end
feature=[]; %声明本子频带特征矩阵
for b=1:k %循环提取特征
feature(b,:)=cspFeature(projMAll(:,:,1+(i-1)*classNum:i*classNum),filter_data(:,:,b),m); %第三个参数m不要超过通道数的一半,不然会出现重复特征
end
tmp_data=feature;
features_train=[features_train,tmp_data]; %拼接个自频带特征矩阵
end
else
%% 输入EEG数据为2维
features_train=[]; %声明训练集csp特征融合数组
freq=[8 12 16 20 24 28 32]; %设置子频带频率
for i=1:size(freq,2)
lower=freq(i); %获取低频
if lower==freq(size(freq,2))
break;
end
higher=freq(i+1);%获取高频
%对各子频带进行滤波
filter_data=filter_param(train_data,lower,higher,sampleRate,4);
feature=[]; %声明本子频带特征矩阵
feature=cspFeature(projMAll(:,:,1+(i-1)*classNum:i*classNum),filter_data,m); %第三个参数m不要超过通道数的一半,不然会出现重复特征
tmp_data=feature';
features_train=[features_train,tmp_data]; %拼接个自频带特征矩阵
end
end
filter_param.m滤波函数
%% 对数据进行滤波
%输入:data 待滤波EEG数据
% low 高通滤波参数设置
% high 低通滤波参数设置
% sampleRate 采样率
% filterorder butterworth滤波器阶数
%返回:filterdata 滤波后EEG数据
function filterdata=filter_param(data,low,high,sampleRate,filterorder)
%% 设置滤波参数
filtercutoff = [low*2/sampleRate high*2/sampleRate];
[filterParamB, filterParamA] = butter(filterorder,filtercutoff);
filterdata= filter( filterParamB, filterParamA, data);
cspProjMatrix.m (计算CSP滤波器)
function projM=cspProjMatrix(x,y)
%基于共空间模式算法计算出一个投影矩阵
%输入参数:
% x:3维 EEG数据。其中,第一维是采样点,第二维是通道数量,第三维度是trials大小
% y: 一维列向量标签 范围是从1到分类数量,长度与x的第三维保持一致
%注意:这里y标签只能从1开始,往后延,不能用-1 1这种标签格式
trialNo=length(y); %获取标签长度
classNo=max(y); %获取标签类别数量
channelNo=length(x(1,:,1)); %获取通道数量
for k=1:classNo %对每一类进行训练
N_a=sum(y==k); %number of trials for class k,当前类的trials数量
N_b=trialNo-N_a;
R_a=zeros(channelNo,channelNo); %申请[通道数量*通道数量] 方阵大小的空间
R_b=zeros(channelNo,channelNo);
for i=1:trialNo
R=x(:,:,i)'*x(:,:,i);
%R=cov(x(:,:,i));
R=R/trace(R);
if y(i)==k %当前类
R_a=R_a+R;
else %其他类
R_b=R_b+R;
end
end
R_a=R_a/N_a;
R_b=R_b/N_b;
[V,D]=svd(R_a+R_b); %矩阵奇异值分解
W=D^(-0.5)*V'; %P白化矩阵,P矩阵返回为W
S_a=W*R_a*W';
[V,D]=svd(S_a);
projM(:,:,k)=W'*V; %投影矩阵, 最后投影矩阵的大小为 [通道数量 通道数量 类别数量] 其中第三维度为每个类的滤波器
end
cspFeature.m (利用CSP滤波器进行过滤)
function feature=cspFeature(projM,x,m)
%%%%%%通过投影矩阵进行特征提取
% 输入参数:
% projM: csp投影矩阵
% x: 一个时间窗口的2维EEG数据。其中,第一维是采样点;第二维是通道
% m: 投影数据矩阵的第一列和最后一列的个数。
% 输出参数:
% feature: 从列向量中提取到的特征
classNo=length(projM(1,1,:)); %获取类别数量
channelNo=size(x,2); %获取通道数量
feature=[]; %声明特征矩阵
for k=1:classNo %classNo为类数量
Z=x*projM(:,:,k); %projected data matrix
for j=1:m
feature=[feature; var(Z(:,j)); var(Z(:,channelNo-j+1))]; %var(A) 算矩阵A没列方差,此时默认是除N-1
%variances of the first and last m columns(第1和最后m列的方差)
end
end
feature=log(feature/sum(feature));
[1] Ang K K , Chin Z Y , Zhang H , et al. Filter Bank Common Spatial Pattern (FBCSP) in Brain-Computer Interface[C]// IEEE International Joint Conference on Neural Networks. IEEE, 2008.