本文来源于MATLAB例程:Classify Time Series Using Wavelet Analysis and Deep Learning
关键词:ECG 迁移学习 GoogLeNet
实验环境
- 软件部分
本人使用的是MATLAB 2018b。官方文档提到GoogLeNet,AlexNet分别是在MATLAB 2017b、MATLAB 2017a版本引入的。
此实验必备的Toolbox:
1.Wavelet Toolbox
2.Image Processing Toolbox
3.Deep Learning Toolbox
4.Deep Learning Toolbox Model for GoogLeNet Network support package
5.Deep Learning Toolbox Model for AlexNet Network
其中,两个support package可能需要登录MATLAB账号才能下载,注册一个即可。
- 硬件部分
这里我用的是显卡是NVIDIA Geforce RTX 2080。实验可以用CPU跑,但最好还是使用GPU,快的不是一丁半点。
数据集
96条心律失常(ARR)数据
30条充血性心力衰竭(CHF)数据
36条正常窦性心律(NSR)数据
共计162条数据,下载地址,请点击链接
读取数据
代码如下:
dir = 'E:\Transfer_learning\ECG\ECG_Matlab\ECGdata';
load(fullfile(dir,'ECGData.mat'));
parentDir = dir;
dataDir = 'data';
helperCreateECGDirectories(ECGData,parentDir,dataDir)
读入数据后,工作空间生成了名为ECGdata的结构数组,如下图。Data为162✖65536维,即162条数据,每条数据时长为512s,采样率为128Hz。Labels存储了每条数据的标签。
显示原始数据
借助helperPlotReps()函数,绘制原始数据,如图。
特征提取
这里主要使用cwtfilterbank函数,将原始的一维心电信号通过连续小波变换(CWT)转换为时频域表达,即scalograms。代码和示例图如下:
%时频域表达,CWT连续小波变换
Fs = 128;
fb = cwtfilterbank('SignalLength',1000,...
'SamplingFrequency',Fs,...
'VoicesPerOctave',12);
sig = ECGData.Data(1,1:1000);
[cfs,frq] = wt(fb,sig);
t = (0:999)/Fs;figure;pcolor(t,frq,abs(cfs))
set(gca,'yscale','log');shading interp;axis tight;
title('Scalogram');xlabel('Time (s)');ylabel('Frequency (Hz)')
%生成各个病种的RGB图像,尺寸为224✖224✖3
helperCreateRGBfromTF(ECGData,parentDir,dataDir)
数据集的划分
%划分训练与测试数据集
allImages = imageDatastore(fullfile(parentDir,dataDir),...
'IncludeSubfolders',true,...
'LabelSource','foldernames');
% 80%作为训练,其余作为测试,随机种子设为默认,以便可重复。
rng default
[imgsTrain,imgsValidation] = splitEachLabel(allImages,0.8,'randomized');
disp(['Number of training images: ',num2str(numel(imgsTrain.Files))]);
disp(['Number of validation images: ',num2str(numel(imgsValidation.Files))]);
加载GoogLeNet并进行训练
GooLeNet
net = googlenet;
lgraph = layerGraph(net);
numberOfLayers = numel(lgraph.Layers);
figure('Units','normalized','Position',[0.1 0.1 0.8 0.8]);
plot(lgraph)%绘制结构图
title(['GoogLeNet Layer Graph: ',num2str(numberOfLayers),' Layers']);
GoogLeNet模型的参数修改
GoogleNet是使用ImageNet训练的对于1000分类的深层CNN网络,这里最后四层修改为针对三分类问题的输出。
lgraph = removeLayers(lgraph,{'pool5-drop_7x7_s1','loss3-classifier','prob','output'});
numClasses = numel(categories(imgsTrain.Labels));
newLayers = [
dropoutLayer(0.6,'Name','newDropout') % dropout概率60%
fullyConnectedLayer(numClasses,'Name','fc','WeightLearnRateFactor',5,'BiasLearnRateFactor',5) %全连接层,这里numClasses为3
softmaxLayer('Name','softmax')
classificationLayer('Name','classoutput')];
lgraph = addLayers(lgraph,newLayers);
lgraph = connectLayers(lgraph,'pool5-7x7_s1','newDropout');
inputSize = net.Layers(1).InputSize;
模型超参数设置及训练
参数设置和训练结果如下,最终的正确率为90.625%。ps.例程中做的训练过程动态图真的太赞了!
options = trainingOptions('sgdm',...
'MiniBatchSize',15,...
'MaxEpochs',20,...
'InitialLearnRate',1e-4,...
'ValidationData',imgsValidation,...
'ValidationFrequency',10,...
'ValidationPatience',Inf,...
'Verbose',1,...
'ExecutionEnvironment','gpu',...
'Plots','training-progress');
例程中后面的内容不再赘述,主要是探讨网络内部的结构。和下图所示的人脸识别的很相似。
底层网络:各种边缘结构
中层网络:眼睛,鼻子,嘴巴等局部特征
高层网络:将局部特征组合,得到各种人脸特征
后记
本文实验是将ECG转换为二维的时频域图作为网络输入,在arXiv上浏览文献发现有一篇文章做的工作很相似,贴在这里,是基于DenseNet做的迁移。
ECG Arrhythmia Classification Using Transfer Learning from 2-Dimensional Deep CNN Features