基于迁移学习的ECG分类

本文来源于MATLAB例程:Classify Time Series Using Wavelet Analysis and Deep Learning

关键词:ECG 迁移学习 GoogLeNet


实验环境

  • 软件部分

本人使用的是MATLAB 2018b。官方文档提到GoogLeNet,AlexNet分别是在MATLAB 2017b、MATLAB 2017a版本引入的。
此实验必备的Toolbox:
1.Wavelet Toolbox
2.Image Processing Toolbox
3.Deep Learning Toolbox
4.Deep Learning Toolbox Model for GoogLeNet Network support package
5.Deep Learning Toolbox Model for AlexNet Network
其中,两个support package可能需要登录MATLAB账号才能下载,注册一个即可。

  • 硬件部分

这里我用的是显卡是NVIDIA Geforce RTX 2080。实验可以用CPU跑,但最好还是使用GPU,快的不是一丁半点。

数据集

96条心律失常(ARR)数据

30条充血性心力衰竭(CHF)数据

36条正常窦性心律(NSR)数据

共计162条数据,下载地址,请点击链接

读取数据

代码如下:

dir = 'E:\Transfer_learning\ECG\ECG_Matlab\ECGdata';

load(fullfile(dir,'ECGData.mat'));

parentDir = dir;

dataDir = 'data';

helperCreateECGDirectories(ECGData,parentDir,dataDir)

读入数据后,工作空间生成了名为ECGdata的结构数组,如下图。Data为162✖65536维,即162条数据,每条数据时长为512s,采样率为128Hz。Labels存储了每条数据的标签。

基于迁移学习的ECG分类_第1张图片
ECGdata

显示原始数据

借助helperPlotReps()函数,绘制原始数据,如图。

基于迁移学习的ECG分类_第2张图片
原始数据示例图

特征提取

这里主要使用cwtfilterbank函数,将原始的一维心电信号通过连续小波变换(CWT)转换为时频域表达,即scalograms。代码和示例图如下:


%时频域表达,CWT连续小波变换

Fs = 128;

fb = cwtfilterbank('SignalLength',1000,...

    'SamplingFrequency',Fs,...

    'VoicesPerOctave',12);

sig = ECGData.Data(1,1:1000);

[cfs,frq] = wt(fb,sig);

t = (0:999)/Fs;figure;pcolor(t,frq,abs(cfs))

set(gca,'yscale','log');shading interp;axis tight;

title('Scalogram');xlabel('Time (s)');ylabel('Frequency (Hz)')

%生成各个病种的RGB图像,尺寸为224✖224✖3

helperCreateRGBfromTF(ECGData,parentDir,dataDir)

基于迁移学习的ECG分类_第3张图片
ECG的时频域表达

数据集的划分


%划分训练与测试数据集

allImages = imageDatastore(fullfile(parentDir,dataDir),...

    'IncludeSubfolders',true,...

    'LabelSource','foldernames');

% 80%作为训练,其余作为测试,随机种子设为默认,以便可重复。

rng default

[imgsTrain,imgsValidation] = splitEachLabel(allImages,0.8,'randomized');

disp(['Number of training images: ',num2str(numel(imgsTrain.Files))]);

disp(['Number of validation images: ',num2str(numel(imgsValidation.Files))]);

加载GoogLeNet并进行训练

GooLeNet

net = googlenet;

lgraph = layerGraph(net);

numberOfLayers = numel(lgraph.Layers);

figure('Units','normalized','Position',[0.1 0.1 0.8 0.8]);

plot(lgraph)%绘制结构图

title(['GoogLeNet Layer Graph: ',num2str(numberOfLayers),' Layers']);

基于迁移学习的ECG分类_第4张图片
GoogLeNet的网络结构图

GoogLeNet模型的参数修改

GoogleNet是使用ImageNet训练的对于1000分类的深层CNN网络,这里最后四层修改为针对三分类问题的输出。


lgraph = removeLayers(lgraph,{'pool5-drop_7x7_s1','loss3-classifier','prob','output'});

numClasses = numel(categories(imgsTrain.Labels));

newLayers = [

    dropoutLayer(0.6,'Name','newDropout')   %  dropout概率60%

    fullyConnectedLayer(numClasses,'Name','fc','WeightLearnRateFactor',5,'BiasLearnRateFactor',5)  %全连接层,这里numClasses为3

    softmaxLayer('Name','softmax')

    classificationLayer('Name','classoutput')];

lgraph = addLayers(lgraph,newLayers);

lgraph = connectLayers(lgraph,'pool5-7x7_s1','newDropout');

inputSize = net.Layers(1).InputSize;

模型超参数设置及训练

参数设置和训练结果如下,最终的正确率为90.625%。ps.例程中做的训练过程动态图真的太赞了!


options = trainingOptions('sgdm',...

    'MiniBatchSize',15,...

    'MaxEpochs',20,...

    'InitialLearnRate',1e-4,...

    'ValidationData',imgsValidation,...

    'ValidationFrequency',10,...

    'ValidationPatience',Inf,...

    'Verbose',1,...

    'ExecutionEnvironment','gpu',...

    'Plots','training-progress');

基于迁移学习的ECG分类_第5张图片
训练过程

例程中后面的内容不再赘述,主要是探讨网络内部的结构。和下图所示的人脸识别的很相似。

基于迁移学习的ECG分类_第6张图片
人脸识别算法中不同网络层提取的特征
  • 底层网络:各种边缘结构

  • 中层网络:眼睛,鼻子,嘴巴等局部特征

  • 高层网络:将局部特征组合,得到各种人脸特征

后记

本文实验是将ECG转换为二维的时频域图作为网络输入,在arXiv上浏览文献发现有一篇文章做的工作很相似,贴在这里,是基于DenseNet做的迁移。
ECG Arrhythmia Classification Using Transfer Learning from 2-Dimensional Deep CNN Features

你可能感兴趣的:(基于迁移学习的ECG分类)