[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on

Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on ResNet

  • 论文信息
  • 背景
  • 方法简介
  • 方法
    • Data processing
    • data splitting
    • data balancing
    • transfer learning
  • 结果分析

Based on ResNet)


论文信息

题目: IEEE JBHI-2021-Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on ResNet,
发表: IEEE JBHI,
作者: Yatao Zhang, Junyan Li, Shoushui Wei, Fengyu Zhou and Dong Li,


背景

这篇文章也是做的Heatbeat classification, Heatbeat classification可以看作是arrhythmia detection (心律检测)的一个重要步骤, . 具体来说:
Arrhythmia detection需要识别出节律信息,以及异常类型, 而Heart beat 时首先把信号分成一拍一拍的,然后去识别每一拍的类型, 这很明显是个分类问题. 基于Heartbeat classification的结果可以进一步结合规则去识别节律信息.

方法简介

这篇文章也是利用深度学习的方法,避免了特征的提取 (,实际上对于异常的心电信号,想要准确的识别特征点是非常困难的).

具体到方法层面, (1)基于HT-WVD变换将1-d signal转换为2-d time-frequency diagram, 利用了信号的时频信息, (2) 利用了pretrained ResNet-101进行 transfer learning;

实验方面, 作者依然使用了MIT-BIH, 并同时做了5-classes和14-classes的分类实验.

方法

下图就是所提方法的流程图:
[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第1张图片下面主要从Data processing, data splitting, data balancing, transfer learning几个方面进行进一步介绍,

Data processing

Question 1: 如何提取heatbeat ?
方法很简单, 首先识别处R (最容易识别, 文中采用的是著名的PT算法),然后取[R-100, R+150]的segment作为一拍的信息,每一拍对应一个样本.

Question 2: 如何将1d signal转化为2d time-frequency diagram ?
[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第2张图片可以看到转化的过程分为两步:
(1) 首先采用HT将真实信号转换为分析信号,
(2) 采用经典的WVD将分析信号进一步转化为2d time-frequency diagram;

下面这张图展示了如何将1d signal转化为2d time-frequency diagram,
[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第3张图片

data splitting

数据划分这块, 作者是按照逐class进行划分的, 具体来讲: 对于每个class的samples, 按照7:2:1的比例随机划分为training, validation, test set.

data balancing

类别Imbalance 是信号领域非常普遍的一个问题, 具体到Heartbeat classification中, Normal class的数量远远大于其他类别的样本数量, 其它类别之间的样本数量差异也很大.

作者采用了Oversampling + Undersampling 的方法来处理Imbalance.

处理前后不同classes的类别数量如下:
这个是5个类别的case:
[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第4张图片这个是14个classes的case:
[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第5张图片

transfer learning

将1d signal 转化为2d time-frequency diagram以后就可以直接使用CV中pretrained ResNet-101了,

网络这块, 对ResNet-101的最后三个layers进行了修改以满足分类任务, 具体修改如下:
[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第6张图片

结果分析

[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第7张图片结果如上, 感觉好多文章在MIT_BIH的的识别准确率已经很高了, 基本上都可以到98% ~ 99%, 再去准求那一点点准确率似乎已经意义不大.

这里我展示自己对于基于机器学习/深度学习的心律判定论文实验结果的一些批判性思考 (不是针对这篇论文哈):
(1) MIT_BIH对自动化心律判定这块产生了重要影响, 但是不得不承认该数据库很小, 因此基于该数据库展示的结果具有一定局限性;
最近,作者也注意到了一些新的数据库, 比如PTB-XL, PTB-XL++, 还有一些比赛(比如CPSC, CinC)公开的数据集,

(2) 类别数量是个问题, 好多文章都是基于MIT_BIH来进行实验, 然而具体到类别数量,五花八門, 有4,5,8, 10,12, 14,类别分类, 这给模型的对比和评估带来了挑战.

(3) 数据划分的问题
数据集的划分大致有两种思路:
i) 第一种时在Subject-level进行划分, 似乎有一个约定成俗的划分标准,
[论文评析]Heartbeats Classification Using Hybrid Time-Frequency Analysis and Transfer Learning Based on_第8张图片
ii) 在class层面进行划分, 这种划分的好处是可以保证: train/validation/test set之间类别分布的一致性, 然而其存在一个问题是: 同一的subject 的segments可能会同时存在于train/validation/test sets中, 存在data leakage的风险.

(4) 跨个体,跨域的泛化能力问题
还是那句话,虽然报道的结果那么好,然后其泛化能力究竟怎么样需要打个问号,

事实是很少有文章进行cross domain/dataset的评估,也就是所谓的External validation. 在这点上那些发在Nature各种子刊上面的文章做的特别好, 他们基本上都会在External dataset上进行泛化测试.

你可能感兴趣的:(Deep,learning,机器学习,深度学习)