(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》

《医疗物联网单导联心电波心房颤动检测研究》

  • 讲在前面
  • 摘要
  • 1.介绍
  • 2.准备工作
    • 2.1 符号
    • 2.2 问题公式
    • 2.3 便携式设备
    • 2.4 数据库
    • 2.5 性能评估算法
  • 3.数据预处理
    • 3.1 噪声移除
    • 3.2 数据集失衡
    • 3.3 标准化和其他问题
  • 4.特征集合
    • 4.1 特征提取
      • 4.1.1 洛伦兹散点图
      • 4.1.2 庞加莱散点图
      • 4.1.3 其他HRV特征
    • 4.2 特征选择
    • 4.3 特征提取技术
  • 5 AF检测的机器学习方法
    • 5.1 支持向量机
    • 5.2 决策树
  • 6 AF检测的深度学习
    • 6.1 CNN
    • 6.2 RNN
  • 7 讨论和公开问题
  • 8 总结
  • CRediT 作者贡献声明
  • 竞争利益声明
  • 我的观点
    • 1.算法补充:
      • 1.1 [MINA](https://github.com/hsd1503/MINA)
      • 1.2 [cinc17-paper](https://physionet.org/files/challenge-2017/1.0.0/papers/index.html)
      • 1.3 [大佬github](https://github.com/hsd1503?tab=repositories)

讲在前面

  • 一.笔者最近来搞心电信号了,当前算法框架就参考的这篇论文,来钻研一下这篇论文。说真的,搞ecg的人真的太少了;
  • 二.我设计了几种字体颜色用于更加醒目地表现关键的思想和主题:
    • 红色表示尚未理解透彻的一些概念
    • 蓝色表示对原来的理解做的一些修改或补充
    • 绿色表示此处需要参考的论文其他部分
    • 橙色表示本文的重要关键字
    • 紫色表示后续更新的内容
    • 我会用删除线将自己曾经不到位的理解进行删除

摘要

最近医疗物联网的进步使得连续的心率监测成为了一种时尚。ECG的单导联信号通过可穿戴服饰进行收集,同时通过一些智能的方法对心率进行自动识别。单导联的信号和其他一般的ECG信号不同,因为它具有很高的噪声、干扰,同时确实其他导联通道的信息。最近几年提出了很多通过单导联信号进行识别的算法。这篇论文系统的调查了从单导联ECG信号中反映房颤的SOTA级别的方法,展示了一些相关问题的数据库和性能算法,收集了数据预处理和特征提取的方法,同时对相关机器学习和深度学习方法进行了整理和摘要。特别要说的是,我们重新回顾了数据预处理的技术,并且罗列了最通用且高效的特征,这些都可以帮助开发者去进一步实现AF监测算法。最后,我们讨论了一些在AF识别上可能有用的想法。

1.介绍

CVDs指的是一些与心脏和血管相关的疾病,包括冠状动脉疾病、心脏衰竭、中风、心律失常和心肌病。根据WHO的数据,全世界每年有1790万人死于心血管疾病,尤其是美国,2016年84万人死于心血管疾病。而欧洲2017年则有390万人死于心血管疾病,而欧盟则有超过180万人,比例达到了45%和37%。临床病例证明了心律异常是最常见的心脏疾病,常见的心律异常包括室性早搏、房性早搏、房颤(AF)。其中,房颤最容易导致死亡,因为它与心脏病风险的增加是相关的,比如中风、心脏衰竭和冠状动脉血管疾病。从某方面讲,AF可以被认为是死亡和疾病发生的间接原因。之前的研究表明AF患病几率会随着年龄的增加而增加,85岁及以后的患病概率可增加至15%。所以,AF的早期检测筛查对于心脏病的防御和治疗是非常重要的,可以进一步减小心血管疾病的死亡率。
在AF检测领域,ECG是最常用的诊断工具。广泛使用的ECG设备包含了10个电极,其中6个被放置在胸部上(从V1到V6),而其他的电极会放在腿上和胳膊上,如图一所示:
图一:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第1张图片
因为需要电极对来构建波形,12导联的ECG因此被生产出来。特别的是,导联I、II、III和aVR、aVL、aVF是从位于胳膊和腿上的四个电极产生的,而另外六个则由胸部电极产生。在过去的一个世纪,这种导联信号在诊断AF上是一种重要工具。但是,很多AF病人通常是无症状的或者是仅有些非典型症状,这些都增加了AF检测的复杂度。因为房颤发作的一些属性,AF的检测要求使用一些设备进行长期的ECG跟踪,但是要把12导联的ECG设备或者可植入的设备穿戴变成一种时尚是不可能的。而且可植入设备的造价昂贵。得益于一些信号收集和数据挖掘技术,利用可穿戴设备进行舒适的ECG信号收集成为了一种备选方案。使用手指的多个点来创建单导联轨道,可插入的设备就可以收集到单导联ECG信号,然后通过网络进行传输,从而进行监测和分析。而现实环境中,医疗物联网就是一个将可插入设备、云端、客户端通过安全网络进行整合的有效工具,同时促进了安全的生理数据的收集,如图二所示:
图二:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第2张图片
最近几年,通过单导联信号推理是否有患房颤是一个火热的主题,多数人都相信它可以在未来为人提供智能健康服务。但是将12导联的AF检测算法用于单导联上,还缺乏实现。考虑到这个问题,CINC2017提出了从单一的简短的ECG单导联信号(30-60s)中检测AF的竞赛,这个竞赛已经提出了很多算法,也鼓励更多的人参与。
通常,基于特征提取的异常分类算法包括四个步骤,分别为:数据预处理、特征提取、特征选择和分类。值得注意的是特征提取和特征选择能够被保存进深度学习算法。整个检测的步骤图像化表示在图三中:
图三:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第3张图片
数据预处理是第一步,目的是去除噪声,同时为特征提取提供一个干净的信号。然后,特征提取技术会将信号转换为特征向量,一些特征就会用于进一步分类。在这篇论文中,我们给出了当前AF单导联检测的SOTA级别方法的调查结果和一些影响模型最终结果的两点。为了更加综合的进行调查,我们通过下面一些关键词进行了搜索:“‘single-lead ECG”、“‘‘atrial fibrillation”、“‘machine learning”、“‘deep learning”、“‘‘survey”、“review”。然后再通过不用关键词,根据内容摘要筛选,我们共搜索到了100篇相关论文。
这些论文的贡献摘要如下:

  • (1) 数据的预处理方法很全面,可以给进行ECG单导联信号处理的研究人员一些指引;
  • (2) AF领域最常用最有效的特征提取算法被列了出来,这样能很好的增强模型的精度;
  • (3) 提出了一些可能改善模型精度的潜在想法。

除此之外,这片论文其他的部分的内容安排如下:

  • Section 2 介绍了本文的预备知识,包括所讨论的 AF 检测问题的公式、数据库和性能指标;
  • Section 3 回顾了一些数据预处理的技术;
  • Section 5 是相关机器学习技术;
  • Section 6 是相关深度学习技术;

2.准备工作

2.1 符号

(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第4张图片

2.2 问题公式

一般情况下,窦房结会导致心房和心室的压缩,这些收缩在心电图上的表示就是PQRST的波峰,如图四
图四:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第5张图片
但是在AF中,有很多看起来很像心脏在颤动的收缩。AF会增加中风、心衰、冠状动脉疾病、全身性血栓等,同时会带来死亡率和患病率的剧增。因此,早期识别房颤对心血管疾病的治疗起着至关重要的作用。尤其是,每种心率异常都有自己的ECG信号特征。比如,房颤信号的表现为RR间隙不规则,而且p波消失,就像是在锯齿中隐藏了一个p波,就像图五中显示的一样:
图五:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第6张图片
受益于可穿戴设备的快速发展,单导联信号能被连续收集,同时又不至于太麻烦。苹果手表等产品是典型代表。怎么去发掘这些信号中存在的潜在的影响健康的信息,吸引了全世界范围内人员的注意,单导联AF检测也成为了一种火热的主题。但是单导联信号通常会有很高噪声、干扰、基线漂移。传统的12导联的算法不能直接应用在单导联上面,

2.3 便携式设备

Alivecor kardia是一个能够将智能手机收集到的医学信号转换成ECG信号,然后显示波形图的设备。它可以使用一种叫做FDA-clear的机器学习算法,获取30s医疗级别的ECG信号,然后进行分析和分享。你仅仅需要将手指放在传感器上,然后放在口袋里随身带着它。
Omron是一款便携的、袖珍的、无绳的可以检测类似于AF等异常的设备。它能够感知心律波形,同时生成一个30s的记录,无论是在手术室还是在家里,都可以通过这种方法分析潜在的心律异常。在那之后,它能分析收集到的ECG信号,同时提供一个高质量的信号表现在屏幕上。
Zenicor ECG是一款完整、简单的系统解决方案,它包含了两个部分,手持ECG设备和网页端设备。手持式心电图设备可以长时间记录心电图数据,从而可以检测到偶发性心律异常。 基于网络的服务用于存储、处理和呈现接收到的 ECG 数据。 我们的目标是提供一个全面的AF检测的算法的调查,以及潜在的可能影响模型性能的算法。我们把回顾的算法简洁的列入了表二中,我们会在接下来的部分进行分析。
表二:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第7张图片
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第8张图片
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第9张图片
在这里插入图片描述

2.4 数据库

随着AF单导联检测的流行,有些相关的数据库已经开源,表三中做有统计。
表三:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第10张图片

CINC2017:包含有12186个单导联ECG信号,每个信号持续时间为9s到60s。其中8528个信号用于训练,3658个信号用于性能评估。所有的ECG信号的采样频率为300Hz,并且已经被 AliveCor device进行了带通滤波。.hea包含了信息,.mat包含了标签和数据。这些ECG信号被专家分成了四种,分别为正常、房颤、噪声和其他心律。
MITDB:这个数据集直到现在都用于进行算法开发和评估心律异常检测器。这个数据集包含了48个完全标注的二通道ECG信号,来自47个不同的病人,采样频率为360Hz。每种数据都是被两个或者更多的医生标注的,所有的心跳被分成多余10种心律异常。
EDB:通常被用于ST和T波的分析,它包含了90个2小时、采样率为250Hz的二导联的信号。同时,临床的信息保存在.hea文件里面,每个信号被两个医生独立标注,包含了ST分割和T波模态、心律、信号质量的改变。值得注意的是,这个数据集都被贡献给了PhysioNet。
AHA:美国心脏协的数据集,它包含了两组每个心跳都标注,每组154个的2通道ECG信号。第一组被用于心律异常检测的研究,第二组被用于检查算法。所有的ECG信号采样率都为250Hz,已经被分成了8种类型,另外,ECG信号的长度是3h,但是只有最后30分钟进行了分类。
CCDD:是一些中国大学提出的,包括中科院、华东师大和厦门大学。它包含了179,130个带有心脏疾病标注的信号。每个标注都有两个医生独立标注,同时由第三方医生进行确认。

2.5 性能评估算法

通常有五个指标评估单导联AF检测器的性能:Acc、TNR、TPR、PPV和F1。所有的计算都基于TP、TN、FP和FN。另外,混淆矩阵会用于表示TP、TN、FP和FN的指标。而且,不同的论文专注于不同的指标,因为它们的目的、方向和应用都不同。例如,在专注于比较可穿戴设备筛选心脏病的能力的场景中,特异性和敏感性更重要,而F1值则由专注于开发ECG分类算法的研究选择。

  • 1.好的分类器有一个更高的准确率
    在这里插入图片描述
  • 2.特异性,也称为真阴性率,是被算法正确识别为阴性的阴性预测的比率。 它被定义为:
    在这里插入图片描述
  • 3.敏感度,也称为真阳性率或召回率,是在总体存在阳性的情况下被正确识别为阳性的阳性预测的比例:
    在这里插入图片描述
  • 4.精度是被正确识别为正的正预测与被识别为正的正预测的比率:
    在这里插入图片描述
  • 5.F1 值是灵敏度和精度的加权谐波平均值,可以通过以下等式获得:
    在这里插入图片描述

3.数据预处理

3.1 噪声移除

与12导联的ecg信号相比,单导联ECG信号因为通常由便携式设备收集,所有会有各种各样的噪声,比如肢体移动导致的基线漂移。据报道一个前置的降噪步骤会提升分类系统的精度,因此降噪是AF分类上的一个重要步骤。一些主要的降噪手段在表四中进行了列出:
表四:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第11张图片

CINC2017的数据由AliveCor进行收集,已经使用带通滤波器提取了0.5Hz和40Hz之间的信号,因此,一些竞赛的算法不能应用在这个上面,但是【71】的研究确是在信号预处理上面加了一个伪影滤波,通过对这些方法进行综合的考量,我们认为带通滤波器是最简单也最广泛使用的技术。
尽管带通滤波器是最流行的技术,但是每个论文中的截止频率都会有不同。在【74】中,使用了两个中值滤波来移除信号的基线漂移。在【60】中,先把信号重采样到300Hz,然后连续使用两个中值滤波器来抽取基线,随后,使用减法来移除基线漂移。在【67,76】中,使用FIR滤波器来移除噪声的伪影,截止频率设置为3Hz和45Hz。而【75,77】的研究都使用了巴特沃兹滤波器来进行数据预处理。【75】中使用了1Hz到25Hz的3阶巴特沃兹带通滤波器来移除基线漂移和高频噪声,截止频率的选择基于交叉验证。【77】使用10阶带通巴特沃兹滤波器(窄带5-45Hz,宽带1-100Hz),来移除噪声伪影。【48】使用5Hz-26Hz的带通滤波器来移除基线漂移和电源线影响,同时最大化QRS波的能量。所有的ECG信号都通过截止频率在1Hz和50Hz之间的滤波器过滤。
另一方面,高通滤波、低通滤波、以及一些组合也都被用于移除噪声和单导联伪影。【42,61】使用低通和高通滤波,【42】中使用截止频率为0.5Hz的IIR高通滤波器来移除基线漂移,另外使用截止频率为50Hz的IIR低通滤波来移除高频噪声和电源线接口噪声。【61】中使用巴特沃兹低通滤波和高通滤波来移除基线漂移。但是,【53】仅仅使用了截止频率为0.5Hz的高通滤波来移除基线的移动。另外,【41】使用了小波维纳滤波器和金字塔中值滤波器来移除噪声和基线漂移。【78】使用使用移动的均值滤波来移除基线漂移,【57】也使用移动的均值滤波器来提取低频噪声和基线漂移。尽管如此,一些噪声仍然存在于信号中,干扰了后续的分析。 因此,通过使用小波变换去噪并切断噪声过渡期,进一步降低了残余噪声。
除了移除噪声,ECG质量评估也是在进行分类前的一个重要步骤。ECG质量评估是PhysioNet的一个竞赛Computing in Cardiology Challenge 2011。出于这个目的,【43,61】都使用了信号质量评估来改善ECG信号的质量,【61】使用环形质量评估来移除被噪声污染的每个心跳的信号,剩余的高质量信号用于进一步处理。同样的,【43】把ECG分割10s的周期,然后对每个周期进行ECG质量评估,低质量的信号被丢弃,高质量的信号被用于特征提取。不同于之前这些方法,【79】的预处理阶段包含了数据再标注和导联反演,目的是移除ECG数据的质量。【51】使用稀疏导数分解和去噪算法来提高心电图信号的质量。

3.2 数据集失衡

训练和测试集的样本平衡是机器学习的一个重要部分,人群中有患AF的概率大概为2%,而公开数据集的AF样本也不平衡。CINC2017中的数据有738个AF信号记录,而正常心律记录是5050个,是AF信号记录的6倍多。这样的数据集肯定会影响分类模型的表现。
数据增强是一种广泛使用的解决这个问题的方法【80】,在这一部分,我们会对一些重要的数据增强算法进行摘要。【54】来使用合成少部分样本的过采样技术,来对少量数据的类别进行过采样。【58,72,77,78】通过增加少样本类别的样本数目来改善分类器的表现。出于同样的目的。【77】从其他数据集中选取了2000个10s的ECG信号,同时通过将现有的284个噪声信号分割组合成新的2000个信号,来生成更多的噪声信号记录。【58】researchers decided to add some surrogate data to the noisy and atrial fibrillation recordings by taking parts of signals already available and choosing a representativegroup of about 2000 recordings.【78】通过从各种渠道收集数据集来增大训练集和验证集。【72】从其他数据集中抽取数据来增大数据集,每个训练样本对损失函数的贡献随着其类别在整个数据集中占比而降低。

3.3 标准化和其他问题

其他的数据预处理问题主要包含了标准化和离群值处理,【61】使用Z-score归一化解决幅度缩放问题并消除偏移效应,而在【72】中,心电图被归一化为平均值为零和一个分割的标准偏差。【48,71】都使用了一种忽略掉离群值的方法,【71】通过 0.5 秒滑动窗口计算计算出的异常最大值和最小值来实现。 类似地,【48】中开发了一种排除异常尖峰的协议。

4.特征集合

4.1 特征提取

特征提取是识别领域一个非常重要的步骤,尤其是机器学习的信号分类领域。我们收集了一些对于ECG信号特征提取有用得方法。这些自动化的AF检测器,一般都基于RR间隙和P波消失。但是,在多噪声的信号中定位小的P波是一个困难的任务。因此,AF检测领域并没有广泛应用P波消失这个特征。
一些通过RR间隙来检测AF的方法被使用,这些特征提取器都表明了RR间隙的分布和变异性,或者心跳的异常。比如,心跳通过下面公式来计算:
在这里插入图片描述
f s f_s fs指的是信号的采样频率。
通常,数据的基本特征包括了最小值、最大值、均值、中值、标准差和欧几里得归一化。在【40,44,50,53,55,57,71,79,81】都基于RR间隙计算了这些基础的数据特征值、RR 间隔一阶差分或 RR 间隔的二阶导数。【74】的研究包含了从每个HR信号中基于RR间隙的基础数据特征,而【50】则计算庞加莱数据散点图来反映RR间隙的分布。
HRV(心率变异率)被叫做ECG信号的动态信号,是AF最稳定的标志【81】。一般窦性心律和AF的HRV有很大不同。幸运的是,洛伦兹散点图和庞加莱散点图是表示HRV的两个有用的工具。【83】发现庞加莱散点图是从其他心律中将AF区分出来的最重要工具。而且【61】认为RR间隙的直方图可以反映HRV的信号。另外,【76】包括了标准HRV的数据,比如最大值、最小值、中值、均值、标准差和pNNx。这里pNNx的定义是,pNNx 被定义为连续正常窦性 (NN) 间隔变化超过 x ms 时的平均每小时次数,是一种广泛使用的心率变异性度量【53,71,79】。【84】 的研究检查了一系列 HRV 统计数据,称为 pNNx。

4.1.1 洛伦兹散点图

首先我们要介绍一种度量异常的指标,叫做 δ R R \delta{RR} δRR间隙。定义为:
在这里插入图片描述编码 RR 间期不相关性的 RR 间期的洛伦兹图是 ( − 1) 相对于 () 的散点图。2D直方图是洛伦兹散点图的数字化表达。RR 间隔序列将填充二维直方图中的不同部分,然后计算2D直方图不同柱的值。更多关于2D直方图的信息在【85】中。在一个类似的工作中,【71】通过使用RR间隙序列的二阶导来计算洛伦兹散点图特征。可以在【85】中找到对有关二维直方图模式的信息进行编码的几个度量。具体来说,分布的稀疏性是通过IrregularityEvidence来衡量的,簇中的密度由 DensityEvidence 测量,分布的方向由 AnisotropyEvidence 测量,补偿性停顿由 PACEviden 测量(下面进行了定义)。
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第12张图片
其中 表示分段 中 bin 的次数,而 代表在分段,而 代表段 中至少填充一次的 bin 数量。
在【40,53】,,,【55】和基于RR间隔或R峰值在最终的特征集合进行考虑。 此外,几个像,和这样的度量基于RR IN- terval是在【53】考虑。 上述部分指标定义如下:
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第13张图片(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第14张图片
其中表示包含原点的bin的{δ(),δ(-1)}值和的bin数目。

4.1.2 庞加莱散点图

庞加莱散点图是分析每两个连续RR间隙分布特征的有效工具,从图像中可以得到三个特征,他们分别是聚类类别的数目,节拍间隔的平均步进增量和对角线附近点的分散程度【83】。

4.1.3 其他HRV特征

delta RR间期分布差异曲线是从每个心跳的密度直方图中得到的,它反映了deltaRR间隙分布的主要变化【86】,在【44,71】中使用了连续 RR 差异的均方根 (RMSSD) 来量化逐搏变异性。【87】中的计算方式为:
在这里插入图片描述
其中,() 表示给定的 RR 间隔段,长度为 。
作为类似的情况,样本熵系数(COSEn)【44】在从正常窦性心律中识别AF时具有很高的准确率【88】。 在 【40,42】 中,他们利用 COSEn 来计算 RR 间隔的变异性。
为了突破RR间隙特征的限制,考虑心跳波形图的特征提取方法在许多算法里被用到【50,51,55,57,61】。【50】的研究估计了对原始信号没有峰值检测的逐搏间隔,但利用了它的自相似性。心跳协方差矩阵的特征值在 【51】 中计算。【55】 的作者计算了 QRS 波群的相似指数、R 幅度的相似指数和高相似搏动的比率。 此外,表示信号自相似性的分形维数被纳入【61】。
形态学特征也被使用,他们包括PR间隙、QT间隙、PQRST振幅【50,51,55,67,72,76】,ST振幅【55】、P波宽度【67】、T波宽度【67】、QRS宽度P-QRS-T的坡度和角度【51,53】。在【55,89】中获得了信号质量指数来评估录音的质量。为了分类噪声的种类或者去除掉噪声段,【43,52,79】考虑了几个基于信号质量的噪声特征。

4.2 特征选择

通常,特征提取可以通过提供更具区分能力的特征,来改善信号分类的精度,同时减少特征的计算复杂度。【41,48】使用遗传算法选择最成功的特征,来进行进一步的分类。在研究【53】中使用了包括最大信息系数(MIC)和最小冗余最大相关性(mRMR)在内的特征选择工具来选择最相关的特征。 此外,分别在【71】]和【50】中执行了向后消除方法和递归特征消除以降低计算成本.

4.3 特征提取技术

ECG单导联的特征在之前的部分已经全面的进行了分析,这里我们会专注于用来提取这些特征的技术。根据之前的研究,Pan-Tompkins算法是特征提取最广泛使用的技术,它是Jiapu
Pan and Willis J. Tompkins 【90】提出的ECG信号的QRS波峰的实时检测算法。在【74,76】中,ECG信号的R峰用Pan-Tompkins算法来确定。【48】使用Pan-Tompkins算法从ECG信号中抽取了RR间隙。【52】使用不应期为 250 ms 的 Pan-Tompkins QRS 检测器,滑动窗口为 3 s。然而,该算法在存在噪声和倒置 QRS 的情况下错过了许多 R 峰。特别是,ECG 信号过渡部分的高能量噪声会极大地扭曲 Pan-Tompkins 算法的性能 【57】。
研究【40】的创新点是应用稀疏编码进行无监督特征提取。在 【41】 中,使用 3 个检测器(相量变换、连续小波变换和 S 变换)的组合来确定可靠的 QRS 位置。
以下特征提取是使用 Teager-Kaiser Energy Operator (TKEO) 进行的。 在 【77】 中,他们对每个 ECG 使用了四个众所周知的 QRS 检测器,即 gqrs、Pan-Tompkins (jqrs)、最大值搜索和匹配过滤。 在 【75,78】 中,使用在 WFDB 工具箱中开放访问的 gqrs 算法检测 QRS 复合波。
随着基于深度学习的算法的进步,可以更好地解决特征提取的挑战。 为了学习输入 ECG 信号的表示(判别特征),在 【59-61,68,69】 中使用了卷积层。

5 AF检测的机器学习方法

5.1 支持向量机

SVM是一种很受欢迎的监督学习方法,用于解决分类和预测的问题。【40-47】已经将这种方法应用于ECG单导联信号。【40,43】通过使用改进的cuckoo算法来微调SVM训练期间的参数,从而实现了基于SVM的心律分类器。他们在CinC2017的得分是0.77和0.83。【43】通过计算信号质量指数来实现信号质量评估,然后从质量好的信号中提取特征。显然,使用高质量的心电图片段提取特征可以获得更好的分类系统性能。 在【42】中,选择分类器是因为它具有泛化能力,即使在分析不平衡的数据集时也是如此。 CinC2017的数据库用于训练SVM分类器,而MIT-BIH AF数据库用于常见场景下的性能评估。在【42】中获得的看不见的数据集的F1 值为 0.71。
在【41】中开发了基于 SVM 的两步方法,它用于从单导联心电图记录中识别多类节律。 具体来说,他们在第一步中选择了两个独立的径向基函数核 SVM 进行初步分类。 然后,在第二步中,遵循具有线性核函数的 SVM,它可以实现更可靠的预测性能,将 ECG 记录分为四种类型。 在【44】中,建议使用最小二乘 SVM 来区分正常、AF、其他心律和嘈杂的 ECG 记录之间的心律。 他们提出了一种基于一组二元分类器的方法来解决多类分类问题,在 CinC2017 的隐藏挑战数据集上获得了 0.81 的总 F1 分数。 与【40,42,43】中的方法相比,似乎在训练集上应用二元分类器可以提供相对更好的F1分数。

5.2 决策树

决策树是另一种广泛使用的分类方法,受益于其可解释性以及高效和可扩展的学习概念的可用性。由于单个决策树容易导致过拟合,因此研究人员尝试将它们组合在一起以提高分类系统的准确性【48】。【48-51】中的研究就是这类典型案例,它们都实现了随机森林分类器来区分四类心电节律。 在【51】中,作者通过使用 500 个决策树在 CinC2017 剩余 80% 的训练数据上训练了一个随机森林分类器,并使用bagging训练每个分类器,即训练数据的自举副本。 另一方面。【48】的研究使用了自举聚合(bagged)决策树,聚合了来自 220 个决策树的集合的预测。 在【49】中,他们用 1000 棵决策树训练了一个基于随机森林的分类器(bagged决策树),获得的 F1 分数为 0.81。 在研究【48】和【51】中,使用了220棵决策树和500棵决策树,在看不见的测试数据集(没有数据平衡)上分别获得了78%和82.6%的分数。 似乎具有更多决策树的分类模型可以产生更好的性能来用于从单导联心电图记录中筛选出 AF。【49】中也证明了这种指示。 此外,【48】表明无法处理样本的均衡性的话会影响分类器性能。 另一方面,【49】中的调查表明,基于样本分布的权重解决心电数据不平衡有助于提高分类性能。
AdaBoost(adaptive boosting)是一种集成学习方法,将许多弱学习器(如决策树)组合起来构建一个强分类器,并使用一个加权向量来降低误分类率。 该算法不太容易过度拟合,尤其是当学习周期数限制为 70【52】时。 但是,它对噪声数据和异常值更敏感。 因此,在使用 AdaBoost 分类器之前,应建议对原始 ECG 信号进行预处理以生成相对干净的 ECG 数据。【52】的研究表明AdaBoost二叉树可以取得更好的效果。 为此,【53】中提出了一种包含三个分类器的多层二进制级联方法。 一个分类器首先将未知录音标记为“正常+其他节奏”或“AF+嘈杂”,然后使用另外两个分类器确定最终的分类结果。 集成学习模型的架构如图 六(a) 所示:
图六(a):
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第15张图片
在【54】中使用了一种分层模型,该模型是独立训练的分类器的堆叠,每种分类器都进行二值分类,如图六b描述的一样:

图六(b):
(四十六:2021.08.17)《医疗物联网单导联心电波心房颤动检测研究》_第16张图片
在一项类似的工作中,使用 AdaBoost.M2 算法【55】训练了二元分类决策树模型。 【56】的研究提出了一种基于bootstrap聚合的最优集成分类器模型。 集成分类器将一组分类器组合在一起,可以获得比每个分类器更好的性能。 例如,可以使用多数票将集成分类器的预测结果组合起来以做出最终决定。 【57】的研究使用噪声检查分类器来检查记录是否太嘈杂而无法分类,并应用心律分类器来区分心律失常。 两个分类器都基于bagged决策树模型。 在【58】中,研究人员将神经网络与bagged树相结合,对心律失常进行分类。 当神经网络不能对信号进行高确定性分类时,bagged树算法就起到了最终分类器的作用。

6 AF检测的深度学习

深度学习已成为一种革命性的工具,可以通过最少的预处理和后处理来分析复杂数据。 本质上,它是机器学习的一个分支,在计算机视觉、自然语言处理和生物医学信号处理方面取得了可喜的成果。 用于自动对焦检测的传统算法需要数据预处理和特征提取阶段,然后提取的特征向量作为支持向量机、集成学习或其他机器学习算法的输入。 然而,手工特征提取的过程需要专业领域的特定专业知识,因此复杂且耗时。随着深度学习的出现,手工特征提取的繁琐过程不再是强制需要的。
CNN 是最常见的深度学习架构之一,它由卷积层、批量归一化层、非线性激活层、dropout 层、池化层和分类层组成 【38】。 RNN 旨在处理序列数据,例如神经语言处理、语音识别和文本摘要。 然而,这种架构在处理梯度消失这个重要问题方面的能力很差。 为了解决这个问题,Hochreiter 和 Schmidhuber【91】提出了一个 LSTM 网络,它包含一组储存块,每个储存块都包含内存单元。

6.1 CNN

在【60】和【61】的研究中,独立使用CNN对ECG记录进行分类,在CinC2017的隐藏测试数据集上获得的F1分数均为71%。 为了评估加深CNN网络对分类性能的影响。【92】中设计了一个实验,其中卷积层的数量逐步增加和评估,而它们的参数保持不变。 结果表明,训练阶段没有显着差异,但是,卷积层数最多的 CNN 模型获得了最佳性能。 通常,将一维心电信号转换为二维时频图像,然后馈入 CNN 模型,该模型可以捕获深层特征并促进心律失常检测。 例如,在【62】中,一个二维编码的双搏心电耦合矩阵被认为是3层CNN分类器的输入来检测室上性异位搏动和室性异位搏动,优于基于1-D CNN的方法【63】。 通过短时傅立叶变换 (STFT) 从一维心电图记录转换而来的二维时频图像被输入到所提出的 CNN 模型中,用于识别和分类五种心跳类型【64】。 类似地,同样由 STFT 生成的二维矩阵流入深度卷积神经网络 (DCNN) 以检测 AF【66】。 在【65】中,所提出的模型用于根据 STFT 生成的二维图像将所有 ECG 记录分为 8 类。 上述研究基于多导联心电图,这激发了许多研究人员开发用于从单导联心电图检测房颤的相关算法。 为了将一维时间序列(单导联心电图)转换为二维时频图像,在【36】中实现了 STFT,然后将所有图像输入一个密集连接的卷积网络(DenseNet)。 在类似的工作中,使用单导联心电数据的时频分布矩阵和 CNN 算法来区分不同的心律(12 类)【35】。

6.2 RNN

尽管 CNN 在学习输入数据的表征方面非常强大,但考虑 ECG 信号等序列信号的长期和短期依赖性也很重要【92】。 因为经典神经网络不包含记忆单元,它们不足以学习这些依赖关系。 考虑到这一点,RNN 架构是通过向前馈神经网络添加内部存储器来创建的。 RNN 在短期记忆操作中取得了成功,但由于梯度消失问题,它们未能学习长期依赖关系,这是执行长期记忆的主要困难之一。 因此,引入了 LSTM 网络来解决这个问题。【67】的作者在单导联 ECG 数据上使用误差反向传播训练了 LSTM 网络。【69】中的工作在单导联 ECG 数据集上评估了所提出的 CNN 和 CRNN 架构,并证明 CRNN 产生了比 CNN 架构更高的整体准确度和 F1 值。 此外,【92】 的工作表明,LSTM 模型的性能在检测精度方面不及堆叠的 LSTM 结构。 但是,添加到模型中的 LSTM 层数使计算时间增加了一倍。因此,开发了混合技术,尤其是 CNN 和 LSTM 网络,以降低计算成本并提高 LSTM 网络的性能。
在【59,68,69】中采用了CNN特征提取,然后这些特征作为LSTM的输入。 对于多类分类,【59】的研究通过提出一个包含三个 CRNN 的分层模型,将这个问题转化为一个多二元分类问题。 在【59】中认为LSTM可以帮助处理长期依赖和梯度消失的问题,因此,特征提取由一维卷积层执行,并将结果输入LSTM层。 在【68】中,他们提出了一种名为 CL3 的新深度学习模型,该模型使用 CNN 提取特征,这些特征被引导到 LSTM 堆栈中,以使用很少的手动参数从 ECG 时期自动学习隐藏模式。【69】中进行了类似的工作。 它结合了用于特征提取的卷积层堆栈和用于特征时间聚合的 LSTM 层,然后使用带有 softmax 的标准线性层来计算分类概率。 上述三种算法 【59,68,69】 在 CinC2017 的隐藏数据集上分别获得了 0.77、0.80 和 0.82 的整体 F1-measures。 从性能记录中,我们可以想象,与仅使用 CNN 或 LSTM 的模型相比,CNN 和 LSTM 的组合可能有助于提高 F1 值。

7 讨论和公开问题

通过对文献的综合回顾,可以获得一些可能促进单导联心电图检测 AF 性能的潜在因素:

  • (1)样本不平衡。 CinC2017 数据集在研究单导联心电图的 AF 筛查方面很受欢迎。 该数据集包含 8528 个心电图记录,就深度学习模型而言,样本数量相对较少。 此外,AF 记录的严重不平衡对于监督学习来说是不令人满意的,因为它会影响分类算法的性能。 在文献中和这个社区内,数据增强被广泛用于解决这个问题。 例如,【93】的研究表明数据增强可以帮助训练不同数据集的模型。 【80】 的工作研究了数据增强算法的能力,如过采样、高斯混合模型 (GMM) 和生成对抗网络 (GAN),以解决数据不平衡问题。 【80,93】 中的结果表明数据增强的性能提升。 特别是,与使用过采样方法的分类算法相比,基于深度学习的分类算法更多地受益于使用 GAN 和 GMM 的数据增强。
  • (2)降噪。 可穿戴式采集设备收集的心电图记录经常受到服务器噪声的干扰,这已被证明会对分类系统的准确性产生负面影响。 例如,【94】 的研究表明,随着信噪比的降低,AF 检测精度呈线性下降。 因此,认为去除噪声对分类性能有益【95】。 近年来已经提出了大量用于去除ECG信号的噪声的技术。 在【96】中,对小波去噪方法和深度学习模型进行了综合比较。 结果证明小波方法适用于去除随机噪声,而深度学习去噪模型对于更高级别的随机和漂移噪声具有明显优势。
  • (3)信号分割和形态分析。 通过分割 ECG 信号,可以有效降低模型的计算成本。 由于 ECG 信号是非平稳的,因此从整个序列中在局部提取特征可能不合适。因此,【48】的研究将每个心电图记录分割成epoch。在类似的工作中,为了减少时间步数,【72】的研究将心电图分割成一系列心跳。 心电图的形态分析有助于检测 PQRST 点,在特征提取阶段也起着关键作用。【94】表明HRV能够提供最大F1分数的92.5%,而更复杂的形态分析的附加值为0.19(最大数为0.19)。
  • (4)质量评估。 信号质量评估可以有效提高信号分类算法的性能,许多研究在训练模块之前引入了信号质量评估。 【52】中的结果表明,高质量的心电图和噪声信号之间存在显着差异。 因此,循环质量评估应用于每次心跳,剩余的高质量信号用于【61】中的进一步处理。 为了确保该算法仅在高质量信号上进行训练,【58】 中的作者在使用神经网络进行初步分析后去除了部分信号。 类似地,【43】 的研究将心电图记录分割成几个心电图情节,并且只采用质量好的心电图情节进行特征提取。 在【78】中,应用了信号质量指标技术。 质量指数低的心电图记录被识别为噪声,而信号质量指数合理的心电图记录在分类阶段进一步处理。 此外,通过在【96】中采用各种质量评估措施来解决错误最小化问题。
  • (5)深度网络。 已经证明通过增加卷积层提高了分类性能。【92】中报告的结果表明,具有更多层的模型可以实现更好的分类性能。 我们还应该注意卷积层中的过滤器数量或 CNN 模型要使用的卷积层数量 【96】。 结果表明,所提出的具有更多过滤器、更多层和更大卷积核尺寸的模型能够实现更高的分类精度【96】。 具有更多决策树的模型也会产生更好的分类性能。 为了证明所提出模型在不同数量的决策树下的有效性,【49】的研究分别用 100 棵决策树和 1000 棵决策树训练了集成学习模型。
  • (6)混合架构。 与仅使用梯度提升的传统方法相比,CNN 和 LSTM 网络的混合架构实现了更高的准确性。 在**[75]**中,使用梯度提升算法的模型获得了 0.79 的 F1 分数,而结合梯度提升算法和 LSTM 网络的模型获得了 0.81 的 F1 值。 就检测精度而言,堆叠 LSTM 结构的性能优于单个 LSTM 模型。 但是,堆叠的 LSTM 模型需要更多的计算时间。 因此,CNN 和 LSTM 的结合在最近几年非常流行。
  • (7)时频图像。时频表示能够反映数据随时间变化的频率分量。 近年来,它被认为是心律失常分类模型的输入以获得更高的性能。
  • (8)非学习方法。 在过去的几十年中,许多研究人员提出了通过分析 RR 间期的变化 【97,98】、庞加莱散点图中的心率变异性【83】和相对小波能量【99,100】来检测 AF 的统计方法。 尽管非学习方法能够减少计算量,但与基于学习的方法相比,它具有较差的性能和复杂的手动过程。

8 总结

在本文中,我们对单导联 ECG 波的 AF 筛查进行了全面调查。 其动机是可以方便地采集单导联心电图的可穿戴设备的日益普及,以及公众对实时健康监测的需求日益增加。 首先收集所涉及的常见问题,例如问题制定、开放数据集和性能指标。 然后我们总结并比较分析了用于解决这个问题的主要技术,包括预处理、特征提取、机器学习和深度学习算法。 通过比较文献中的性能记录,列出了一些可能有助于提高单导联心电波检测性能的潜在贡献者,预计有兴趣的读者可以在相关研究工作中从这些问题中受益。

CRediT 作者贡献声明

Yu Liu:方法论,形式分析,数据规约,起稿。
Junxin Chen:数据管理、项目管理、资金获取。
Nan Bao:写作-评论与编辑,监督,可视化。
BrijB.Gupta:监督、项目管理、形式分析。
Zhihan Lv:监督、可视化、数据规约、形式分析。

竞争利益声明

作者声明,他们没有已知的可能会影响本文报告的工作竞争性经济利益或个人关系。

我的观点

1.算法补充:

文中对很多算法没有做描述,尤其神经网络的算法仅仅只有17年的几篇,我觉得这篇文章写的可以说是不全面,18年以后的模型根本没有涉及到,在此我对一些算法模型进行补充。

1.1 MINA

利用时域和频域信息结合的方式,对从record里面分割出来的定长seg,进行预测。在默认参数下的val loss下降到0.02,具体隐藏测试集上的测试结果未知,因为cinc17的测试集还未公开。

1.2 cinc17-paper

这些算法的代码都开源,地址在https://physionet.org/static/published-projects/challenge-2017/1.0.0/sources/。

1.3 大佬github

这里有1d的残差网络等SOTA模型可以学习。

你可能感兴趣的:(ECG,学术论文,python,人工智能,深度学习)