【论文阅读】

实验:在原异常检测中加入危急值判定(正在调试中)

遇到以下三种情况也要判定为“异常”

严重快速性心律失常

量化
1.出现VF and VFib;
2.心率>=150且持续时长>=30s;
3.Anormal 且 心率>=200;
4.len([r:r+1])长度<=250ms

严重缓慢性心律失常

量化
1.心率<=35bpm;
2.len([r:r+1])长于平均RR间期,且时长大于3秒
3.出现R on T 室性早搏

数据集

加入心肌梗塞的心电数据集,对原模型进行开放集识别验证
【论文阅读】_第1张图片
【论文阅读】_第2张图片

论文阅读 《Designing ECG Monitoring Healthcare System with Federated Transfer Learning and Explainable AI》(2021年)

【论文阅读】_第3张图片

物联网设备能够每天收集大量数据。这种数据收集和成倍增长的计算资源开启了信息技术领域的新领域,特别是深度学习 。虽然深度学习是一个常用概念,但由于过去可用的数据和计算资源有限,其使用受到限制。然而,由于互联网、物联网设备和不断增长的计算能力,如今我们可以看到深度学习几乎在每个领域都发生了革命性的变化,包括医疗、经济、农业和军事。在医疗保健应用程序方面,全球各地都在生成大量数据,这些数据具有独特的特性。大多数与医疗保健相关的数据都是多维的,这使得使用经典机器学习(ML)模型(例如决策树和随机森林)变得富有挑战性和复杂。然而,新一代机器学习模型,特别是基于深度学习的模型,由于其自学习能力,可以解决与多维数据相关的问题。在医疗保健行业,深度学习发挥了关键作用,例如帮助诊断威胁生命的疾病。
首先,要训练深度学习模型,需要大量的训练数据,但每个竖井(例如,医院)的数据量非常有限,因此单一数据源可能不足以训练深度学习模式。解决方案是从多个来源收集数据,然后根据收集的数据训练模型。这种方法的一个主要问题是隐私问题。由于医疗数据是高度敏感的私有数据,一些个人数据源可能不愿意与中央数据收集器共享其数据。

联邦学习

2016年,谷歌提出了一个名为“联合学习”的想法,以解决数据可用性和隐私问题之间的冲突。联邦学习背后的基本思想,是在没有集中训练数据的情况下协作训练机器学习模型。联合学习使具有足够计算能力的边缘设备或服务器(如家用计算机、移动电话、可穿戴设备和其他物联网设备)能够协作学习共享的机器学习模型,同时将所有训练数据保留在本地设备上,将机器学习的能力与将数据集中存储在单个服务器或云中的需要分离。
【论文阅读】_第4张图片

FL能够通过网络中的隐私保护模型训练来解决数据孤岛问题。它的工作原理是这样的:边缘(客户端)设备下载当前模型,通过从其本地数据的数据中学习来改进模型,然后将更改总结为一个小的重点更新。只有对模型的更新使用加密通信发送到云端,在云端与其他用户更新聚合,以改进全局共享模型。所有的培训数据都保留在本地设备上,并且没有单独的更新存储在云中。联合学习允许更智能的模型、更低的延迟和更低的功耗,同时确保隐私。这种方法还有另一个好处:除了提供对全球共享模型的更新,还可以立即使用本地边缘设备上的改进模型,通过使用物联网设备为个性化体验提供动力。

迁移学习

转移学习旨在将知识从现有领域转移到新领域。关键的想法是减少 不同领域之间的分布差异。这里主要有两种类型的迁移学习:实例重新加权和特征匹配。近年来,深度迁移学习方法在许多应用领域取得了巨大的成功。

联邦学习框架中训练模型可以获得与传统集中式学习环境相当的性能。转移学习(Transfer learning,TF)旨在将知识从现有的训练模型转移到新模型。关键思想是减少不同模型之间的分布差异。近年来,深度迁移学习方法在许多应用领域取得了巨大的成功。Chen等人提出了FedHealth,这是第一个用于可穿戴医疗的联邦转移学习框架,用于应对隐私和安全挑战。FedHealth通过联邦学习进行数据聚合,然后通过转移学习构建相对个性化的模型。FedHealth使得在联邦学习框架中进行深度迁移学习成为可能,而无需访问原始用户数据。

这篇文章做的工作

就深度学习在医疗保健中的应用而言,心电图分类是一项非常重要的日常任务。已经提出了许多基于机器学习的解决方案来分析和分类ECG数据。然而,这些工作大多基于集中式机器学习架构,因此容易出现隐私问题和数据可用性问题。此外,由于大多数实时EEG数据都是有噪声的,因此它们无法实时运行,因为它们是在预处理(更干净)数据上训练的。此外,它们不提供可解释性,这是基于深度学习的临床医疗保健的关键要求之一。因此,这限制了它们的实时应用。为了解决上述所有挑战,在本文中,我们在联邦环境中提出了一个可解释的医疗保健框架。首先,我们提出了一种基于深度卷积神经网络(CNN)的自动编码器,用于直接对受试者的原始心电信号进行去噪。其次,我们提出了一种基于CNN的分类器,它使用转移学习对原始心电数据时间序列进行分类。第三,我们在框架中采用GradCAM模型,以新颖可靠的模式解释分类结果。此外,建议的框架通过联邦设置为患者提供了更高级别的隐私保护。

1.我们在联邦环境中开发了一种基于CNN的自动编码器,用于对从患者采集的ECG信号数据的原始时间序列进行去噪。自动编码器提供了输入的去噪版本,我们用它来解释预测。
2.在转移学习的帮助下,我们使用所提出的自动编码器的编码器部分来制作基于CNN的分类器,该分类器将给定的ECG数据分为五类:非生态心跳(N)、室上异位心跳(S)、室异位心跳(V)、融合心跳(F)和未知心跳(Q)。
3.我们将提出的分类器与XAI模块相结合,以解释分类器的决策过程。XAI模块可以与联邦设置中的每个更新的分类器一起使用,因为它可以与任何分类器架构一起使用,并且不需要重新训练。
4.我们使用MIT-BIH心律失常数据库来训练我们提出的框架。需要注意的是,为了使数据更真实,我们首先对数据进行上采样以创建更多的数据样本,然后添加10-30%的随机噪声。在原始MIT-BIH数据库中,所提出的框架使用噪声数据提供了94%的总体精度,使用干净数据提供了98%的总体准确性。此外,我们使用四个标准度量(分类准确率、精确度、召回率和F1分数)评估了该框架的性能。

架构

为了对来自ECG设备的原始输入信号进行去噪,我们提出了一种自动编码器。拟议的自动编码器如图3所示。它由输入层、输出层和12个隐藏层组成。在隐藏层中有6个卷积层、3个最大池层和3个上采样层。
【论文阅读】_第5张图片

在所提出的自动编码器中,使用不同的学习速率来保持训练过程的效率,同时保持重建损失퐿 尽可能小(使用可变学习率)。
在这里插入图片描述
【论文阅读】_第6张图片

分类器由4个卷积层、3个最大池层、2个完全连接层和1个用于分类的softmax层组成。该分类器设计用于将输入ECG信号分类为五类之一,如表1所示。我们使用转移学习将经过训练的自动编码器的编码器部分转移到拟议的分类器中,因为这些卷积层旨在从原始输入数据中去除噪声,而分类器中的下一层旨在对输入ECG信号进行分类。因此,在训练单个局部分类器时,不需要训练前3个卷积层。换句话说,我们在分类器训练阶段保持前3个卷积层的静态,这意味着在前3个褶积层的反向传播期间没有参数更新。这提供了 用于在训练分类器时对信号进行去噪的训练参数,这提高了分类器的性能。
【论文阅读】_第7张图片

我们决定使用梯度加权类激活映射(Grad-CAM),并在分类器顶部对其进行修改,该分类器使用特定于类的梯度信息来定位重要区域。我们将这些局部区域与现有的时间序列可视化地图相结合,以创建高分辨率热图可视化。通过这种可视化,实践者可以理解某个预处理的原因-由分类器给出的预测。
自动编码器和分类器都只在三个本地,树莓Pi( 1.4GHz,64位四核ArmV8 CPU和1GB LPDDR2 SDRAM)上进行本地训练,由Edge1、Edge2和Edge3表示。此外,全局服务器使用了一个配备Intel core i-6700HQ CPU和32 GB RAM的工作站
AE采用了3的卷积大小。它使用均方根传播(RMSProp)作为优化器。每个퐸푖 设备使用80%的数据进行培训,20%的数据用于评估。我们在每个边缘设备上随机分布数据集,并引入随机噪声。
【论文阅读】_第8张图片
【论文阅读】_第9张图片

为了实现XAI模块的可解释性,理解ECG信号非常重要。通常,p波、QRS波群和T波的振幅和宽度是ECG图的重要特征,如图所示。这些区域在ECG分析中起着至关重要的作用。所提出框架中的XAI模块表明,所提出的分类器关注输入样本的这些关键特征。
【论文阅读】_第10张图片

不同ECG样本的XAI模块输出如图所示。这些结果可用于帮助临床从业者诊断潜在的健康问题。然而,我们强烈建议,未经临床专业人员事先讨论,不得将这些结果用于任何医疗咨询。换言之,热图应该和临床医生事先的专家知识交叉核对。
【论文阅读】_第11张图片

在本文中,我们提出了一个隐私保护、有效、高效和可解释的基于人工智能的框架,以解决深度学习应用于脑电信号分类的局限性。我们在联邦架构中提出了一种基于CNN的自动编码器,以训练广义去噪自动编码器,同时提供数据隐私。此外,与2020年报道的三种最先进的方法相比,我们提出了一种基于CNN的分类器,使用转移学习、局部训练和全局聚合进行训练,以提供非常好的分类准确率(分别为94%和98%),我们在分类器上提供了一个可解释的模块,用于解释分类结果,从而扩展了框架的可用性。这使得所提出的框架成为现实世界医疗应用的独特解决方案,其中ECG信号分类是一项重要任务。

基于上述论文,在GitHub中找到一个拓展实验(2022年) Federated Learning in ECG Anomaly Detection

联邦学习环境中是否总是存在通用模型?有没有办法在联合环境中优化模型训练?在回答这些问题的过程中,这个雄心勃勃的项目假设独立控制注意力层的冻结可以通过转移心电图领域现有特征的焦点来帮助增强训练过程和学习新数据。通过这个过程,可以通过控制注意力层的学习来学习新数据,从而形成一个通用模型,这在联邦学习的背景下是有利的。首先获得一个以 SE-Nets 作为注意力网络的预训练模型(在 MIT-BIH 数据上预训练),然后在其他两个数据集 PTB 和 ECG5000 上进行训练。自适应注意力层冻结 (AALF) 被实施并应用于通过监控平均 F1 分数和每个层的自定义覆盖度量来优化训练注意力层。在这个项目中进行的实验没有产生足够的有利结果,导致该假设被拒绝。然而,结果提供了关于转移注意力层焦点的能力以及 TFF 中 FL 训练过程的其他领域的有见地的建议。

论文的主要贡献: 该项目利用现有工作进行改进,整合了 2 篇感兴趣的论文。 (a) 论文 1 - Raza 等人。 “Designing ECG Monitoring Healthcare System with Federated Transfer Learning and Explainable AI”:该项目改进了本文的模型架构。 (b) 论文 2 - Chen 等人。 “Communication-Efficient Federated Learning with Adaptive Parameter Freezing”:该项目改进了本文现有的自适应参数冻结 (APF) 技术。

根据研究,这个项目将是第一个专注于模型中注意力层的自适应冻结(受 APF 启发的技术)。这种技术将被称为自适应注意力层冻结(AALF)。 该项目在很大程度上是独一无二的,因为它探索了在特定医疗领域使用与 AALF 相同的模型架构来区分客户端用例的全局模型和本地模型。 该项目旨在处理不同特征空间中的异常 ECG 类,使用 AALF 进行预训练,同时具有成本效益。 之前在 FL 中的工作是使用 FATE 和 PySyft 等框架完成的(在后台使用 PyTorch)。在这里,该项目使用仍处于初始状态(版本 0)的 TFF,因此无法完全支持除模拟之外的实际实现。因此,本文有助于 TFF 的应用/研究。

你可能感兴趣的:(实验,机器学习,人工智能)