无监督心电图分析一综述
电心图(ECG)是检测异常心脏状况的黄金标准技术。自动检测心电图异常有助于临床医生分析心脏监护仪每天产生的大量数据。由于用于训练监督式机器学习模型的带有心脏病专家标签的异常心电图样本数量有限,对于心电图分析,越来越需要无监督学习方法。无监督学习旨在将心电图样本分成不同的异常类别,而无需心脏病专家提供的标签,这个过程被称为心电图聚类。除了异常检测,心电图聚类还最近发现了反映有关整个身体和思维的互和内个体模式,例如情绪、心理障碍和代谢水平等有价值的信息。心电图聚类还可以解决监督学习系统面临的特定挑战,例如不平衡数据问题,并可以增强生物识别系统。虽然已经有关于监督式心电图系统的几篇综述文章,但是关于无监督心电图分析技术的综合性综述仍然缺乏。本研究主要回顾了过去十年主要发展的心电图聚类技术。重点放在最近的机器学习和深度学习算法以及它们的实际应用上。我们对这些技术进行了批判性的回顾和比较,讨论了它们的应用和局限性,并提供了未来的研究方向。这篇综述深入洞察了心电图聚类,并提供了采用适用于特定应用的适当算法所需的必要信息。
电心图(ECG)展现了心脏的电活动。它在重症监护室以及日常监测和可穿戴监护仪中常规记录,每天产生大量数据。已经开发了基于监督式机器学习的许多系统,利用心电图数据集和心脏病专家提供的标签,将心跳分类为正常和几种异常类别[1]–[5]。然而,心脏病专家只能分析和标记大量心电图数据的一个小子集,以指示常见的心脏异常。此外,大多数带有标签的心电图数据集是在受控环境中获得的,例如医院和诊所,并且与可能出现在不同生理和病理条件下的多样化心电图模式相比,包含的样本非常有限。例如,从处于应激状态或患有糖尿病的个体获取的心电图数据的模式据显示与正常情况下获取的模式不同[6],[7]。因此,最近提出了几种无监督学习方法,用于分析心电图数据,而无需心脏病专家提供的标签,这个过程被称为心电图聚类。
然而,无监督的心电图分析的需求并不仅仅源于心脏病专家提供的标签的不足。实际上存在着患者之间和患者内部的心电图模式和结构,如果被发现,可以进一步揭示有关心血管系统以及整个身体和心智的宝贵信息。发现这些关系可以揭示各种健康状况的复杂机制和重要生物标志物,以及心智和身体的状态,并最终指导医生进行精细的治疗决策。值得注意的是,由于其复杂性和大量的数据,这些模式的视觉识别是不可能的。然而,这些模式可以通过聚类技术自动识别。例如,心电图聚类已经帮助研究人员,特别是在心理生理学领域,发现与不同情绪状态(如悲伤和情绪压力)、脑部疾病(如癫痫)以及嗜睡状态等相关的隐藏的心电图模式[6],[8],[9]。心电图聚类还使研究人员能够发现在患有不同健康状况的患者中存在着明显的心脏异常和代谢水平差异,包括糖尿病[7],夜间低血糖[10],栓塞性脑卒中[11]以及动脉粥样硬化[12]。
除了作为更广泛的知识发现系统的一部分应用之外,聚类技术,特别是基于深度学习的无监督方法,如自编码器[13],[14]和生成对抗网络[15],还被用于克服心电图监督学习系统面临的一些挑战,如解决不平衡数据问题[16]和低级别的个体化心电图分类器自动化[17]–[19]。此外,心电图聚类已经在生物特征认证[20]–[23]、心电图分割[24],[25]和从腹部心电图中提取胎儿心电图[26]方面得到了应用。
迄今为止,已经有一些研究回顾了监督学习的心电图分析技术[2]–[4],[27]–[30]。然而,据作者所知,这项工作是第一个对无监督心电图分析系统进行全面且批判性的回顾。在这项工作中,我们回顾了临床/医疗应用中的无监督心电图分析系统以及这些系统所采用的相关机器学习方法 - 从传统模型到最近的深度学习模型。为了进行全面的回顾,我们搜索了多个平台,包括IEEEXplore、ScienceDirect、Google Scholar、Scopus和PubMed数据库,并在著名期刊和由知名引用指数排名的会议上选择了大多数在过去十年内发表的研究。我们讨论了这些最新研究,进行了比较,概述了它们的局限性,并提供了未来的方向。这将使研究人员能够方便地获取所需信息,并选择适合其特定应用的适当算法。
在应用聚类算法之前,典型的心电图(ECG)聚类流程包括几个数据准备和预处理步骤。在本节中,我们将简要回顾用于有效聚类心电图数据的数据准备技术,包括去噪、分割和特征工程。然后,我们将广泛回顾传统和最新的聚类算法,包括深度学习方法,并进行批判性比较。
用于去噪、分割和特征工程的方法在很大程度上与监督学习系统中使用的方法重叠。在这里,我们简要介绍这些技术,特别是那些专为心电图聚类量身定制的技术。感兴趣的读者可以参考文献[2]至[4]以获取更详细的信息。
1)去噪和伪影去除:此步骤旨在减少患者呼吸、皮肤伸展、电力线干扰和肌肉收缩的扭曲效应。心电图去噪系统通常基于移动平均滤波器、频率选择性滤波器、维纳滤波器、自适应滤波器和离散小波变换[31]。关于心电图去噪方法的更多信息可以在[31]中找到。
2)分割:经过去噪处理的心电图信号通常通过自动识别心跳来分割成准周期单元。一个心跳包括几个电波,称为P、QRS和T波,它们代表心脏房室(心房和心室)的去极化(收缩)和复极化(舒张)[32]。
大多数心电图聚类研究会检测QRS波复合物的峰值,即R峰,并沿着信号考虑两个连续R峰之间的间隔,即整个心脏周期,作为分割单位。很少有研究考虑了心电图信号的其他特征点用于分割[33]–[35]。鉴于心电图周期的PR、ST和TP段的异常形态可以指示常见的心脏疾病,如心肌缺血、低钾血症和心房颤动[32],在分割中加入其他心电图特征点可以改善聚类结果。有些研究并不是通过在心电图信号中识别心脏周期来进行分割,而是将信号分成固定的时间间隔,而不识别任何特征点[36],[37]。还有一些心电图聚类方法不执行分割[38],[39]。这些方法直接从心电图信号中提取特征,而不识别任何生理特征点。
3)特征工程:这一步旨在获取心电图片段的最具信息量的特征,以促进下游的无监督学习任务。在这里,我们简要介绍传统的心电图特征工程方法。更近期的深度学习方法在第 II-C 节中进行了介绍。
专业医生通常会检查 P、QRS 和 T 波的时间和幅度特征以诊断心脏疾病。然而,心脏异常并不总是在时间域中可见[40]。通过功率谱分析和时频分析(如小波变换)获得的心电图信号频率信息可以填补这一空白。在小波变换中,将输入的心电图与一组称为小波的有限持续函数之间的相关性被视为心电图特征[36],[41]。有关时域、电压域和频域特征工程方法的更多详细信息,感兴趣的读者可以参考以下来源[3],[4],[29],[30]。
最近,受自然启发的基于群体的优化方法,如萤火虫算法和粒子群优化,也被用于特征工程[42],[43]。这些方法搜索那些在可能特征的庞大人群中,能够在分类或聚类性能方面表现最佳的特征。例如,Kora [42] 将心电图信号上的每个点视为可能的特征。她使用萤火虫算法,寻找能够最大化用于将心电图片段分类为正常和心肌梗死类别的神经网络的准确性的点。有关受自然启发的特征工程方法的更多信息,我们将读者引荐至以下来源[44]–[46]。
最后,将心电图的分割单元进行聚类,每个组包含那些根据预定义的相似度度量,其对应的特征向量彼此之间比与其他组中的特征向量更相似的片段。
在聚类中,衡量两个心电图片段之间距离的相似性(或不相似性)度量是至关重要的。在各种现有的相似性度量中,欧几里得距离、余弦系数和动态时间规整距离[47]是心电图聚类中广泛使用的三个度量标准。前两者通常用于衡量以时间和形态特征或小波系数表示的心电图单元之间的相似性。动态时间规整是一种测量两个时间序列之间相似性的方法,这些序列的长度可能不同。在这里,我们简要介绍用于心电图聚类的传统聚类算法。最近基于深度学习的聚类算法在第 II-C 节中进行了描述。在第 II-D 节中讨论了所介绍算法在心电图分析中的优势和局限性,并在表格 I 中进行了总结。
基于中心点的聚类技术根据心电图片段与这些组的中心点的相似性将它们分成不同的组。中心点被视为其相应组的代表性片段。K均值是最知名的基于中心点的聚类算法,它将群集中心点视为该群集中心的心电图片段(或其特征向量)的平均值。在无监督的心电图分析中,K均值的变种包括模糊C均值[48]、亲和传播[49]和最大最小聚类[50]。这些算法在获取中心点方面有所不同。例如,亲和传播通过交换携带心电图片段之间相似性的消息来获取中心点。基于中心点的聚类算法通常易于实现,并且计算成本低。然而,它们通常不适用于处理噪声、离群值和高维特征空间。
层次聚类将每个心电图片段视为一个独立的群集,并合并最相似的群集,直到只剩下一个群集(包括整个数据集)。与基于中心点的聚类算法相比,层次聚类算法通常具有更高的计算成本;然而,这些方法的独特之处在于生成的树状图,它可可视化群集之间的层次关系,有助于医生的解释[51]。
这类聚类算法的目标是找出心电图片段属于各个群集的概率。高斯混合模型(GMM)是一种著名的基于分布的聚类算法,在已审查的研究中被广泛采用[36],[37]。GMM假设多个高斯分布生成心电图片段;也就是说,每个群集由高斯分布的均值和均值周围的标准差定义。Dirichlet过程GMM是GMM的一种变体,它不需要初始的群集数量(即数据空间中的高斯成分)[52]。DPGMM通过变分贝叶斯推断自动学习群集数量,这是一种估计群集的先验分布的迭代算法。基于分布的聚类算法适用于处理噪声和离群值,但通常会产生较高的计算成本。值得注意的是,DPGMM的计算成本比GMM更高。
密度通常被定义为在一定预定义半径内的数据点数量。基于密度的聚类将群集视为数据空间中具有较高密度的区域。DBSCAN [53] 和自组织映射(self-organizing map,SOM)[54] 是已被用于心电图聚类的著名基于密度的聚类算法。DBSCAN 将区域视为一个群集,如果其密度超过预定义的阈值。它能够有效处理噪声和离群值;然而,产生的群集在很大程度上取决于半径和阈值的选择。自组织映射(SOM)是一种神经网络类型,它将输入片段映射到二维网格中,假设在心电图片段之间存在特定的拓扑结构。生成的网格在高密度区域弯曲和扭曲[54]。SOM在二维网格中提供了群集的可解释性组织;然而,它会产生较高的计算成本。
谱聚类将聚类问题转化为图分割问题[55],其目标是将图分割为子图,使连接子图的边的权重之和最小化。在心电图聚类中,将心电图片段视为节点,并将它们之间的相似性表示为连接节点的边的权重[56]。谱聚类能够有效处理高维特征空间,但会产生较高的计算和空间成本[47]。
群体智能模型将聚类问题视为一个优化任务,其目标是最大化群集内心电图片段之间的整体相似性。例如,在蚁群聚类算法中[57],一群蚂蚁随机地从一个心电图片段移动到另一个,并根据它们的相似性为片段分配一个值(即信息素)。然后,群集被识别为其相似性值超过预定义阈值的片段。粒子群优化[58]和人工蜂群[59]是其他用于心电图聚类的基于群体智能的算法[41],[60],[61]。基于群体智能的聚类算法在搜索最佳群集解时可以避免局部最优解,具有高质量的群集。然而,由于这些算法的随机性质,它们通常会产生较高的计算成本,尤其在大规模数据集中。
最大间隔聚类(Maximum Margin Clustering,MMC)[62]利用支持向量机(Support Vector Machines,SVM)在未标记数据上执行聚类。具体而言,它找到一组心电图片段的标签,以最大化在标记片段上运行SVM获得的间隔。MMC的主要缺点是其解决非凸整数问题的计算成本较高的步骤[34]。
在集成聚类中,来自一个或多个聚类算法的多次运行结果被整合,以达到比单独聚类算法获得的数据更好的一致性群集。例如,Abawajy等人[38]整合了K均值和GMM的结果用于心电图聚类,而Aidos等人[63]则构建了一个包含200次K均值运行的集成,每次运行使用不同的K值。
这个算法专门用于对时间序列进行聚类,通过分析排列分布中的差异来找到时间序列之间的相似性。这是通过计算时间序列嵌入中不同顺序模式的频率来实现的[64]。
基于深度学习的聚类算法近来受到了广泛关注,并在许多任务中取得了比传统机器学习算法更优越的性能[65]。这些算法相对于传统的聚类算法的主要优势在于它们跳过了传统的特征工程步骤,可以自动学习用于聚类的最佳特征集。基于深度学习的聚类方法根据其体系结构分为三类[65]:(1)自编码器,(2)前馈网络,以及(3)深度生成模型。对于每一类,我们介绍了在心电图聚类方面的最新进展,并介绍了最先进的算法,这些算法有望进一步增强心电图聚类的性能。
自编码器由编码器和解码器组成,编码器是一个将输入数据转换为低维特征向量的神经网络,接着是解码器,它是一个从这个低维特征向量中重构出原始输入的神经网络。编码器和解码器同时进行训练,以最小化重构损失:即原始输入与解码输出之间的差异。深度聚类网络[13]和深度嵌入网络[14]是两个基于自编码器的常见聚类算法,已被用于心电图分析[66]–[68]。这些算法的背后思想是在训练网络时,除了重构损失外还引入了聚类损失。在深度聚类网络中,引入了K均值损失,而在深度嵌入网络中,引入了两个约束,即保留局部性和群组稀疏性,以保留数据的局部结构并对表示的关联性进行对角化。这些算法的一些应用在第 III-A 节中进一步进行了审查。
这组算法只在训练深度网络时引入了聚类损失。网络架构可以是全连接的、卷积的,或者两者的组合。网络的权重可以随机初始化,也可以使用在预训练网络上使用受限玻尔兹曼机进行微调[69]。深度自适应聚类(Deep Adaptive Clustering,DAC)[70]是一种流行的深度前馈聚类网络。它是一个单层卷积神经网络(CNN),采用二元成对分类方法进行训练。简而言之,首先使用CNN将输入样本映射到一个独热编码向量。然后计算所有样本对之间的余弦距离。由于地面真实的相似性是未知的,使用自适应学习算法,即自适应潜变量学习[71]来根据估计的相似性训练CNN的权重。DAC最初是针对图像聚类提出的,并在几个具有挑战性的图像数据集上取得了优越性能。通过对其CNN架构进行一些修改,DAC也可以用于心电图分析,作为未来可能的方向。
变分自编码器(Variational Autoencoders,VAEs)[72]和生成对抗网络(Generative Adversarial Networks,GANs)[15]是近年来最流行的深度生成模型。VAEs强制自编码器学习的潜在表示遵循预定义分布,通常是高斯混合分布。变分深度嵌入(Variational Deep Embedding,VDE)是一种基于VAE的聚类算法,已被用于心电图分析[74]。这个算法可以被看作是传统的GMM聚类算法的深度学习版本,其中特征空间是自动学习的。
生成对抗网络(Generative Adversarial Networks,GANs)旨在基于真实数据生成一组伪造数据,使伪造数据的分布与真实数据相似。简而言之,GAN由两个子模块组成:(1)生成器(Generator),用于生成伪造数据,以及(2)鉴别器(Discriminator),用于区分生成器生成的伪造数据与真实数据。在G和D中学习一组参数,使生成器和鉴别器之间的极小极大博弈达到纳什均衡。
CatGAN [75] 是基于GAN的一种常见的聚类算法。它强制鉴别器将训练数据分类为预定义数量的类别(而不仅仅是伪造和真实数据),同时对于对生成器生成的样本分类的置信度较低。ClusterGAN是CatGAN的一个变体,最近在许多其他基于深度学习的聚类算法中展现出卓越的性能,在不同的聚类任务中表现出色[76]。由于这些算法尚未在心电图分析中应用,它们在心电图分析中的应用可能是一个未来的研究方向。
除了聚类,基于深度生成的算法还可以学习从获得的群集中生成新样本。最近,一些研究采用了GAN生成新的心跳数据,以解决监督式心电异常分类中持续存在的数据不平衡问题之一[18],[19]。在第III-E节中,我们将讨论这些方法的应用。
表格I对不同的心电图聚类算法进行了比较。聚类算法处理噪声和异常值的能力在心电图聚类中是一个重要因素,因为大多数公开可用的心电图数据集中存在异常值,这可能会对聚类结果的结构产生不利影响。
聚类算法的时间复杂度是另一个重要因素。对于需要实时分析心电图的应用(例如,在重症监护室环境中),尽管生成高质量的聚类可能性可能较高,但计算成本较高的聚类算法可能是不可行的选择。K均值、模糊C均值和最大最小算法的计算成本较低;然而,它们处理异常值的能力低于计算成本更高的算法,如DBSCAN、GMM、层次聚类、谱聚类和基于深度学习的聚类。在这些算法中,DBSCAN的计算成本最低,尽管它对其超参数的选择(邻域半径和邻域中的最小点数)敏感。此外,DBSCAN在数据空间的固有密度不均匀的情况下不适用。
在选择有效的心电图聚类算法时,寻找任意形状(即非凸形状)的群集和处理高维特征空间也是其他重要因素。尽管距离基础聚类算法(如K均值)大多能够找到凸形状的群集,但心电图数据集中的群集可能呈现任意形状。基于密度和基于深度学习的聚类算法能够有效地找到非凸形状的群集,但计算成本比距离基础的聚类算法更高。
心电图分析中的特征空间通常是高维的,因为通常从心电图中提取了许多特征,而训练心电图样本的数量通常有限。基于图的和基于深度学习的聚类算法通常会产生较高的计算成本。特别是,与传统算法相比,基于深度学习的算法在处理高维数据方面更为有效;然而,深度学习方法需要大量的数据进行训练。
除了上述考虑因素,一些聚类算法还提供了用于可视化的独特功能。例如,层次聚类提供了可视化聚类之间的层次关系的树状图,自组织映射则提供了一个二维网格,可视化数据集中的一些特定拓扑结构。关于聚类算法及其优缺点的更多信息,我们建议读者参考[47]、[65]、[77]。
迄今为止,我们已将无监督的心电图分析研究按照六个应用领域进行分类,如图1所示。最成熟的应用是心跳聚类,它在大量心电图数据中提供了简洁而易于理解的心跳组织方式。最近和创新的研究方向旨在探索心血管系统与整个身体和心灵之间的关系。无监督的心电图分析还被用于提高监督式异常检测和基于心电图的身份验证系统的性能。
心跳聚类的有效性通常在具有心脏病专家标签的心电图数据集上进行衡量。每个得到的簇预计只包含属于一个标签的心跳。分类指标(如准确度和敏感性)和相似度指标(如Jaccard系数和归一化互信息)被广泛用作成功度量标准。Jaccard系数和归一化互信息的取值范围从0到1,较高的值表示已识别的簇与真实标签很好地匹配。轮廓分数是另一个广泛使用的测量标准,它不需要真实的簇。轮廓分数衡量了样本相对于其他簇的相似性,范围从-1到1,较高的值表示样本与其簇很好地匹配且与其他簇分开。
用于评估心电图聚类方法的数据集包括MIT-BIH心律失常数据集、Physikalisch-Technische Bundesanstalt (PTB)数据集、St.-Petersburg Institute of Cardiological Technics 12-导联心律失常(CTAD)数据集、UCR心律失常数据集和BIDMC充血性心力衰竭数据集,其中MIT-BIH心律失常数据集是最常用的数据集之一。
在众多研究中,Lagerholm等人设计了一种有效的心跳聚类系统,将以小波系数表示的QRS复合物分为25个簇,并使用自组织映射获得了高准确度(98.5%)的结果。通过使用自组织映射,他们提供了一个保留数据集内某些拓扑信息的邻域映射(如2维网格),最终有助于心脏病专家的解释。
大量研究集中于通过采用各种聚类和优化技术来提高心电图聚类的准确性,如蚁群聚类、蜜蜂群聚类、最大间隔聚类、高斯混合模型、层次聚类、K均值、亲和传播和深度自动编码器网络。这些算法中,由Balouchestani和Krishnan提出的聚类系统在MIT-BIH数据集上取得了最高的准确度(99.98%)。他们采用了基于K均值、压缩感知理论和K奇异值分解的方法,将心跳分成正常、上心室异位、心室异位、融合和不可分类的五组。
尽管这些深度学习研究取得了令人鼓舞的结果,但仍然需要更先进的聚类算法,可以自动处理不平衡数据问题,而无需预处理算法和专家分析。在这方面,可以进一步研究基于深度生成模型的算法,例如ClusterGAN,它可以学习从少数簇中生成新的样本。未来的研究还应专注于在大规模公共心电图数据集上应用基于深度学习的聚类算法,例如由Zheng等人收集的数据集和Wagner等人的数据集。
从临床角度来看,一些研究利用符号化进行了创新的心电图聚类。他们通过使用最大-最小聚类算法对心跳进行聚类,并为每个识别出的簇分配符号,将心电图信号转化为符号字符串。在符号表示下,他们搜索代表不规则活动的熵增子序列。他们的方法成功地检测到一个心房异位节律序列,这一点被心脏病专家忽视了。类似地,他们还将工作扩展到了风险分层,成功地找出了在急性冠状动脉综合症治疗后的90天内,虽然接受了相似治疗,但死亡风险升高的患者。从临床监测心脏的角度来看,12导联心电图是一种标准的临床协议,通过在患者身体的10个不同位置上连接电极来记录电活动。为了从12导联心电图中获取特征,通常会将从每个导联提取的特征进行串联。然而,这种表示通常不能保留12个信号的相对位置。为了解决这个问题,He等人使用了张量分解技术。他们将通过每个导联记录的心电图表示为其小波系数:W ∈ RV ×L,其中V和L分别表示导联数和小波系数数。然后,通过张量化,W被分解为W′ ∈ RI1×I2×I3,其中I1、I2和I3分别代表记录的信号、采样时间和小波频率子带。他们使用高斯混合模型将12导联心电图的张量表示分为两个簇,分别对应于正常和异常心电图。他们的系统在包含两段30分钟12导联心电图记录的CTAD数据集的子集上达到了0.93的高Jaccard系数。
心态状态、情绪和精神障碍常常与自主神经系统(ANS)相关联。自主神经系统和心脏之间通过心脏的窦房结(SA结)进行双向交互作用[8],[115],[116]。窦房结,也被称为心脏的起搏器,产生电脉冲刺激心脏肌肉收缩和泵血[32]。近年来,心电图聚类在心理生理学等领域有助于研究人员发现与不同心态状态相关的隐藏心电图模式。
这些研究中使用的数据集通常由健康个体在不同情绪状态下或患有精神障碍的患者获得的心电图(ECG)和阻抗心动图(ICG)信号组成。特征工程阶段依赖于提取出的一系列心电图和阻抗心动图特征的组合。在这里,与评估所得簇的质量不同,通常会执行统计假设检验,例如t检验,以衡量每个簇中的心电图(和阻抗心动图)特征与该簇个体心态状态的相关性。将不同的心态状态视为基本事实簇,并通过问卷手动识别,或通过对脑电图(EEG)信号进行聚类自动识别。因此,可以使用衡量所识别的簇与基本事实标签之间相似性的指标,如NMI [105]和Jaccard系数[104],以提高这些研究的可靠性。
在本节中,我们回顾了在这个研究方向上的新颖研究。已评审研究的摘要详见表格III。由于已评审的研究针对不同的心理状态,使用了各种私有数据集,所以这些聚类技术并没有相互进行比较。然而,我们会从所采用的聚类算法、特征工程和实验方案方面对现有研究进行批判性审查,并提供未来的研究方向。
最近,Hoemann等人[98]对从67名参与者获取的日常心电图(ECG)和阻抗心动图(ICG)信号进行了聚类,以研究心肺活动与情绪细致度之间的关联。情绪细致度描述了个体准确区分情绪的能力。情绪细致度较低与精神障碍,包括精神分裂症、自闭症和抑郁症等有关[98]。Hoemann等人采用了Dirichlet过程高斯混合模型来找到数据中最优的簇数。他们发现ECG和ICG可以用来识别不同水平的情绪细致度。
Leal等人[8]通过ECG聚类研究了癫痫患者的ECG时间间隔特征与癫痫前期间隔(即癫痫发作前的短时间)之间的关系,以预测癫痫发作,让患者有足够的时间准备迎接即将发作的癫痫。他们对从癫痫患者的ECG中提取的时间间隔进行了K均值、DBSCAN和高斯混合模型聚类,以查看是否存在一个与其他簇明显分离的簇,表示癫痫前期间隔。他们发现在41%的癫痫发作中存在这样一个簇,表示癫痫发作前2至9分钟的间隔。Babaeian和Mozumdar[9]提出了一种通过聚类佩戴式设备收集的ECG来检测驾驶员困倦的系统。他们对时间间隔特征进行了基于密度的聚类,发现了与清醒、瞌睡和睡眠状态相关的三个簇。
Carreiras等人[86]旨在通过ECG聚类来检测在解决具有挑战性的数学问题时个体注意力的下降。在注意力要求高的任务中,如手术和驾驶,检测注意力下降是重要的,因为在这些任务中缺乏注意力可能会造成灾难性后果。他们的工作受到了这样一个事实的启发,即通过可穿戴设备获取ECG比通过头戴设备获取EEG更加方便。他们对从24名受试者解决数学问题时获取的ECG和EEG信号进行了共识聚类,其中包括多次使用不同距离度量的分层算法运行。他们的结果显示,ECG数据集中发现的簇与EEG数据集中的簇之间存在强相关性,表明ECG可以帮助检测不同水平的注意力。另一个发现表明,ECG簇的数量大于EEG数据集中发现的簇的数量,这可以为深入分析提供更准确的信息。类似地,Wang等人[117]表明,通过分析从驾驶员手掌获得的ECG获得的簇与通过分析EEG获得的簇之间存在强相关性。他们建议可以利用从驾驶员手掌收集的ECG,而不是EEG,来识别驾驶员不同水平的注意力。
ECG聚类的另一个应用是情绪检测。其目标是通过聚类自动识别不同的情绪状态,如喜悦和悲伤。Wan-Hui等人[118]发现,与时域特征相比,ECG信号的频域特征更能够区分喜悦和悲伤。Zheng等人[95]采用模糊C均值聚类算法将ECG分为情绪压力和非情绪压力两个簇,并展示了时间间隔特征在区分这两个簇中的重要作用。Medina[119]对从25名受试者解决数学问题时获取的ECG进行了集成聚类,包括K均值和谱聚类。他们的系统成功地将情绪水平相似的受试者分组在一起。
在一项创新性的研究中,Kupper等人[6]调查了744名年轻成年人在进行应激性活动(包括解决数学问题和在两个观众面前演讲)时情绪应激与心肺活动之间的关系。他们从参与者那里获取了任务前和任务中的ECG和ICG信号。通过分布式聚类,他们发现了五个不同于自主平衡和静息收缩压水平的参与者群集。结果还显示,吸烟、定期体育锻炼和身体质量指数(BMI)与这些群集无关。此外,男性在执行应激任务时更有可能出现收缩压升高和心脏输出增加的群集中。
Gonzalez-Vel ´ azquez等人[120]通过聚类研究了情绪进食行为与ECG之间的关系。他们对52名年轻成年人的ECG进行了K均值聚类(K=2),将个体分为有情绪进食行为和没有情绪进食行为两组。他们发现情绪进食行为在超重者(BMI > 85th百分位数)中更为普遍。此外,肥胖者的RR时间序列中高频成分明显更大。
受到深度学习技术的成功启发,Oskooei等人[99]最近在100名消防员培训生的RR时间序列上训练了一个卷积自动编码器,以识别在进行演练时处于显著压力下的群体。他们对自动编码器学到的潜在表示应用了DBSCAN,并发现了两个群集,其中一个较小的群集对应于表现出显著更多压力的消防员。他们进一步表明,对于这个任务,应用K均值无法找到处于压力下的培训生群体。
可以使用各种统计假设检验来推断ECG特征与不同心理状态之间的显著关系。大多数审查的研究使用了t检验,该检验假设总体服从正态分布。然而,这种假设需要进一步验证,因为采集的数据集很小,可能不符合这种分布。非参数检验,如Friedman检验[121]和Spearman等级相关[122],可以在这个应用中进一步研究,因为它们不依赖于正态性假设。
此外,大多数研究中的ECG特征工程阶段仅限于RR间隔和心率。因此,有一个未满足的需求,即研究其他ECG特征(例如PR和QT间隔以及电压和频域特征)与不同心理状态之间的关系。此外,所使用的聚类算法仅限于传统的K均值、层次聚类、高斯混合模型和DBSCAN。特别是,尚未将基于深度学习的聚类算法用于此目的。需要更大的数据集来开发和训练可靠的深度学习算法,以发现ECG与不同心理状态之间的关系。
最后,正如之前提到的,大多数研究将不同的心理状态,如不同的情绪或不同程度的心理障碍,视为基本事实的聚类。对于大多数使用的聚类算法,这些聚类的数量是必需的先验知识。然而,少数研究使用了不需要这种先验知识的算法,如DP-GMM [52] 和DBSCAN [53]。它们获得的ECG聚类数量比基本事实所示的数量更多。聚类数量的增加通常会导致不同的ECG模式之间更好的分离,但会使专家难以解释聚类结果。未来的工作需要集中在寻找最优的ECG聚类数量上。
这一研究方向的重点在于通过聚类发现不同的临床表型,包括心电图异常、血压情况、代谢指标和人口统计学等,用于研究不同疾病患者之间的差异。几项研究旨在揭示具有类似心电图模式的患者亚群中的潜在机制和显著生物标志物,这几乎是不可能通过视觉手段进行的。
在这些研究中使用的数据集通常包括来自不同疾病条件(如糖尿病、动脉硬化、栓塞性卒中)或慢性习惯(如吸烟)的个体的心电图和血压信号。在对心电图进行聚类之后,确定每个聚类中的主导心电图模式。然后进行假设检验,以确认这种模式是否与聚类所代表的疾病(或疾病的严重程度水平)相关联。由于在这种应用中地面实况聚类通常是未知的,因此可以使用衡量簇内外相似性的指标,如轮廓系数,来提高这些分析的可靠性。在这里,我们回顾了这一研究领域中的一些创新研究。已回顾的研究摘要见表格 IV。
Wang等人研究了心率和血压对预测脊髓损伤患者的直立性心血管失调的影响。他们对207名受试者(48名对照组)在平躺和被动转入坐位时获得的心电图和血压信号进行了层次聚类。具有最佳轮廓系数的聚类结果将受试者分为八组。他们发现心率、收缩压和舒张压可以有效地识别脊髓损伤人群中心血管失调的普遍情况。
Tseng等人研究了心电图、糖尿病、肥胖、高血压和吸烟习惯之间的关系。他们使用PTB数据集中268名受试者的心电图,对时间间隔特征进行了K均值聚类,将患者分为八组。结果显示,几乎所有糖尿病患者都被分到了同一组,这表明糖尿病与心电图之间存在强关联。然而,吸烟、高血压和肥胖患者分布在所有簇中,说明这些状况与心电图的时间间隔特征之间存在较弱的相关性。
Hernandez等人研究了心电图与身体活动能力之间的关系。他们从67名男性受试者在静息、骑车和恢复状态下获得心电图。在心电图采集期间,可穿戴式身体成分分析仪记录了腹腔内脂肪的存储量。他们对时间间隔和小波提取的特征应用了层次聚类,并通过分析树状图找到了一个适当分离数据空间的四簇解决方案。接下来,他们应用了K均值(K=4),发现了以下四个组:(1)具有高体力工作能力的个体,(2)年轻体力工作能力较低的个体,(3)年龄较大、体力工作能力较低且腹部脂肪低至中等的个体,以及(4)年龄较大、体力工作能力较低且腹部脂肪较高的个体。
Lattanzi等人研究了127名患有来源未明栓塞性卒中的患者的心电图异常、人口统计学、代谢指标和吸烟习惯之间的关联。由心脏病专家鉴定的心脏异常,如房颤和高血压,用于聚类。他们进行了层次聚类,并发现了三个患者亚群:(1)年轻男性,患有卵圆孔未闭和后循环梗死,(2)患有高血压、严重中风、左房心病、糖尿病和多种血管领域病变的患者,以及(3)吸烟患者,患有脂质代谢异常、同侧易损的颈动脉狭窄斑块和前循环领域梗死。
Hyun等人研究了心电图和血压与动脉粥样硬化疾病之间的关联。他们应用了一致性聚类方法对从989名患者获取的动态心电图和血压信号进行聚类。他们发现了16个簇,其中两个簇包含了高风险动脉粥样硬化的显著比例的患者。在这两个簇中,代谢指标,包括糖尿病、体质指数和总胆固醇,显著增高。值得注意的是,年龄与所有簇都普遍相关。
Porumb等人对患有夜间低血糖症(睡眠期间血糖水平降低)的受试者获得的心电图进行了卷积自编码器的训练,以预测血糖水平下降。他们使用t分布随机近邻嵌入方法对学习到的潜在表示进行聚类和可视化,结果显示自编码器有效地将记录在低血糖水平期间的心电图与记录在正常血糖水平期间的心电图分开。他们将潜在表示作为卷积神经网络的输入,并在专家提供的标签上训练网络,以将心电图分类为正常和低血糖水平。他们的研究在8名经历夜间低血糖症的受试者中获得了90%的准确率。
在这一研究领域中,层次聚类算法被广泛使用。该算法不需要初始簇的数量,并且提供了结果簇的层次化可视化。这种可视化可以极大地帮助研究人员识别每个亚群体中的潜在机制和生物标志物。自组织映射[54]和t分布随机近邻嵌入[125]是其他众所周知的算法,它们提供了一个二维和三维的地图,用于可视化数据空间中的拓扑结构。由于这两个算法保留了数据的局部和全局结构,它们是这一应用的合适候选算法。
此外,已审阅的研究所使用的聚类算法仅限于K-means和层次聚类。由于这些研究收集的数据集显著大于公开可用的数据集(如MIT-BIH),应用基于深度学习的聚类算法可以进一步提高效果。
最后,与研究探究心电图与心理状态之间关系的研究类似,提取的心电图特征也仅限于RR间隔和心率。因此,有必要研究应用其他时间域、电压域和频率域特征。
生物特征认证是根据个体的生理特征进行身份验证的过程,主要包括指纹和面部。指纹和面部模式容易受到外部攻击,因为它们的物理特征容易被暴露。然而,基于心电图的认证系统很难被欺骗,因为心脏电活动的基本生物特征是隐藏的。
基于心电图的认证系统面临的挑战之一是个体内变异性,这是由于不同的个体的身体和精神状态的不同,可能导致认证失败。一些研究旨在通过聚类分析提高基于心电图的认证系统对个体内变异性的稳健性。其思想是将个体的心电图(或心跳)划分为不同条件下的簇,例如个体处于不同的精神或生理状态,并使用关于簇的信息,如簇的中心,作为用于执行认证的监督学习方法的附加特征。大多数在这个应用中的研究使用了他们在不同情绪或压力水平下记录的心电图数据集。与其评估所得到的簇的质量不同,分类指标,如灵敏度、特异性和F1分数,被用于评估下游的监督认证任务的性能。由于在这个应用中大多数情况下无法得知地面真实的簇,可以进一步使用评价簇间和簇内相似性的指标,如轮廓分数,来提高这些研究的可靠性。
作为一个现代研究的例子,Zhou等人 [23] 使用了高斯混合模型聚类来提高主体在压力下的认证系统的稳健性。特别地,他们将主体的心电图划分为几个不同压力水平的群组。这些簇的中心结合由卷积自编码器学习的心电图的潜在表示,被作为输入特征向量提供给执行认证的支持向量机。他们在23名不同压力条件下的健康受试者上测试了他们的系统,并取得了平均识别率为95%和平均F1分数为0.97的结果。
与认证类似,生物识别鉴定是基于个体的生物特征在先前识别的模板数据库中进行身份识别的过程。基于心电图的识别系统通常由于需要将给定的心电图与数据库中存储的所有模板心电图进行交叉匹配以找到匹配而产生高计算成本。聚类通过对模板心电图进行聚类,帮助降低了此类系统的计算成本。在识别过程中,只搜索与给定心电图信号最相似的簇的中心。Neehal等人 [126] 使用K-means将50000个心电图数据库中的模板划分为五个簇。在识别过程中只搜索最相似的簇,他们将识别时间缩短了79.26%。在类似的方法下,Sufi等人 [127] 提出了一种基于压缩心电图数据的识别系统。压缩心电图数据通常在无线心血管监测中需要使用。然而,解压数百万个压缩心电图信号非常耗时。为了解决这个问题,Sufi等人设计了一个基于高斯混合模型的系统,直接对模板心电图数据库中的压缩心电图信号进行聚类。
这些研究采用的聚类算法主要受限于K-means和GMM。因此,需要进一步研究用于心电图聚类的其他聚类算法,如DBSCAN [53] 和基于深度学习的方法。针对基于心电图的鉴定系统的数据集非常小(n < 30),需要一个更大的心电图数据集,记录不同情绪或压力水平下的数据,以进一步提高对个体内变异的鲁棒性。还需要研究开发能够检测心电图与其他生理信号同步性的聚类算法 [128]。
除了知识发现,聚类和基于深度学习的无监督技术也可以用于改进心电图分类系统的性能并克服挑战。在这个应用中,所识别的聚类质量很少被评估。相反,常常使用分类指标,如敏感性、特异性和 F1 分数,来评估下游的分类任务性能。然而,由于已知地面实况聚类,上述的分类指标以及相似性指标,如 NMI 和 Jaccard 系数,可以用于评估聚类阶段的性能,并提高这些研究的可靠性。MIT-BIH 数据集在这个研究领域中被广泛使用。由于这个数据集相对较小,未来的工作也应该着重使用更大的数据集,比如由Zheng等人[112]和Wagner等人[113]收集的数据集。
在准确分类心电图异常方面的一个长期挑战是数据严重不平衡的问题,因为公共心电图数据集中由心脏病专家提供的标签中,绝大部分都是正常的心跳。例如,在MIT-BIH数据集中,超过75%的标记心跳属于正常类别,而不到1%的心跳属于四个异常类别,分别是室颤、结点逸搏、房性早搏和室性逸搏。这种不平衡的数据导致分类器在检测少数类别时性能较差。克服这个问题的一个众所周知的技术是欠采样,其中从多数类别中随机删除样本,以使训练集平衡[129]。然而,这种技术可能会丢失对分类任务至关重要的相关信息。为了减少欠采样期间的信息损失,Carrillo-Alarcón等人[16]使用自组织映射对MIT-BIH数据集中每个多数类别中的心跳进行了聚类。
基于深度学习的无监督技术也被用于增强异常分类系统的自动化和性能。Xu等人[131]通过使用贪婪无监督算法初始化每一层的权重来提高他们深度神经网络分类器的性能。每个隐藏层被视为受限玻尔兹曼机[69],并使用对比散度算法[132]进行优化 - 这是一种用于训练基于能量的潜在模型的众所周知的无监督算法。然后通过最小化地面实况标签与预测之间的交叉熵损失来微调整个网络。他们在MIT-BIH数据集上使用三个特定患者和一个患者独立的实验来评估他们的方法。他们的系统在MIT-BIH中的三名个体中分别达到了93.1%、94.7%和99.9%的准确率。在患者独立实验中,他们的系统在看不见的患者中也表现出良好的泛化能力,但准确率较低,为91.8%。
患者特定的心电图分类器 - 经过训练并在给定患者的心电图上进行微调的分类器 - 在表现上已经显示出优越性,相比于在通用心电图池上训练的分类器。Zahi等人[17]表明,重新调整分类器以适应患者特定的正常心跳可以改善在MIT-BIH上的分类性能。尽管它们的性能更好,但是患者特定的分类器具有较低的自动化水平,因为它们需要手动标记部分心电信号以进行微调。为了解决这个问题,Zahi等人[17]提出了一种无监督方法来自动识别正常的心电图心跳。他们基于心跳与相邻心跳的相似性对心跳进行了聚类,并确定了在集群中表现出最高平均相似性的心跳为正常心跳。然后,在确定的正常心跳上微调他们的深度分类器。他们的系统在检测两种异常类别,即室性和室上性异位心跳时表现出色,分别获得了97.4%和98.6%的高准确率。
近年来,生成对抗网络(GAN)[15]也被用于提高患者特定分类器的自动化水平。这个想法是利用GAN中的生成器来生成新的患者特定正常心跳。Zhou等人[18]使用了经过GAN生成的正常心跳增强了MIT-BIH数据集,以便更准确地训练和分类室性和室上性异位心跳,从而达到了97%的总体准确率。类似地,Golany等人[19]在每个患者的未标记心电数据的前几分钟上训练了一个GAN来生成正常心跳。与Zhou等人[18]使用卷积神经网络进行心律失常分类相反,他们使用了长短时记忆神经网络[133],并取得了类似的良好表现。
基于深度学习的无监督特征提取技术还提高了与使用手工制作特征的分类器相比的监督分类系统的性能。例如,Nurmaini等人[68]将基于CNN的深度自动编码器作为无监督特征提取技术与深度神经网络结合,用于心律失常分类。他们的系统在整个MIT-BIH数据集上达到了高的F1分数0.92。
将无监督学习与监督ECG分类相结合的另一个优势是使用迁移学习[134]。其核心思想是将在大型数据集上训练的模型参数转移到另一个模型上,以在较小的数据集上进行分类,该数据集可能存在不准确的标签或缺失一些标签。Weimann等人[135]在Icential11K数据集[137]上训练了一个深度残差网络分类器[136](这是最大的公开可用的包含11,000名患者的ECG数据集),然后在Physionet/CinC 2017数据集[138]上微调了他们的网络,以用于房颤检测。Jang等人[139]在超过两百万个ECG样本上预训练了一个卷积自动编码器。然后,他们在另一个包含一万份12导联ECG的数据集上微调了他们的网络,以检测11种心律失常类别,并实现了0.857的F1分数。
除了讨论过的应用外,ECG聚类还被用于其他一些有趣的应用中。Xia等人[24]使用ECG聚类来提高QRS检测系统的准确性。其核心思想是,在ECG中,相互截断的点对之间的线的绝对斜率显著高于截断任何其他点对之间的线的绝对斜率。通过K-means,他们基于点对之间的绝对斜率将所有点对分成两个簇。他们发现一个簇主要包含属于QRS区域的点对。在这些点中,具有最大振幅的点被确定为R峰。在MIT-BIH的八个记录中,他们在R峰检测上实现了99.72%的灵敏度和99.80%的阳性预测性。在类似的思路下,在最近的研究中,Chen等人[25]对每对点的平均振幅以及它们的斜率应用了分层聚类,将点分成两个簇:R波簇和非R波簇。他们在MIT-BIH上的R峰检测中实现了99.89%的灵敏度和99.97%的阳性预测性。
Zhou等人[26]通过聚类从腹部ECG中提取胎儿QRS复合物。值得注意的是,从母体腹部获得的胎儿ECG受到母体心脏活动、胎儿脑活动以及各种噪声(如子宫收缩)的污染。Zhou等人认为,R-S峰的振幅可以作为一个独特的特征来区分母体QRS复合物与胎儿ECG的差异,因为母体ECG中R和S峰的振幅显著大于胎儿ECG中的振幅。他们对ECG中相邻局部最大-最小值对应用了K-means,并找到了三个簇。其中一个簇包含母体的R-S峰,另一个簇包含胎儿的R-S峰,最后一个簇包含非R-S峰。
Salman等人[140]试图通过将远程患者聚类成不同紧急程度的群体,以减少平均等待时间。他们将模糊c均值应用于从ECG和血压信号中提取的特征,并将患者分为五组。所识别的簇对应于正常、感冒、生病、紧急和高风险状态的患者。他们将每个簇视为一个队列,并提出了一个算法,该算法在优先考虑紧急患者的情况下,最小化平均等待时间。
尽管已经进行了有希望的ECG聚类技术研究,但仍然迫切需要更先进的算法,能够在处理大量数据时自动进行,而无需预处理步骤和专家分析。深度学习技术相对传统机器学习方法的主要优势在于自动的特征提取和选择过程。深度学习技术在多项复杂任务中已经表现出优于传统机器学习方法的能力,例如语音识别和图像分类等。然而,很少有研究关注于将深度学习用于无监督的ECG分析。因此,新一代的深度学习算法,如深度自适应聚类[70]和ClusterGAN [76](如在第II-C节中所述)有望应用于ECG聚类系统。
深度学习技术的一个缺点是其缺乏可解释性,因为特征是在黑盒中提取的。随着人们对如何获得结果的兴趣与结果本身一样重要,这在ECG分析中成为一个越来越重要的问题。未来的研究在这个领域应该关注于解释深度学习技术在ECG分析中的可解释性。可以研究采用类似于DeepLIFT [141]的算法。给定一个输入,DeepLIFT通过从预测输出到输入的每个特征反向传播神经元的激活来为神经网络中的每个神经元分配贡献分数。
除了深度学习,对于ECG聚类还可以进一步研究对比学习的应用。对比学习旨在学习一个嵌入空间,在这个空间中,相似的数据点彼此更接近,而不需要标记的数据。它最近在解决视觉和语言处理任务时表现出优越的性能。在ECG分析中,它可以用于无监督或半监督分析,其中心脏病学家对数据集的一个小子集进行注释。有兴趣的读者可以参考 [142]、[143] 获取更多信息。
当心电图(ECG)数据在佩戴设备内进行分析时,聚类方法的时间和空间复杂度必须在设备的计算能力范围内。而当ECG数据传输到远程服务器时,传输通道的可靠性和延迟变得重要。因此,需要高效的压缩和加密算法,以实现ECG数据的最佳和安全的传输。
此外,对噪声的鲁棒性也非常重要,因为可穿戴设备记录的心电图(ECG)质量通常较低于标准临床设备。即使经过降噪处理,也不能保证信号是无噪声的,因为任何降噪系统的实际实现都是不完美的[148]。在这种情况下,使用伪影拒绝算法非常重要。
大部分已评审的方法都是在静息状态的ECG上开发和验证的,此时心率通常低于每分钟120次心跳。然而,在长时间监测受试者的运动状态下,心率可能会有显著的变化。因此,方法对心率变化的鲁棒性也是另一个重要考虑因素。分析通过可穿戴设备记录的ECG是一个新兴的领域,目前关注的研究较少,还有待进一步研究。有兴趣的读者可以参考以下资料获取更多信息:[144]–[147],[150]–[152]。
每天产生的心电图数据量巨大,由于硬件资源有限,不实际存储。此外,对高风险患者进行实时监测和即时检测异常事件至关重要。因此,未来的聚类系统需要处理连续到达的心电图数据,即所谓的数据流。
流式心电图聚类对传统聚类系统提出了几个关键挑战。首先,应该在仅一次传递中分析心电图,因为存储所有到达的信号是不切实际的。其次,随着新的心电图到达,聚类可能会发生变化。第三,必须实时识别心脏事件。值得注意的是,所有在此回顾中审查的方法处理的是非流式心电图,留下了可能的未来研究空间。有兴趣的读者可以参考以下资料以获取有关数据流聚类分析的更多信息[153]–[157]。
到目前为止,已经投入了大量的努力来开发代表不同心脏异常的开放式心电图数据集[1],[112],[113]。然而,如第III-B至III-D节所述,研究发现心电图与不同心理和生理状态之间的关系,以及开发基于心电图的认证系统使用私有数据集。这使得方法之间的比较和复现其结果变得不可能。为了进一步发展这些创新研究领域,需要一个开放式的心电图数据库,其中包含在不同心理状态(如压力或心理障碍)和不同健康状况(如糖尿病)下记录的心电图。这样的数据库需要足够大,并且在个体的性别和年龄方面保持平衡。
大多数回顾性研究并未旨在识别P波和T波以进行特征工程,然而这些波的异常形态可以指示重要的心脏疾病,比如心肌缺血、低钾血症或房颤等 [32]。此外,R波通常被假定存在于所有记录的心跳中。然而,值得注意的是,在一些异常情况下,如右心致病的情况下,R波可能会缺失 [32]。
为了解决这些问题,研究人员可以采用最先进的心电图分割系统,例如Martinez等人开发的系统 [158] 和Bote等人开发的系统 [159]。这些系统能够有效地识别心电图上的P、Q、R、S和T波,从而允许提取所有主要波形的时间和形态特征。
在本文中,我们对心电图(ECG)分析的无监督机器学习方法进行了全面而批判性的回顾。我们审查了传统和最新的心电图聚类算法,并对它们的优势和不足进行了详细讨论。我们还广泛审查了无监督ECG分析的各种应用,描述了每个应用领域的最新研究,概述了它们的局限性,并提出了未来的方向。
我们相信,在无监督生物医学信号处理的背景下,本文中审查的聚类方法将继续在未来的心电图监测中发挥重要作用。