随着人工智能(AI)和机器学习(ML)技术的进步,研究人员正在努力利用这些技术来推进临床实践。医疗保健的关键目标之一是早期发现和预测疾病,以便及时提供预防性干预措施。癫痫尤其如此,其特点是反复发作和不可预测的癫痫发作。如果可以提前预测癫痫发作的不良后果,患者可以从中解脱出来。尽管经过几十年的研究,癫痫发作预测仍然是一个尚未解决的问题。这种情况可能会持续下去,至少部分原因是解决问题的数据量不足。基于ML的算法有了令人兴奋的新发展,有可能在癫痫发作的早期和准确预测中实现范式转变。在这里,我们全面回顾了最先进的ML技术在使用EEG信号早期预测癫痫发作中的应用。我们将找出当前研究中的差距、挑战和陷阱,并建议未来的方向。
癫痫是一组神经系统疾病,其特征是具有引起反复发作的持久易感性,可影响任何年龄的个体。癫痫起源于“癫痫发生”的渐进神经生物学过程[1],这会导致正常大脑网络以自我维持的高度同步方式在大脑皮层激发神经元。根据世界卫生组织(WHO)的数据,全世界有7000万人患有癫痫,而在最广泛的脑部疾病列表中,只有偏头痛、中风和阿尔茨海默病[2]。癫痫引起的癫痫发作会使患者虚弱,扰乱患者的日常活动,并增加过早死亡的风险。许多国家神经科医生的缺乏使癫痫的治疗复杂化,尤其是在神经科医生短缺的发展中国家。
尽管epilepsy和seizures有时在一些文献中被称为同义词,值得注意的是,并非所有的癫痫发作(seizures)都是癫痫性(epileptic)的,而且癫痫发作(seizures)也可能是由于急性神经损伤(如中风、脑外伤、代谢紊乱和药物毒性)引起的,但不一定反映出反复发作的长期易感性(即癫痫epilepsy)。
癫痫发作(epileptic seizure, ES)是由大脑网络中突然发生的异常、自我维持的放电引起的,通常持续不到几分钟。ES攻击很难预测,而且攻击的严重性和持续时间也无法预测。因此,事件造成的伤害和安全问题是患者及其家人的主要担忧。因此,早期预测癫痫发作对于避免和应对其不良后果至关重要。癫痫患者的大脑活动可分为不同的状态:发作前(发作前)、发作中(发作中)、发作后(发作后)和发作间期(发作间期)。有关这些条款的更多详细信息,请参阅本文的章节。ES预测是一个分类问题,即区分发作前和发作间状态。由于癫痫的反复发作性质,ES在群体中发生,癫痫群患者可以通过预测后续癫痫发作获得优势。
脑电图(EEG)是研究ES发作期间大脑功能解剖的一种特别有效的诊断工具。通过脑电图对癫痫的预测和治疗进行了广泛的研究。EEG信号是非高斯和非平稳的,用于测量大脑中的电活动,进而用于诊断大脑疾病的类型。脑电图测量的分析有助于区分大脑的正常和异常功能。为了准确预测癫痫,有必要检查持续时间较长的脑电图记录。神经科专家通过研究连续几天、几周甚至几个月记录的脑电图信号来检查癫痫,这需要大量的人力和时间。多年来,各种研究都采用了基于机器学习(ML)的预测方法来解决这个问题。深度学习(Deep learning,DL)是一种先进的ML技术,它能够通过多层层次结构处理大量数据,从而更精确地从中学习模式。DL产生非常精确结果的能力影响了研究人员通过使用DL技术来处理许多实际应用,在过去五到六年中,许多研究人员提出了基于DL的ES预测方法。
本文的目的:强调运用ML方法预测癫痫的主要进展。我们将简要介绍神经科学、用于研究大脑的各种工具,以及它们如何被或可能被用于预测癫痫。
本文的贡献:
虽然有几篇综述专门涉及使用EEG信号预测癫痫发作,但据我们所知,目前还没有一篇综述深入介绍ML方法在预测癫痫发作中的应用。例如,Mormann等人概述了20世纪70年代至2006年期间癫痫发作预测方法的演变[3],并涵盖了与ES预测方法有关的主要问题。Gadhoumi等人简要概述了用于ES预测的有效方法,并全面描述了预测结果的统计显著性[7]。在最近发表的综述中,Kuhlmann等人简要描述了ES预测和ES预测竞赛领域的进展。他们得出结论,这些标准统计评估的进步为ES预测方法的发展开辟了道路,他们改进了现有的指南,以实现这一发展[12]。这项调查之所以独特,是因为它全面回答了以下问题:为什么需要使用ML技术进行ES预测,DL等相对较新技术的发展如何证明对ES预测非常有用,并讨论了该领域未来研究的方向。表一列出了本文与现有调查的比较。
本文的结构:
本文的结构如图1所示。第二节简要介绍了神经科学、脑电图和癫痫预测的背景。第三节介绍了用于ES预测的数据驱动ML方法。第四节包括识别应用这些方法的几个陷阱。第五节介绍了未来的发展方向和有待解决的研究问题。最后,第六节总结了论文。表二列出了论文中使用的首字母缩略词。
缩略词 | 含义 |
---|---|
ANN | 人工神经网络 |
ApEn | 近似熵 |
BLDA | 贝叶斯线性判别分析 |
CNN | 卷积神经网络 |
CWT | 连续小波变换 |
DNN | 深度神经网络 |
DWT | 离散小波变换 |
EMD | 经验模态分解 |
ES | 癫痫发作 |
FD | 分形维数 |
FPR | 错误预测率 |
FT | 傅里叶变换 |
HE | 赫斯特指数 |
HHT | 希尔伯特-黄变换 |
HP | Hjorth参数 |
LLE | 最大李雅普诺夫指数 |
LSTM | 长短时记忆 |
MLP | 多层感知机 |
RNN | 循环神经网络 |
SEF | 谱边缘频率 |
SBP | 频带功率 |
SM | 统计矩 |
SOM | 自组织映射 |
SpM | 谱矩 |
TPR | 真阳性率 |
WFT | 小波傅里叶变换 |
WT | 小波变换 |
神经科学是对大脑的多学科研究。它整合了多种学科,包括神经解剖学(神经解剖学专家参与研究人脑结构)、神经化学(化学家观察大脑中相互交流的化学性质),神经生理学(神经生理学家研究大脑的电特性)和神经心理学(心理学家努力在神经科学中解释认知领域和支撑这些认知领域的结构)[13]。神经科学还有进一步的分支,例如分子神经科学、认知神经科学[14]、临床神经科学、计算神经科学[15]、发展神经科学和文化神经科学等等。
大脑在解剖学上被划分为多个群体,这些群体构成了一个功能专门化的大脑网络(功能分离)。这些功能上隔离的社区在功能上相互关联(功能整合),以执行非常复杂的任务,比如实现认知[16]。神经成像使用各种方法直接或间接地成像中枢神经系统的结构和功能。两大类是涉及解剖学、病理学或损伤的结构成像和涉及代谢、药理学或认知的功能成像。一些重要且广泛使用的神经成像技术包括:计算X射线吸收量的计算机断层扫描(CT),以提供大脑的一系列横截面图像;产生活性分子结合图像的正电子发射断层扫描(PET);检查大脑解剖和病理的结构磁共振成像(MRI);检查大脑活动的功能性MRI;扩散磁共振成像,绘制水分子在大脑中的扩散,以揭示脑组织的宏观细节;磁共振波谱(MRS)成像用于研究脑肿瘤、中风和癫痫等的代谢变化。在不同的生理情况下,大脑的电活动可以使用EEG进行测量,EEG属于功能成像的范畴。
1923年,汉斯·伯杰发明了EEG,这是一种研究大脑的无创功能成像方法。EEG通过测量神经元群的电活动来记录来自大脑皮层的电信号。与功能性MRI相比,EEG对神经活动提供了更高的时间洞察力,但空间分辨率较低。通常,为了处理EEG信号,需要分析五个频段:Delta(高达4 Hz)、Theta(4–8 Hz)、Alpha(8–12 Hz)、Beta(12–26 Hz)和Gamma(26–100 Hz)。这些频带及其与人类行为的关系总结见表III,EEG的振幅范围为10µV至100µV,而其频率范围为1 Hz至100 Hz。
频带名称 | 频率范围(Hz) | 与人类行为的关系 |
---|---|---|
Delta | 1-4 | 主要见于婴儿和正常成年人的深度睡眠阶段 |
Theta | 4-8 | 在清醒的成年人中,Theta的高值表明认知活动异常 |
Alpha | 8-12 | 通常出现在正常放松成年人的大脑后部 |
Beta | 12-26 | 存在于警惕焦虑的人的大脑额叶区域 |
Gamma | 26-1000 | 主要见于压力大、快乐或有意识的人 |
为了诊断一种疾病,或利用EEG数据解码大脑活动,首先通过应用傅立叶变换(FT)或小波变换(WT)提取原始EEG数据的特征或使用其频谱信息。这些提取的特征或转换后的原始数据然后用于训练基于ML的分类器,而DL算法已被证明对于自动提取特征进行训练是有效的。有两种基于参考电极位置的脑电图记录方法。
(1)Bipolar Montage:在双极蒙太奇中,两个电极都放在头皮的电活动区域,并测量电极之间的电压差。
(2)Monopolar Montage/Unipolar Montage:在单极蒙太奇中,一个电极放在电活动区域,参考电极放在非电活动区域(例如耳垂)。
记录脑电信号的传统方法是将电极置于颅骨表面,即头皮脑电。头皮脑电图的主要缺点是,由于颅骨内的神经元与电极之间的距离较大,记录的信号会失真。为了在失真和振幅方面提高信号质量,通过将电极置于大脑暴露表面来记录颅内脑电图(iEEG)信号。
EEG具有几个特点,因此它更适合用于ES预测研究。除了能够跟踪癫痫期间大脑中发生的各种变化外,它还提供了另一个主要功能,即相对较低的硬件成本,这使得它能够用于大量患者并记录更长的时间。其他多种技术,如功能磁共振成像(fMRI)或脑磁图(MEG),需要笨重且不可移动的设备,这将导致数百万美元的成本。在当前预测癫痫发作的实用方法中,==My Seizure Gauge==是可穿戴设备中最典型的例子,该设备被创建为癫痫发作预测的个性化咨询设备[17]。该设备可以记录颅内脑电图、头皮脑电图、肌电图(EMG)(记录骨骼肌产生的电活动)、心电图(ECG)(记录心脏的电活动)、皮肤电活动(EDA)、光体积描记术(PPG)和呼吸。
脑电图分析方法主要分为时域方法、频域方法、时频域方法和线性或非线性方法[4]。
a) 时域方法:脑电记录是时间的非平稳非线性函数。线性预测是一种时域方法,根据输入和早期输出计算输出。主成分分析(PCA)、线性判别分析(LDA)和独立成分分析(ICA)是广泛使用的无监督时域方法来总结脑电数据。PCA用于将高维数据(如果是高维特征向量)转换为低维数据,而ICA将高维数据分解为线性统计独立分量。在EEG数据分析中,ICA最常用于去除伪影。然而,LDA通过寻找特征向量的线性组合来降低特征集的维数。
b) 频域方法:在癫痫发作期间,EEG信号的频率会发生突然变化,这可以通过应用频域方法来测量,例如使用傅立叶变换(FT)。人们可以使用参数或非参数方法来估计功率谱,使用的是FT-Welch(一种非参数)方法,它是广泛使用的周期图方法的改进版本,通常用于PSD的估计。但这有一个频谱泄漏的缺点,可以通过使用参数化方法来克服。参数化方法通过假设脑电信号是平稳随机过程来提供更好的频率分辨率。移动平均(MA)、自回归(AR)和自回归移动平均(ARMA)是常用的参数化方法。
c) 时频域方法:上述时间域和频率域方法在分别提供特定时刻所涉及的精确频率和时间矩信息方面存在局限性。为了克服这些限制,小波变换(WT)是一种基于时间频率的分析技术,被广泛用于通过将EEG信号通过滤波器组来获得多分辨率分解的子带信号。
d) 非线性方法:非线性分析方法用于检测信号频谱中谐波之间的耦合。高阶谱(HOS),熵的各种度量,例如近似熵(ApEn);科尔莫戈罗夫熵;样本熵(SampEn)-与赫斯特指数(H)、最大李亚普诺夫指数(LLE)一起被广泛用于EEG分析的非线性参数。熵和LLE是癫痫分类的常用特征。熵提供了有关存储在信号概率分布中的信息的线索,并测量了数据模式中的不确定性或随机性。熵值越高,数据的模式就越随机。LLE提供系统依赖于初始条件的信息。有关分析技术的更详细回顾,请参阅[6]和[4]。
分析脑电图信号是识别大脑中ES活动的主要方法。脑电图记录是区分ES和非ES的重要临床工具。癫痫发作前和发作期间记录的EEG信号包含可用于识别癫痫发作不同阶段以及发作前后的特征。以下简要介绍了这些阶段[6]。
(a) 发作前状态:发作前状态在癫痫发作前的一段时间内变得明显,在其余时间内不会发生。它可能不一定是视觉上显而易见的。然而,它将反映潜在信号的变化,并在特定值范围内预测癫痫发作。对于临床上用于预警系统的发作前状态,必须尽早检测到,以便将错误预警的时间减至最少[12]。
(b) Pro-Ictal状态:在这种状态下,癫痫发作的可能性更大,但并不一定会发生。
(c) 发作期和发作间期:发作期是癫痫发作期间EEG信号的变化,发作间期是随后两次发作之间的阶段。对于同一个人来说,致痫神经元的数量、皮质区域和癫痫发作的持续时间都可以改变。
(d) 发作后状态:发作后的状态。
波形可能包含有关大脑活动的有价值的信息。经验丰富的神经学家可以通过视觉观察EEG信号来检测疾病。然而,由于动态非线性EEG数据的高时间和空间方面,该过程耗时且容易出现错误检测。因此,计算机技术、脑电信号参数提取和分析可以在诊断中大有裨益。
20世纪70年代,ES预测的早期研究使用了特征提取的线性方法[18]。而在20世纪80年代,由于EEG信号的非线性性质,非线性方法的发展帮助研究人员将这些技术用于特征提取[19][29]。随着人们对癫痫的脑电图模式——即发作前、发作期和发作间期模式——的认识,在这十年中,使用发作前阶段进行ES检测也得到了应用。1998年,Salant等人[34]在癫痫发作前6秒对ES进行了早期预测,Drogenlen等人在2003年进一步发展了该预测[35]。他们使用科尔莫戈罗夫熵作为特征,在发病前2-40分钟预测ES。第一次ES预测国际研讨会于2002年举行,会上不同癫痫中心提供了多天EEG记录数据集。后来,对该数据集进行了几项研究[36]。2003年,Mormann等人利用大脑中神经元的超同步放电是ES的一个原因这一事实,发现不同EEG通道的相位同步在癫痫发作之前降低[37]。在本世纪的前十年,基于大量脑电数据的研究对上个世纪计算的测量性能提出了质疑。研究人员发现,基于选定的、不充分的数据量的早期研究结果无法在广泛的、看不见的数据上重现。
决定在关于上述主题的国际研讨会上举办关于癫痫预测的竞赛。这些竞赛的目的是对在公共数据集上训练的算法的性能进行标准化比较。第一届癫痫预测竞赛于2007年与第三届国际癫痫预测研讨会(IWSP3)合作举办,第二届竞赛于2009年与第四届国际癫痫预测研讨会合作举办。在这两项比赛中,参赛者都获得了三名癫痫患者的连续iEEG记录。然而,这些算法的性能结果并不令人满意。美国癫痫协会癫痫预测挑战赛于2014年举行,涉及短期人类iEEG,其中942次癫痫发作记录超过500天,以及患有癫痫的狗的长期iEEG记录。所有参赛者都获得了相同的10分钟训练和测试数据。曲线下面积(AUC)用作性能评估指标。在同样的结构下,墨尔本大学举办的另一项比赛涉及1139例癫痫发作的长期iEEG记录。有关比赛的更多详情,请参见[38]。竞赛对任何计算EEG信号基本特征的算法开放,用于ES预测或基于这些基本特征训练的机器学习模型。无论如何,我们仍然不知道什么特性或算法是最好的。在比赛中,人们提交了太复杂的算法。所以很难说哪种特征或ML算法是最好的。竞赛的组织者正在努力用Epilepsyecosystem.org来剖析它。Matias Maturana等人[39]最近的工作提出了一种可能对患者有效的解决方案。他们将大脑信号的临界减慢确定为ES预测的指标。EEG数据测量的发展时间表如图2所示,感兴趣的读者可以参考[40]了解关于这些发展历史的更详细信息。
在本节中,我们将全面回顾使用基于ML的方法进行ES预测的文献,并在本节开始时首先强调使用ML技术进行医疗保健和神经科学应用的潜力。
在过去几十年里,通过使用统计方法识别大量数据中的模式,ML在各个研究领域迅速发展。大规模生物医学数据的可用性为医疗保健研究人员翻开了新的一页。有效医疗工具的开发依赖于数据分析方法和ML技术的进步。因为由于医疗数据的复杂结构,无法手动检测表征,这就是为什么ML在医疗保健中广泛用于疾病诊断,例如乳腺癌的检测[41],皮肤癌的分类[42],阿尔茨海默病的诊断[43],癫痫的预测[44],以及视网膜图像中糖尿病视网膜病变的诊断[45]。基于电子健康记录(EHR)的ML算法已被证明有助于预测未来的疾病,并能够根据患者的临床状态自动诊断患者[46],尽管仍需要大量工作。具有大型图像数据集的生物医学领域,如放射学[47]、心脏病学[48]、病理学[49]和基因组学[50],正在使用各种ML方法来自动诊断、分类和预测各种疾病。
近年来,对人脑结构和功能解剖学的研究一直是神经科学家最关注的焦点。技术的进步使神经科学家能够以前所未有的细节获取、处理和分析神经成像数据,而ML和DL是这类使能技术的最重要例子,可以作为神经科学家构建大脑功能理论的潜在探索来源[51]。在本节中,我们将对神经科学领域中使用的各种ML技术(例如,有监督学习、无监督学习和强化学习)进行总体介绍。
在监督学习中,训练数据连同人类专家指定的标签一起被输入学习算法,以提取数据和标签之间的关系,这样系统就可以将看不见的数据准确地分类到各自的类别。例如,训练数据由带有房屋、狗、猫标签的图像组成,我们需要一种算法,可以预测系统以前未知的图像的标签。这些算法在计算和理论神经科学领域有着广泛的应用,例如支持向量机(SVM),这是一种监督学习算法,通常用于预测ES(在后一节中描述)。压力下的神经机制分析是使用有监督的ML方法进行的。
我们的大脑在没有任何指导的情况下一天接收到大部分信息。大脑从信息的重复中发展出一个工作模型,并利用这个模型进行感知。然后,这种感知被用于检测新信息中的模式。无监督学习算法的动机是大脑如何通过感知研究新事物。无监督学习应用未分类或未标记的数据来训练算法。这些算法广泛用于从神经生理学数据中识别和分类疾病。作为一个代表性的例子,我们参考了Drysdale等人的工作,他们使用功能磁共振成像对抑郁症类型进行分类[53],以及O’Donnell等人的工作,他们使用聚类算法从扩散磁共振成像中识别白质束[54]。
动物心理学,即动物之间以及与环境之间的交流方式,有助于发展强化学习(RL)[55]。由于神经科学和人工智能的合作,RL是技术进步的一个重要例证。强化学习是制定策略的过程,以最大限度地提高agent与其环境之间交互的回报。强化学习系统的核心因素是政策、奖励信号、价值函数和环境模型。
自上个世纪以来,研究人员一直在努力克服与癫痫检测和预测相关的障碍。由于EEG信号是监测ES之前、期间和之后大脑活动的关键来源,因此ES预测研究的第一个重点是EEG记录的分析。脑电图信号会因眼球运动、眨眼、心脏信号和肌肉噪音而受损。使用了几种滤波和降噪方法来降低这些不同噪声源和伪影的影响[56]。去除伪影后,需要显著的特征来构建ML模型,以识别和分类发作前和发作间阶段。图3显示了用于癫痫预测的经典ML方法,并强调了ML和DL技术使用之间的主要差异。基本上,我们可以将原始数据或经过最少处理的数据(即,不从原始数据中提取特征)提供给DL模型以进行模式学习。
噪声和伪影识别是原始生物医学信号中的关键步骤。为了减少特征提取中这些伪影的影响,需要对这些伪影进行过滤。滤波采用了多种技术,例如带通滤波器、小波滤波器、有限脉冲响应滤波器和自适应滤波器。执行此处理也是为了使数据正常化,使其与其他患者的记录具有可比性。由于植入电极的限制,EEG记录中也存在许多数据丢失或数据损坏,导致算法性能不显著。由于肌肉伪影和环境噪声,数据中也存在一些异常值。这些异常值的存在严重影响了提取的特征。
所有预测模型都需要可靠的特征,与发作前和发作间期密切相关。人们可以根据EEG通道的数量将这些特征分类为单变量(分别对每个EEG通道进行测量)和多变量(对两个或多个EEG通道进行测量)特征。这些特征的进一步分类是线性或非线性特征。Florian等人比较了包含ES预测线性和非线性策略的单变量和双变量测量的性能[57]。他们指出,在使用单变量测量时,发作前变异在ES发病前5-30分钟发生。而双变量测量通过在ES发病前至少240分钟捕捉发作前的变化表现得更好。图4显示了文献中用于ES预测的一些线性和非线性度量。线性测量的表现更好,或者有时与非线性测量类似。
使用最大似然算法,例如人工神经网络(ANN)、k均值聚类、决策树、支持向量机和模糊逻辑,从脑电数据中识别发作前和发作间期模式。大多数基于特征值的阈值用于得出结论。然而,基于ML的研究主要集中在提取用于预测的优化特征上 。
a) 使用双谱特征预测癫痫发作:早期研究中用于检测癫痫发作的iEEG记录的高阶谱(HOS)特征[65]。然而,Assi等人[64]利用HOS特征表示,EEG的双谱分析提供了重要的相位信息。他们发现,在发作前的癫痫发作状态下,标准化双谱熵和标准化平方双谱熵降低。他们从癫痫狗的30秒非重叠iEEG记录窗口中提取了这些特征。他们训练了一个5层多层感知器(MLP),用于对发作前和发作间期进行分类。MLP的输入层由16个节点组成,因为有16个iEEG信号通道。他们添加了3个隐藏层,包括30、60和30个节点的ReLu激活功能。他们使用每个特征计算与发作前和发作间期分布对应的F1分数和p值。然而,研究人员倾向于分析该算法对确定的癫痫发作预测范围和发作发生期的敏感性和特异性。这一方面在本研究中缺失。
置换熵(PE)已被用于各种早期研究,以表征癫痫的EEG状态[66],[67]。2007年,Li等人[68]使用PE来区分大鼠的发作前状态。最近,Yang等人[44]使用PE作为从弗莱堡医院数据的iEEG数据中提取的特征。他们分析了19名患者的83次癫痫发作。他们使用5秒的特征片段作为输入,用RBF核训练SVM分类器。灵敏度和错误预测率(FPR)用作性能分析指标。他们的灵敏度为94%,平均FPR为0.11,平均SPH为61分钟。
b) 使用选定的数据量预测癫痫发作:减少EEG的维数是研究人员在处理数据和使用这些数据预测癫痫发作时最关心的问题之一。人们提出了各种降维技术,但有其优缺点。在最近的研究中,Kitano等人[60]提出使用少量数据来预测癫痫发作。在CHB-MIT数据库24名患者长达数小时的记录中,他们只使用了9名患者20分钟的数据。20分钟的数据包括发作前10分钟和发作间期10分钟的数据。他们在这20分钟数据的4秒非重叠窗口上应用DWT,并提取DWT的1级详细系数的零交叉点。他们使用自组织映射(SOM),以前由Teuvo Kohonen在1982年[69]引入,用于映射发作前和发作间期集群中的输入数据。使用选定的数据量,他们达到了98%的灵敏度。
尽管Kitano等人在选定的数据量上取得了非常显著的结果,但这种选择存在各种缺陷。发作前和发作间期模式在患者和住院患者之间存在时间差异。随机选择发作前10分钟的数据并不是一个重要的方法。在少量数据上训练模型会导致结果的过度拟合。通过对随机选择的少量数据进行训练,该模型可能无法在实时场景中显示显著的性能。表四总结了最近使用ML技术进行ES预测的工作。
DL模型是ML研究进展的结果,它提供了处理原始数据的能力。DL模型由多层计算(非线性)模块组成,这些模块相互作用以处理数据并产生最终结果。这些多层有助于提取适当的特征,并对输出结果进行检查或分析。例如,在分类任务中,更高层次的表征放大了输入的特征,这些特征对辨别有重要意义,并抑制了不必要的变化。DL模型的核心是,它们包含模块化层,用于使用通用算法学习数据[76]。这些层是深层神经网络(DNN)的构造块。常用的神经网络有卷积神经网络(CNN)和递归神经网络(RNN)[76]。CNN的结构类似于大脑中神经元的连接模式。CNN的卷积运算就像一个带权值的滤波器,用于从多维输入数据中提取特征。而RNN用于查找输入数据中的逻辑序列。每个隐藏层的输出传递给下一层,并反馈给自身。简单地说,当前输出是当前时刻和历史的综合体验。美国有线电视新闻网和RNN体系结构的关键区别在于CNNs只考虑当前输入,而RNN考虑当前输入和先前输入,即它包含存储器逻辑。 RNN在时间序列数据上的表现明显更好,而CNN在图像分类等任务上表现更好。
DL体系结构已被用于许多医学领域,如临床成像[77]、基因组学和蛋白质组学[78]、计算生物学[79]和疾病预测[70]。DL算法被证明足以在高维数据中检测复杂模式进行分类,尤其是在EEG数据中。CNN是一种使用EEG数据进行训练的广泛使用的神经网络,因为它可以非常有效地降低噪声[80]。
DL正在解决许多领域的问题,然而,DNN和神经系统研究之间存在着强有力的联系。人工神经网络被认为是大脑活动计算的模型[81],而CNN是视觉信息处理的模型,CNN隐藏层的激活被认为是与视觉感觉运动处理相关的连接大脑区域中神经元的活动。深度网络是神经科学中有价值的计算手段,因为它们是大脑中神经活动的统计时间序列模型,例如,CNN可以作为计算神经科学的编码模型。在连接组学中,为了理解神经网络在大脑中的连接性映射,深度网络用于从3D电子显微镜图像中理解神经单元的连接性[82]。现有的进步时代正在加速神经科学启发的ML工具的研究[81]。
最大似然分类算法使用从传统信号处理方法中提取的特征向量进行训练,并提供良好的精度,但这些技术无法预测广义模型。对于通过ML方法预测癫痫发作,脚本编写需要花费大量时间的特征提取阶段。数据中噪声和伪影的存在使得特征提取非常复杂。因此,产生一个具有忠诚性能的广义自动系统是一个具有挑战性的问题,尤其是在训练样本有限的情况下。另一方面,DL算法自动学习特征,并在ES预测中给出令人鼓舞的结果。通过DL模型学习的功能比手工制作的功能更具区别性和健壮性[83]。
为了介绍一种可以应用于所有患者的方法,Troung等人[71]提出了一种基于CNN的预测方法。他们使用弗莱堡医院iEEG数据库和CHBMIT头皮脑电图数据库对CNN模型进行训练和测试。短时傅立叶变换(STFT)用于将原始脑电数据转换为二维矩阵。然后,这张图像被送入CNN进行特征学习,并对发作前和发作间状态进行分类。为了评估算法的性能,他们将癫痫发作预测期(SPH)设置为5分钟,癫痫发作发生期(SOP)设置为30分钟,并使用敏感性和错误预测率作为评估指标。在lleave-one-out交叉验证后,他们在原始EEG上的灵敏度为79.7%,FPR为0.24,在标准化数据上的灵敏度为89.8%,FPR为0.17。
对于ES预测器的实时临床应用,SPH必须足够长,以允许患者走出危险状况并采取预防措施,SOP不应过长。海德尔等人[70]通过给予87.8%的灵敏度和0.142 FPR(10分钟SPH),比之前的工作表现更好。他们使用CHBMIT和MSSM数据库对模型进行训练和测试。原始EEG转换为小波张量,CNN用于从转换后的数据中提取特征,用于对发作前和发作间期数据进行分类。
Cook等人[84]证明了植入式记录系统的成功,从而确立了ES预测在临床环境中的可行性,之后,进一步研究的新途径已经打开。为了推进Cook等人的工作,Isabell等人[85]提出了一种便携式癫痫发作预测系统,该系统的参数可根据患者的需要进行调整。他们将iEEG数据转换成频谱图,并将频率转换后的数据作为深度学习模型的输入,用于发作前的自动特征学习。
这些可调参数包括系统的灵敏度、持续时间和预警数量。为了调整这些参数,作者在模型中添加了一个处理层。他们在低功耗TrueNorth芯片上部署了预测算法,推出了一款可穿戴设备。他们的预测系统的平均灵敏度为69%,平均预警时间为27%,显著超过所有患者的可比随机预测值42%。
受Cook等人[84]和Karoly等人[86]的工作启发,Ramy Hussain等人[72]对这些患者的部分数据进行了研究,证明癫痫预测算法无法对某些患者产生令人满意的预测敏感性。他们采用了下采样技术,将数据的维数降低了4倍。他们解释说,手工制作的特征不适合真实的ES预测,因为EEG数据不仅在患者之间不同,而且随着时间的推移,同一患者的EEG数据也不同。他们通过应用STFT转换EEG数据,并将转换后的数据输入CNN。为了学习局部特征,他们使用1x1卷积层,为了学习抽象特征,他们使用更大的卷积。作为预测算法的性能指标,他们获得了87.85%的灵敏度和平均0.84 AUC。他们还解释了ES预测算法性能有限的原因是数据丢失、数据不匹配、不平衡分布和数据中的异常值。
ES预测中的一个问题是标记数据的可用性。为了克服这个问题,Troung等人[74]采取的第一步是使用生成性对抗网络(GAN)进行无监督训练。他们将EEG的STFT频谱图输入GAN,并使用经过训练的鉴别器作为特征来预测癫痫发作。这种无监督训练非常重要,因为它不仅使用EEG记录提供实时预测,而且不需要手动进行特征提取。他们使用AUC作为5分钟SPH和30分钟SOP的性能指标。他们将结果与模型训练的监督方法进行比较,他们的方法表现良好,CHBMIT头皮EEG数据的AUC为77.68%,弗莱堡医院数据的AUC为75.47%,癫痫数据库的AUC为65.05%。这些工作的总结见表五。
Tsiouris等人[73]首次使用长短时记忆(LSTM)预测癫痫发作。他们比较了随机选择的输入段大小为5-50秒的LSTM不同体系结构的性能。他们使用EEG片段的特征向量作为LSTM的输入,比较了三种LSTM结构的性能,其中特征向量包括来自时域、频域的各种特征,以及图论中的局部和全局度量。LSTM-1体系结构由一层32个内存单元组成,而LSTM-2体系结构中的内存单元数量增加到128个。存储单元的数量保持在128个,但在LSTM-3中增加了一个额外的等维层。LSTM-3的性能在三种考虑的体系结构中是最好的。使用15分钟的发作前窗口,他们还评估了LSTM3作为原始EEG输入的性能,并与特征向量的性能进行了比较。他们表明,具有原始EEG输入和令人满意的性能的深层架构在上述领域仍然是一个有待解决的问题。平均而言,LSTM-3表现更好,发作前15分钟的敏感度为99.28%,发作前30分钟的敏感度为99.35%,发作前60分钟的敏感度为99.63%,发作前120分钟的敏感度为99.84%。然而,这些结果需要太多的特征工程。
脑电图(EEG)正成为获取大脑信号以检测和预测癫痫的主要手段。为此,各医院和研究中心发布了各种开放存取数据库。例如,波士顿儿童医院癫痫中心和坦普尔大学医院已经向研究人员公开了他们的脑电图数据库,这些研究人员旨在开发ML/DL模型和其他基于统计分析的方法。在表六中,我们总结了这些广泛使用和公开可用的数据库。尽管波恩大学的数据库不够大,但在文献中被广泛用于ES的检测。它由5个数据集A、B、C、D和E组成。CHBMIT数据库有22名患者的数据,每个患者有9-24次记录,每次记录时间为1小时,由于硬件限制(有些病例记录时间为2-4小时),有些不连续。弗莱堡医院的数据库是相当大的数据库之一,其中包含21名受试者的iEEG数据,约88例癫痫发作,但最近它已被合并到EPILEPSIAE数据库中,以提供更大的数据集,但该数据库现在不是开源的。
ES预测方法的临床应用需要充分的性能和质量检查,ES预测文献中提出了不同的评估指标。例如,Osorio等人提出敏感性和假预测率作为ES预测器的性能参数[87]。敏感性是指正确预测的癫痫发作与所有癫痫发作的比率。此外,与理想情况相反,无法防止错误预测,并且随着灵敏度的增加,错误预测率也会增加。下面介绍了广泛使用的评估指标。
其中
ES预测器在癫痫发作前会发出警报,根据理想情况,预测器必须预测发作的确切时间。在实际应用中,预测者预测癫痫发作的高概率持续时间。因此,一个性能检查指标是发作发生期(SOP),即有可能发作的持续时间。另一个指标是癫痫发作预测范围(SPH),即从报警到SOP开始的持续时间[88],[89]。图5说明了SPH和SOP的概念。
ML解决了ES预测的几个挑战,包括手动、繁琐和耗时的分析方法。模型解释至关重要,数据中的模式识别与数据拟合同样重要。生物医学的一个基本难题是疾病及其亚型的正确分类。大量可用的生物医学数据可以识别出更全面的亚型。人们可以很容易地找到ML,特别是DL改善EEG分析的各种方法。神经网络的层次性极大地开发了从原始数据或最小处理数据学习特征的潜力。通过DL模型自动学习的特征比通过分析工具提取的特征更强大、更有效。这表明DL有潜力在分析任务中提供高性能。癫痫预测的研究已经进行了多年,使用不同的方法取得了很多进展,但也存在许多问题。接下来将讨论与使用ML方法进行ES预测相关的一些潜在缺陷。
ES预测和分析研究的一个核心问题是长期EEG数据的不可用性。2005年,Iasemidis等人在ES发作前约91分钟对私人EEG数据进行了预测报警[31]。然而,从那时起,没有人能够在任何公开的脑电图数据上重现这些结果。因此,迫切需要开放访问共享长期记录的EEG数据库,并共享代码(使用Github或类似的存储库)以确保结果的可重复性。
预测算法性能低下的主要原因之一是缺少观测值。由于存储容量有限的可穿戴设备或植入设备与存储设备之间的通信故障,观察到的数据中有许多零值或几乎等于零值,原因可能有几个。从腐败或缺失的数据中学习并没有引起机器学习界的太多关注。然而,有必要在模型中添加缺失指标,以便为预测提供重要信息。
过多的特征提取会增加时间消耗和计算成本。我们需要一个具有相对低功耗硬件和较低计算成本的快速预测,以便实现ES预测的实时系统。不幸的是,研究人员还不能建立一个从原始信号中学习可行特征的模型。虽然DL通过从预处理数据中自动提取特征,极大地解决了特征提取问题,但其局限性在于,这些方法需要大量数据才能进行有效预测[90]。
ES预测研究的主要目的是提高患者的生活质量。在这篇综述中,我们对ML应用于ES预测的最新技术进行了全面评估,但成本效益和高效的硬件实现仍然是瓶颈。虽然已经在硬件实现方面进行了一些初步工作[91],但对于如何制造成本效益高、产生优化结果的设备,以及如何使它们的使用变得普遍,还需要做很多工作?只有这样,患者才能从这项研究中受益。
在本节中,我们将介绍未来ES预测工作的方向,以及需要进一步研究的各种开放性研究问题。
EEG信号是使用多个电极记录的,因此记录信号的维数增加,分析多通道EEG信号变得困难。理想的方法是通过应用适当的信号分析技术(例如,将其转换为频谱图)将多通道EEG数据转换为单通道,或利用大脑信号集合中的单通道EEG信号。据观察,在多通道EEG的一些信号中,有趣的癫痫相关大脑活动较弱[92]。因此,选择高质量的信号对有效预测癫痫发作至关重要。在最近的一项研究中,提出了一种基于信号质量指数(SQI)的自适应算法,用于非惊厥性癫痫患者的多通道EEG最佳通道选择[92],并且已经做出了大量努力,使用不同的降维技术,如主成分分析(PCA)[93],开发了用于EEG通道选择的自适应算法,独立成分分析(ICA)[94]和基于区分矩阵的降维[95]等。然而,最优策略的制定仍然是一个开放的研究问题。
在文献中,ES预测和检测问题大多被描述为一个需要标记数据的有监督学习任务。脑电图记录由神经科专家和内科医生手动标注,这是一项昂贵、耗时且整洁的任务。ML技术的性能在很大程度上取决于注释的质量和提高ML技术的效率,尤其是自然的方法是使用更多的训练数据。开发用于评估训练模型性能的真实验证集也很重要。然而,将大规模收集的脑电记录注释到各自的类别实际上是不可行的,这妨碍了ML/DL技术的适用性。这就需要开发数据标记的自动化方法,例如主动学习、使用生成模型的数据标记(例如,在[74]中介绍了使用GAN的ES预测),以及基于无监督聚类的分类等。
在临床环境中,患者的数据是跨不同设施生成的,为了开发高效的ML/DL技术,需要在不同部门以及不同医院之间共享分布式数据。此外,可以整合来自不同领域的数据,以提取不同任务(例如标注)所需的知识。递归模型和不同的自然语言处理(NLP)技术可用于从原始临床笔记和电子健康记录(EHR)中提取丰富的知识,从而增强数据标注者的能力。此外,还可以开发能够从异构源和分布式数据中学习的ML/DL模型。然而,数据共享和管理的成本可能是巨大的,这也将给数据完整性、可用性和隐私带来新的挑战。这一工作方向需要创新的方式来鼓励数据pooling和共享。
尽管DL技术具有最先进的性能,但这些方法都是黑盒模型,缺乏关于其学习行为和思维过程的基本理论。因此,他们的决定无法解释,因此预测的不确定性量化变得极其困难。此外,医疗保健应用程序的生命关键性要求DL模型的决策同时具有可解释性和可解释性。有人认为,可解释模型能够为其开发的特定任务提取最相关和重要的特征[96]。在最近的一项研究中,提出了一个名为Deep-Tune的可视化框架,该框架使神经科学家能够识别CNN模型中激活特定神经元的模式,该CNN模型是为神经棘波率预测任务而训练的[97]。开发可解释的最大似然模型的工作正在迎头赶上,仍然是一个开放的研究问题。
在本文中,我们全面回顾了现有文献,强调了为什么需要早期预测ES,以及ML和DL技术如何用于ES预测。在EEG分析、特征选择、ES检测和预测以及预测或检测算法的评估方面,ES预测是一个广阔的主题。与本文的研究结果相反,以前的调查论文大多只关注EEG分析,少数涉及预测技术的发展;虽然我们试图通过考虑特征选择、预测技术和评估方法等方面来提供见解。此外,我们还强调了未来的工作方向和有待进一步研究的开放性研究问题。