Lucy@IshtarXu

【文献翻译】利用脑电信号预测癫痫发作的机器学习：综述

文章目录

摘要
1 - 引言
- 表2：论文中使用的首字母缩略词
2 - 脑电图、神经科学和癫痫预测背景
- A. 神经科学和神经影像学简介
- B. 脑电信号分析技术
- - 1）EEG介绍
  - 2）分析技术
- C. 癫痫的脑电图信号分析
- D. 癫痫发作预测
3 - ES预测的ML方法
- A. 医疗保健中的ML简介
- B. 神经科学中的ML简介
- - 1）监督学习
  - 2）无监督学习
  - 3）强化学习
- C. ML用于癫痫发作预测
- - 1）信号处理
  - 2）特征提取和选择
  - 3）分类
- D. 医疗保健中的DL简介
- E. 神经科学中的DL简介
- F. DL用于癫痫发作预测
- - 1） CNN在ES预测中的应用
  - 2） ES预测的无监督DL方法
  - 3） RNN用于ES预测
- G. 用于ES预测和分析的数据集
- H. ES预测的评估指标
- 4 - 癫痫发作预测方法的缺陷
- A. 开放获取脑电图数据的不可用性
- B. 数据丢失
- C. 无法使用原始信号预测ES
- D.缺乏高效的硬件应用
5 - 未来方向和开放性研究问题
- A. 数据维度的诅咒
- B. 数据注释
- C. 数据共享和管理的分配
- D. 可解释ML
- 6 - 结论

摘要

随着人工智能（AI）和机器学习（ML）技术的进步，研究人员正在努力利用这些技术来推进临床实践。医疗保健的关键目标之一是早期发现和预测疾病，以便及时提供预防性干预措施。癫痫尤其如此，其特点是反复发作和不可预测的癫痫发作。如果可以提前预测癫痫发作的不良后果，患者可以从中解脱出来。尽管经过几十年的研究，癫痫发作预测仍然是一个尚未解决的问题。这种情况可能会持续下去，至少部分原因是解决问题的数据量不足。基于ML的算法有了令人兴奋的新发展，有可能在癫痫发作的早期和准确预测中实现范式转变。在这里，我们全面回顾了最先进的ML技术在使用EEG信号早期预测癫痫发作中的应用。我们将找出当前研究中的差距、挑战和陷阱，并建议未来的方向。

1 - 引言

癫痫是一组神经系统疾病，其特征是具有引起反复发作的持久易感性，可影响任何年龄的个体。癫痫起源于“癫痫发生”的渐进神经生物学过程[1]，这会导致正常大脑网络以自我维持的高度同步方式在大脑皮层激发神经元。根据世界卫生组织（WHO）的数据，全世界有7000万人患有癫痫，而在最广泛的脑部疾病列表中，只有偏头痛、中风和阿尔茨海默病[2]。癫痫引起的癫痫发作会使患者虚弱，扰乱患者的日常活动，并增加过早死亡的风险。许多国家神经科医生的缺乏使癫痫的治疗复杂化，尤其是在神经科医生短缺的发展中国家。

尽管epilepsy和seizures有时在一些文献中被称为同义词，值得注意的是，并非所有的癫痫发作(seizures)都是癫痫性(epileptic)的，而且癫痫发作(seizures)也可能是由于急性神经损伤（如中风、脑外伤、代谢紊乱和药物毒性）引起的，但不一定反映出反复发作的长期易感性（即癫痫epilepsy）。

癫痫发作（epileptic seizure， ES）是由大脑网络中突然发生的异常、自我维持的放电引起的，通常持续不到几分钟。ES攻击很难预测，而且攻击的严重性和持续时间也无法预测。因此，事件造成的伤害和安全问题是患者及其家人的主要担忧。因此，早期预测癫痫发作对于避免和应对其不良后果至关重要。癫痫患者的大脑活动可分为不同的状态：发作前（发作前）、发作中（发作中）、发作后（发作后）和发作间期（发作间期）。有关这些条款的更多详细信息，请参阅本文的章节。ES预测是一个分类问题，即区分发作前和发作间状态。由于癫痫的反复发作性质，ES在群体中发生，癫痫群患者可以通过预测后续癫痫发作获得优势。

脑电图（EEG）是研究ES发作期间大脑功能解剖的一种特别有效的诊断工具。通过脑电图对癫痫的预测和治疗进行了广泛的研究。EEG信号是非高斯和非平稳的，用于测量大脑中的电活动，进而用于诊断大脑疾病的类型。脑电图测量的分析有助于区分大脑的正常和异常功能。为了准确预测癫痫，有必要检查持续时间较长的脑电图记录。神经科专家通过研究连续几天、几周甚至几个月记录的脑电图信号来检查癫痫，这需要大量的人力和时间。多年来，各种研究都采用了基于机器学习（ML）的预测方法来解决这个问题。深度学习（Deep learning，DL）是一种先进的ML技术，它能够通过多层层次结构处理大量数据，从而更精确地从中学习模式。DL产生非常精确结果的能力影响了研究人员通过使用DL技术来处理许多实际应用，在过去五到六年中，许多研究人员提出了基于DL的ES预测方法。

本文的目的：强调运用ML方法预测癫痫的主要进展。我们将简要介绍神经科学、用于研究大脑的各种工具，以及它们如何被或可能被用于预测癫痫。

本文的贡献：
虽然有几篇综述专门涉及使用EEG信号预测癫痫发作，但据我们所知，目前还没有一篇综述深入介绍ML方法在预测癫痫发作中的应用。例如，Mormann等人概述了20世纪70年代至2006年期间癫痫发作预测方法的演变[3]，并涵盖了与ES预测方法有关的主要问题。Gadhoumi等人简要概述了用于ES预测的有效方法，并全面描述了预测结果的统计显著性[7]。在最近发表的综述中，Kuhlmann等人简要描述了ES预测和ES预测竞赛领域的进展。他们得出结论，这些标准统计评估的进步为ES预测方法的发展开辟了道路，他们改进了现有的指南，以实现这一发展[12]。这项调查之所以独特，是因为它全面回答了以下问题：为什么需要使用ML技术进行ES预测，DL等相对较新技术的发展如何证明对ES预测非常有用，并讨论了该领域未来研究的方向。表一列出了本文与现有调查的比较。

本文的结构：
本文的结构如图1所示。第二节简要介绍了神经科学、脑电图和癫痫预测的背景。第三节介绍了用于ES预测的数据驱动ML方法。第四节包括识别应用这些方法的几个陷阱。第五节介绍了未来的发展方向和有待解决的研究问题。最后，第六节总结了论文。表二列出了论文中使用的首字母缩略词。

表2：论文中使用的首字母缩略词

缩略词	含义
ANN	人工神经网络
ApEn	近似熵
BLDA	贝叶斯线性判别分析
CNN	卷积神经网络
CWT	连续小波变换
DNN	深度神经网络
DWT	离散小波变换
EMD	经验模态分解
ES	癫痫发作
FD	分形维数
FPR	错误预测率
FT	傅里叶变换
HE	赫斯特指数
HHT	希尔伯特-黄变换
HP	Hjorth参数
LLE	最大李雅普诺夫指数
LSTM	长短时记忆
MLP	多层感知机
RNN	循环神经网络
SEF	谱边缘频率
SBP	频带功率
SM	统计矩
SOM	自组织映射
SpM	谱矩
TPR	真阳性率
WFT	小波傅里叶变换
WT	小波变换

2 - 脑电图、神经科学和癫痫预测背景

A. 神经科学和神经影像学简介

神经科学是对大脑的多学科研究。它整合了多种学科，包括神经解剖学（神经解剖学专家参与研究人脑结构）、神经化学（化学家观察大脑中相互交流的化学性质），神经生理学（神经生理学家研究大脑的电特性）和神经心理学（心理学家努力在神经科学中解释认知领域和支撑这些认知领域的结构）[13]。神经科学还有进一步的分支，例如分子神经科学、认知神经科学[14]、临床神经科学、计算神经科学[15]、发展神经科学和文化神经科学等等。

大脑在解剖学上被划分为多个群体，这些群体构成了一个功能专门化的大脑网络（功能分离）。这些功能上隔离的社区在功能上相互关联（功能整合），以执行非常复杂的任务，比如实现认知[16]。神经成像使用各种方法直接或间接地成像中枢神经系统的结构和功能。两大类是涉及解剖学、病理学或损伤的结构成像和涉及代谢、药理学或认知的功能成像。一些重要且广泛使用的神经成像技术包括：计算X射线吸收量的计算机断层扫描（CT），以提供大脑的一系列横截面图像；产生活性分子结合图像的正电子发射断层扫描（PET）；检查大脑解剖和病理的结构磁共振成像（MRI）；检查大脑活动的功能性MRI；扩散磁共振成像，绘制水分子在大脑中的扩散，以揭示脑组织的宏观细节；磁共振波谱（MRS）成像用于研究脑肿瘤、中风和癫痫等的代谢变化。在不同的生理情况下，大脑的电活动可以使用EEG进行测量，EEG属于功能成像的范畴。

B. 脑电信号分析技术

1）EEG介绍

1923年，汉斯·伯杰发明了EEG，这是一种研究大脑的无创功能成像方法。EEG通过测量神经元群的电活动来记录来自大脑皮层的电信号。与功能性MRI相比，EEG对神经活动提供了更高的时间洞察力，但空间分辨率较低。通常，为了处理EEG信号，需要分析五个频段：Delta（高达4 Hz）、Theta（4–8 Hz）、Alpha（8–12 Hz）、Beta（12–26 Hz）和Gamma（26–100 Hz）。这些频带及其与人类行为的关系总结见表III，EEG的振幅范围为10µV至100µV，而其频率范围为1 Hz至100 Hz。

频带名称	频率范围（Hz）	与人类行为的关系
Delta	1-4	主要见于婴儿和正常成年人的深度睡眠阶段
Theta	4-8	在清醒的成年人中，Theta的高值表明认知活动异常
Alpha	8-12	通常出现在正常放松成年人的大脑后部
Beta	12-26	存在于警惕焦虑的人的大脑额叶区域
Gamma	26-1000	主要见于压力大、快乐或有意识的人

为了诊断一种疾病，或利用EEG数据解码大脑活动，首先通过应用傅立叶变换（FT）或小波变换（WT）提取原始EEG数据的特征或使用其频谱信息。这些提取的特征或转换后的原始数据然后用于训练基于ML的分类器，而DL算法已被证明对于自动提取特征进行训练是有效的。有两种基于参考电极位置的脑电图记录方法。

（1）Bipolar Montage：在双极蒙太奇中，两个电极都放在头皮的电活动区域，并测量电极之间的电压差。
（2）Monopolar Montage/Unipolar Montage：在单极蒙太奇中，一个电极放在电活动区域，参考电极放在非电活动区域（例如耳垂）。

记录脑电信号的传统方法是将电极置于颅骨表面，即头皮脑电。头皮脑电图的主要缺点是，由于颅骨内的神经元与电极之间的距离较大，记录的信号会失真。为了在失真和振幅方面提高信号质量，通过将电极置于大脑暴露表面来记录颅内脑电图（iEEG）信号。

EEG具有几个特点，因此它更适合用于ES预测研究。除了能够跟踪癫痫期间大脑中发生的各种变化外，它还提供了另一个主要功能，即相对较低的硬件成本，这使得它能够用于大量患者并记录更长的时间。其他多种技术，如功能磁共振成像（fMRI）或脑磁图（MEG），需要笨重且不可移动的设备，这将导致数百万美元的成本。在当前预测癫痫发作的实用方法中，==My Seizure Gauge==是可穿戴设备中最典型的例子，该设备被创建为癫痫发作预测的个性化咨询设备[17]。该设备可以记录颅内脑电图、头皮脑电图、肌电图（EMG）（记录骨骼肌产生的电活动）、心电图（ECG）（记录心脏的电活动）、皮肤电活动（EDA）、光体积描记术（PPG）和呼吸。

2）分析技术

脑电图分析方法主要分为时域方法、频域方法、时频域方法和线性或非线性方法[4]。

a）时域方法：脑电记录是时间的非平稳非线性函数。线性预测是一种时域方法，根据输入和早期输出计算输出。主成分分析（PCA）、线性判别分析（LDA）和独立成分分析（ICA）是广泛使用的无监督时域方法来总结脑电数据。PCA用于将高维数据（如果是高维特征向量）转换为低维数据，而ICA将高维数据分解为线性统计独立分量。在EEG数据分析中，ICA最常用于去除伪影。然而，LDA通过寻找特征向量的线性组合来降低特征集的维数。

b）频域方法：在癫痫发作期间，EEG信号的频率会发生突然变化，这可以通过应用频域方法来测量，例如使用傅立叶变换（FT）。人们可以使用参数或非参数方法来估计功率谱，使用的是FT-Welch（一种非参数）方法，它是广泛使用的周期图方法的改进版本，通常用于PSD的估计。但这有一个频谱泄漏的缺点，可以通过使用参数化方法来克服。参数化方法通过假设脑电信号是平稳随机过程来提供更好的频率分辨率。移动平均（MA）、自回归（AR）和自回归移动平均（ARMA）是常用的参数化方法。

c）时频域方法：上述时间域和频率域方法在分别提供特定时刻所涉及的精确频率和时间矩信息方面存在局限性。为了克服这些限制，小波变换（WT）是一种基于时间频率的分析技术，被广泛用于通过将EEG信号通过滤波器组来获得多分辨率分解的子带信号。

d）非线性方法：非线性分析方法用于检测信号频谱中谐波之间的耦合。高阶谱（HOS），熵的各种度量，例如近似熵（ApEn）；科尔莫戈罗夫熵；样本熵（SampEn）-与赫斯特指数（H）、最大李亚普诺夫指数（LLE）一起被广泛用于EEG分析的非线性参数。熵和LLE是癫痫分类的常用特征。熵提供了有关存储在信号概率分布中的信息的线索，并测量了数据模式中的不确定性或随机性。熵值越高，数据的模式就越随机。LLE提供系统依赖于初始条件的信息。有关分析技术的更详细回顾，请参阅[6]和[4]。

C. 癫痫的脑电图信号分析

分析脑电图信号是识别大脑中ES活动的主要方法。脑电图记录是区分ES和非ES的重要临床工具。癫痫发作前和发作期间记录的EEG信号包含可用于识别癫痫发作不同阶段以及发作前后的特征。以下简要介绍了这些阶段[6]。

（a）发作前状态：发作前状态在癫痫发作前的一段时间内变得明显，在其余时间内不会发生。它可能不一定是视觉上显而易见的。然而，它将反映潜在信号的变化，并在特定值范围内预测癫痫发作。对于临床上用于预警系统的发作前状态，必须尽早检测到，以便将错误预警的时间减至最少[12]。

（b） Pro-Ictal状态：在这种状态下，癫痫发作的可能性更大，但并不一定会发生。

（c）发作期和发作间期：发作期是癫痫发作期间EEG信号的变化，发作间期是随后两次发作之间的阶段。对于同一个人来说，致痫神经元的数量、皮质区域和癫痫发作的持续时间都可以改变。

（d）发作后状态：发作后的状态。

波形可能包含有关大脑活动的有价值的信息。经验丰富的神经学家可以通过视觉观察EEG信号来检测疾病。然而，由于动态非线性EEG数据的高时间和空间方面，该过程耗时且容易出现错误检测。因此，计算机技术、脑电信号参数提取和分析可以在诊断中大有裨益。

D. 癫痫发作预测

20世纪70年代，ES预测的早期研究使用了特征提取的线性方法[18]。而在20世纪80年代，由于EEG信号的非线性性质，非线性方法的发展帮助研究人员将这些技术用于特征提取[19][29]。随着人们对癫痫的脑电图模式——即发作前、发作期和发作间期模式——的认识，在这十年中，使用发作前阶段进行ES检测也得到了应用。1998年，Salant等人[34]在癫痫发作前6秒对ES进行了早期预测，Drogenlen等人在2003年进一步发展了该预测[35]。他们使用科尔莫戈罗夫熵作为特征，在发病前2-40分钟预测ES。第一次ES预测国际研讨会于2002年举行，会上不同癫痫中心提供了多天EEG记录数据集。后来，对该数据集进行了几项研究[36]。2003年，Mormann等人利用大脑中神经元的超同步放电是ES的一个原因这一事实，发现不同EEG通道的相位同步在癫痫发作之前降低[37]。在本世纪的前十年，基于大量脑电数据的研究对上个世纪计算的测量性能提出了质疑。研究人员发现，基于选定的、不充分的数据量的早期研究结果无法在广泛的、看不见的数据上重现。

决定在关于上述主题的国际研讨会上举办关于癫痫预测的竞赛。这些竞赛的目的是对在公共数据集上训练的算法的性能进行标准化比较。第一届癫痫预测竞赛于2007年与第三届国际癫痫预测研讨会（IWSP3）合作举办，第二届竞赛于2009年与第四届国际癫痫预测研讨会合作举办。在这两项比赛中，参赛者都获得了三名癫痫患者的连续iEEG记录。然而，这些算法的性能结果并不令人满意。美国癫痫协会癫痫预测挑战赛于2014年举行，涉及短期人类iEEG，其中942次癫痫发作记录超过500天，以及患有癫痫的狗的长期iEEG记录。所有参赛者都获得了相同的10分钟训练和测试数据。曲线下面积（AUC）用作性能评估指标。在同样的结构下，墨尔本大学举办的另一项比赛涉及1139例癫痫发作的长期iEEG记录。有关比赛的更多详情，请参见[38]。竞赛对任何计算EEG信号基本特征的算法开放，用于ES预测或基于这些基本特征训练的机器学习模型。无论如何，我们仍然不知道什么特性或算法是最好的。在比赛中，人们提交了太复杂的算法。所以很难说哪种特征或ML算法是最好的。竞赛的组织者正在努力用Epilepsyecosystem.org来剖析它。Matias Maturana等人[39]最近的工作提出了一种可能对患者有效的解决方案。他们将大脑信号的临界减慢确定为ES预测的指标。EEG数据测量的发展时间表如图2所示，感兴趣的读者可以参考[40]了解关于这些发展历史的更详细信息。

3 - ES预测的ML方法

在本节中，我们将全面回顾使用基于ML的方法进行ES预测的文献，并在本节开始时首先强调使用ML技术进行医疗保健和神经科学应用的潜力。

A. 医疗保健中的ML简介

在过去几十年里，通过使用统计方法识别大量数据中的模式，ML在各个研究领域迅速发展。大规模生物医学数据的可用性为医疗保健研究人员翻开了新的一页。有效医疗工具的开发依赖于数据分析方法和ML技术的进步。因为由于医疗数据的复杂结构，无法手动检测表征，这就是为什么ML在医疗保健中广泛用于疾病诊断，例如乳腺癌的检测[41]，皮肤癌的分类[42]，阿尔茨海默病的诊断[43]，癫痫的预测[44]，以及视网膜图像中糖尿病视网膜病变的诊断[45]。基于电子健康记录（EHR）的ML算法已被证明有助于预测未来的疾病，并能够根据患者的临床状态自动诊断患者[46]，尽管仍需要大量工作。具有大型图像数据集的生物医学领域，如放射学[47]、心脏病学[48]、病理学[49]和基因组学[50]，正在使用各种ML方法来自动诊断、分类和预测各种疾病。

B. 神经科学中的ML简介

近年来，对人脑结构和功能解剖学的研究一直是神经科学家最关注的焦点。技术的进步使神经科学家能够以前所未有的细节获取、处理和分析神经成像数据，而ML和DL是这类使能技术的最重要例子，可以作为神经科学家构建大脑功能理论的潜在探索来源[51]。在本节中，我们将对神经科学领域中使用的各种ML技术（例如，有监督学习、无监督学习和强化学习）进行总体介绍。

1）监督学习

在监督学习中，训练数据连同人类专家指定的标签一起被输入学习算法，以提取数据和标签之间的关系，这样系统就可以将看不见的数据准确地分类到各自的类别。例如，训练数据由带有房屋、狗、猫标签的图像组成，我们需要一种算法，可以预测系统以前未知的图像的标签。这些算法在计算和理论神经科学领域有着广泛的应用，例如支持向量机（SVM），这是一种监督学习算法，通常用于预测ES（在后一节中描述）。压力下的神经机制分析是使用有监督的ML方法进行的。

2）无监督学习

我们的大脑在没有任何指导的情况下一天接收到大部分信息。大脑从信息的重复中发展出一个工作模型，并利用这个模型进行感知。然后，这种感知被用于检测新信息中的模式。无监督学习算法的动机是大脑如何通过感知研究新事物。无监督学习应用未分类或未标记的数据来训练算法。这些算法广泛用于从神经生理学数据中识别和分类疾病。作为一个代表性的例子，我们参考了Drysdale等人的工作，他们使用功能磁共振成像对抑郁症类型进行分类[53]，以及O’Donnell等人的工作，他们使用聚类算法从扩散磁共振成像中识别白质束[54]。

3）强化学习

动物心理学，即动物之间以及与环境之间的交流方式，有助于发展强化学习（RL）[55]。由于神经科学和人工智能的合作，RL是技术进步的一个重要例证。强化学习是制定策略的过程，以最大限度地提高agent与其环境之间交互的回报。强化学习系统的核心因素是政策、奖励信号、价值函数和环境模型。

C. ML用于癫痫发作预测

自上个世纪以来，研究人员一直在努力克服与癫痫检测和预测相关的障碍。由于EEG信号是监测ES之前、期间和之后大脑活动的关键来源，因此ES预测研究的第一个重点是EEG记录的分析。脑电图信号会因眼球运动、眨眼、心脏信号和肌肉噪音而受损。使用了几种滤波和降噪方法来降低这些不同噪声源和伪影的影响[56]。去除伪影后，需要显著的特征来构建ML模型，以识别和分类发作前和发作间阶段。图3显示了用于癫痫预测的经典ML方法，并强调了ML和DL技术使用之间的主要差异。基本上，我们可以将原始数据或经过最少处理的数据（即，不从原始数据中提取特征）提供给DL模型以进行模式学习。

1）信号处理

噪声和伪影识别是原始生物医学信号中的关键步骤。为了减少特征提取中这些伪影的影响，需要对这些伪影进行过滤。滤波采用了多种技术，例如带通滤波器、小波滤波器、有限脉冲响应滤波器和自适应滤波器。执行此处理也是为了使数据正常化，使其与其他患者的记录具有可比性。由于植入电极的限制，EEG记录中也存在许多数据丢失或数据损坏，导致算法性能不显著。由于肌肉伪影和环境噪声，数据中也存在一些异常值。这些异常值的存在严重影响了提取的特征。

2）特征提取和选择

所有预测模型都需要可靠的特征，与发作前和发作间期密切相关。人们可以根据EEG通道的数量将这些特征分类为单变量（分别对每个EEG通道进行测量）和多变量（对两个或多个EEG通道进行测量）特征。这些特征的进一步分类是线性或非线性特征。Florian等人比较了包含ES预测线性和非线性策略的单变量和双变量测量的性能[57]。他们指出，在使用单变量测量时，发作前变异在ES发病前5-30分钟发生。而双变量测量通过在ES发病前至少240分钟捕捉发作前的变化表现得更好。图4显示了文献中用于ES预测的一些线性和非线性度量。线性测量的表现更好，或者有时与非线性测量类似。

3）分类

使用最大似然算法，例如人工神经网络（ANN）、k均值聚类、决策树、支持向量机和模糊逻辑，从脑电数据中识别发作前和发作间期模式。大多数基于特征值的阈值用于得出结论。然而，基于ML的研究主要集中在提取用于预测的优化特征上。

a）使用双谱特征预测癫痫发作：早期研究中用于检测癫痫发作的iEEG记录的高阶谱（HOS）特征[65]。然而，Assi等人[64]利用HOS特征表示，EEG的双谱分析提供了重要的相位信息。他们发现，在发作前的癫痫发作状态下，标准化双谱熵和标准化平方双谱熵降低。他们从癫痫狗的30秒非重叠iEEG记录窗口中提取了这些特征。他们训练了一个5层多层感知器（MLP），用于对发作前和发作间期进行分类。MLP的输入层由16个节点组成，因为有16个iEEG信号通道。他们添加了3个隐藏层，包括30、60和30个节点的ReLu激活功能。他们使用每个特征计算与发作前和发作间期分布对应的F1分数和p值。然而，研究人员倾向于分析该算法对确定的癫痫发作预测范围和发作发生期的敏感性和特异性。这一方面在本研究中缺失。

置换熵（PE）已被用于各种早期研究，以表征癫痫的EEG状态[66]，[67]。2007年，Li等人[68]使用PE来区分大鼠的发作前状态。最近，Yang等人[44]使用PE作为从弗莱堡医院数据的iEEG数据中提取的特征。他们分析了19名患者的83次癫痫发作。他们使用5秒的特征片段作为输入，用RBF核训练SVM分类器。灵敏度和错误预测率（FPR）用作性能分析指标。他们的灵敏度为94%，平均FPR为0.11，平均SPH为61分钟。

b）使用选定的数据量预测癫痫发作：减少EEG的维数是研究人员在处理数据和使用这些数据预测癫痫发作时最关心的问题之一。人们提出了各种降维技术，但有其优缺点。在最近的研究中，Kitano等人[60]提出使用少量数据来预测癫痫发作。在CHB-MIT数据库24名患者长达数小时的记录中，他们只使用了9名患者20分钟的数据。20分钟的数据包括发作前10分钟和发作间期10分钟的数据。他们在这20分钟数据的4秒非重叠窗口上应用DWT，并提取DWT的1级详细系数的零交叉点。他们使用自组织映射（SOM），以前由Teuvo Kohonen在1982年[69]引入，用于映射发作前和发作间期集群中的输入数据。使用选定的数据量，他们达到了98%的灵敏度。

尽管Kitano等人在选定的数据量上取得了非常显著的结果，但这种选择存在各种缺陷。发作前和发作间期模式在患者和住院患者之间存在时间差异。随机选择发作前10分钟的数据并不是一个重要的方法。在少量数据上训练模型会导致结果的过度拟合。通过对随机选择的少量数据进行训练，该模型可能无法在实时场景中显示显著的性能。表四总结了最近使用ML技术进行ES预测的工作。

D. 医疗保健中的DL简介

DL模型是ML研究进展的结果，它提供了处理原始数据的能力。DL模型由多层计算（非线性）模块组成，这些模块相互作用以处理数据并产生最终结果。这些多层有助于提取适当的特征，并对输出结果进行检查或分析。例如，在分类任务中，更高层次的表征放大了输入的特征，这些特征对辨别有重要意义，并抑制了不必要的变化。DL模型的核心是，它们包含模块化层，用于使用通用算法学习数据[76]。这些层是深层神经网络（DNN）的构造块。常用的神经网络有卷积神经网络（CNN）和递归神经网络（RNN）[76]。CNN的结构类似于大脑中神经元的连接模式。CNN的卷积运算就像一个带权值的滤波器，用于从多维输入数据中提取特征。而RNN用于查找输入数据中的逻辑序列。每个隐藏层的输出传递给下一层，并反馈给自身。简单地说，当前输出是当前时刻和历史的综合体验。美国有线电视新闻网和RNN体系结构的关键区别在于CNNs只考虑当前输入，而RNN考虑当前输入和先前输入，即它包含存储器逻辑。 RNN在时间序列数据上的表现明显更好，而CNN在图像分类等任务上表现更好。

DL体系结构已被用于许多医学领域，如临床成像[77]、基因组学和蛋白质组学[78]、计算生物学[79]和疾病预测[70]。DL算法被证明足以在高维数据中检测复杂模式进行分类，尤其是在EEG数据中。CNN是一种使用EEG数据进行训练的广泛使用的神经网络，因为它可以非常有效地降低噪声[80]。

E. 神经科学中的DL简介

DL正在解决许多领域的问题，然而，DNN和神经系统研究之间存在着强有力的联系。人工神经网络被认为是大脑活动计算的模型[81]，而CNN是视觉信息处理的模型，CNN隐藏层的激活被认为是与视觉感觉运动处理相关的连接大脑区域中神经元的活动。深度网络是神经科学中有价值的计算手段，因为它们是大脑中神经活动的统计时间序列模型，例如，CNN可以作为计算神经科学的编码模型。在连接组学中，为了理解神经网络在大脑中的连接性映射，深度网络用于从3D电子显微镜图像中理解神经单元的连接性[82]。现有的进步时代正在加速神经科学启发的ML工具的研究[81]。

F. DL用于癫痫发作预测

最大似然分类算法使用从传统信号处理方法中提取的特征向量进行训练，并提供良好的精度，但这些技术无法预测广义模型。对于通过ML方法预测癫痫发作，脚本编写需要花费大量时间的特征提取阶段。数据中噪声和伪影的存在使得特征提取非常复杂。因此，产生一个具有忠诚性能的广义自动系统是一个具有挑战性的问题，尤其是在训练样本有限的情况下。另一方面，DL算法自动学习特征，并在ES预测中给出令人鼓舞的结果。通过DL模型学习的功能比手工制作的功能更具区别性和健壮性[83]。

1） CNN在ES预测中的应用

为了介绍一种可以应用于所有患者的方法，Troung等人[71]提出了一种基于CNN的预测方法。他们使用弗莱堡医院iEEG数据库和CHBMIT头皮脑电图数据库对CNN模型进行训练和测试。短时傅立叶变换（STFT）用于将原始脑电数据转换为二维矩阵。然后，这张图像被送入CNN进行特征学习，并对发作前和发作间状态进行分类。为了评估算法的性能，他们将癫痫发作预测期（SPH）设置为5分钟，癫痫发作发生期（SOP）设置为30分钟，并使用敏感性和错误预测率作为评估指标。在lleave-one-out交叉验证后，他们在原始EEG上的灵敏度为79.7%，FPR为0.24，在标准化数据上的灵敏度为89.8%，FPR为0.17。

对于ES预测器的实时临床应用，SPH必须足够长，以允许患者走出危险状况并采取预防措施，SOP不应过长。海德尔等人[70]通过给予87.8%的灵敏度和0.142 FPR（10分钟SPH），比之前的工作表现更好。他们使用CHBMIT和MSSM数据库对模型进行训练和测试。原始EEG转换为小波张量，CNN用于从转换后的数据中提取特征，用于对发作前和发作间期数据进行分类。

Cook等人[84]证明了植入式记录系统的成功，从而确立了ES预测在临床环境中的可行性，之后，进一步研究的新途径已经打开。为了推进Cook等人的工作，Isabell等人[85]提出了一种便携式癫痫发作预测系统，该系统的参数可根据患者的需要进行调整。他们将iEEG数据转换成频谱图，并将频率转换后的数据作为深度学习模型的输入，用于发作前的自动特征学习。

这些可调参数包括系统的灵敏度、持续时间和预警数量。为了调整这些参数，作者在模型中添加了一个处理层。他们在低功耗TrueNorth芯片上部署了预测算法，推出了一款可穿戴设备。他们的预测系统的平均灵敏度为69%，平均预警时间为27%，显著超过所有患者的可比随机预测值42%。

受Cook等人[84]和Karoly等人[86]的工作启发，Ramy Hussain等人[72]对这些患者的部分数据进行了研究，证明癫痫预测算法无法对某些患者产生令人满意的预测敏感性。他们采用了下采样技术，将数据的维数降低了4倍。他们解释说，手工制作的特征不适合真实的ES预测，因为EEG数据不仅在患者之间不同，而且随着时间的推移，同一患者的EEG数据也不同。他们通过应用STFT转换EEG数据，并将转换后的数据输入CNN。为了学习局部特征，他们使用1x1卷积层，为了学习抽象特征，他们使用更大的卷积。作为预测算法的性能指标，他们获得了87.85%的灵敏度和平均0.84 AUC。他们还解释了ES预测算法性能有限的原因是数据丢失、数据不匹配、不平衡分布和数据中的异常值。

2） ES预测的无监督DL方法

ES预测中的一个问题是标记数据的可用性。为了克服这个问题，Troung等人[74]采取的第一步是使用生成性对抗网络（GAN）进行无监督训练。他们将EEG的STFT频谱图输入GAN，并使用经过训练的鉴别器作为特征来预测癫痫发作。这种无监督训练非常重要，因为它不仅使用EEG记录提供实时预测，而且不需要手动进行特征提取。他们使用AUC作为5分钟SPH和30分钟SOP的性能指标。他们将结果与模型训练的监督方法进行比较，他们的方法表现良好，CHBMIT头皮EEG数据的AUC为77.68%，弗莱堡医院数据的AUC为75.47%，癫痫数据库的AUC为65.05%。这些工作的总结见表五。

3） RNN用于ES预测

Tsiouris等人[73]首次使用长短时记忆（LSTM）预测癫痫发作。他们比较了随机选择的输入段大小为5-50秒的LSTM不同体系结构的性能。他们使用EEG片段的特征向量作为LSTM的输入，比较了三种LSTM结构的性能，其中特征向量包括来自时域、频域的各种特征，以及图论中的局部和全局度量。LSTM-1体系结构由一层32个内存单元组成，而LSTM-2体系结构中的内存单元数量增加到128个。存储单元的数量保持在128个，但在LSTM-3中增加了一个额外的等维层。LSTM-3的性能在三种考虑的体系结构中是最好的。使用15分钟的发作前窗口，他们还评估了LSTM3作为原始EEG输入的性能，并与特征向量的性能进行了比较。他们表明，具有原始EEG输入和令人满意的性能的深层架构在上述领域仍然是一个有待解决的问题。平均而言，LSTM-3表现更好，发作前15分钟的敏感度为99.28%，发作前30分钟的敏感度为99.35%，发作前60分钟的敏感度为99.63%，发作前120分钟的敏感度为99.84%。然而，这些结果需要太多的特征工程。

G. 用于ES预测和分析的数据集

脑电图（EEG）正成为获取大脑信号以检测和预测癫痫的主要手段。为此，各医院和研究中心发布了各种开放存取数据库。例如，波士顿儿童医院癫痫中心和坦普尔大学医院已经向研究人员公开了他们的脑电图数据库，这些研究人员旨在开发ML/DL模型和其他基于统计分析的方法。在表六中，我们总结了这些广泛使用和公开可用的数据库。尽管波恩大学的数据库不够大，但在文献中被广泛用于ES的检测。它由5个数据集A、B、C、D和E组成。CHBMIT数据库有22名患者的数据，每个患者有9-24次记录，每次记录时间为1小时，由于硬件限制（有些病例记录时间为2-4小时），有些不连续。弗莱堡医院的数据库是相当大的数据库之一，其中包含21名受试者的iEEG数据，约88例癫痫发作，但最近它已被合并到EPILEPSIAE数据库中，以提供更大的数据集，但该数据库现在不是开源的。

H. ES预测的评估指标

ES预测方法的临床应用需要充分的性能和质量检查，ES预测文献中提出了不同的评估指标。例如，Osorio等人提出敏感性和假预测率作为ES预测器的性能参数[87]。敏感性是指正确预测的癫痫发作与所有癫痫发作的比率。此外，与理想情况相反，无法防止错误预测，并且随着灵敏度的增加，错误预测率也会增加。下面介绍了广泛使用的评估指标。

其中

真阳性（TP）是正确预测的ES数量
假阴性（FN）是被错误预测为非癫痫发作的ES数量
真阴性（TN）是正确预测无癫痫发作的次数
假阴性（FP）是被错误预测为癫痫发作的非ES的数量。

ES预测器在癫痫发作前会发出警报，根据理想情况，预测器必须预测发作的确切时间。在实际应用中，预测者预测癫痫发作的高概率持续时间。因此，一个性能检查指标是发作发生期（SOP），即有可能发作的持续时间。另一个指标是癫痫发作预测范围（SPH），即从报警到SOP开始的持续时间[88]，[89]。图5说明了SPH和SOP的概念。

4 - 癫痫发作预测方法的缺陷

ML解决了ES预测的几个挑战，包括手动、繁琐和耗时的分析方法。模型解释至关重要，数据中的模式识别与数据拟合同样重要。生物医学的一个基本难题是疾病及其亚型的正确分类。大量可用的生物医学数据可以识别出更全面的亚型。人们可以很容易地找到ML，特别是DL改善EEG分析的各种方法。神经网络的层次性极大地开发了从原始数据或最小处理数据学习特征的潜力。通过DL模型自动学习的特征比通过分析工具提取的特征更强大、更有效。这表明DL有潜力在分析任务中提供高性能。癫痫预测的研究已经进行了多年，使用不同的方法取得了很多进展，但也存在许多问题。接下来将讨论与使用ML方法进行ES预测相关的一些潜在缺陷。

A. 开放获取脑电图数据的不可用性

ES预测和分析研究的一个核心问题是长期EEG数据的不可用性。2005年，Iasemidis等人在ES发作前约91分钟对私人EEG数据进行了预测报警[31]。然而，从那时起，没有人能够在任何公开的脑电图数据上重现这些结果。因此，迫切需要开放访问共享长期记录的EEG数据库，并共享代码（使用Github或类似的存储库）以确保结果的可重复性。

B. 数据丢失

预测算法性能低下的主要原因之一是缺少观测值。由于存储容量有限的可穿戴设备或植入设备与存储设备之间的通信故障，观察到的数据中有许多零值或几乎等于零值，原因可能有几个。从腐败或缺失的数据中学习并没有引起机器学习界的太多关注。然而，有必要在模型中添加缺失指标，以便为预测提供重要信息。

C. 无法使用原始信号预测ES

过多的特征提取会增加时间消耗和计算成本。我们需要一个具有相对低功耗硬件和较低计算成本的快速预测，以便实现ES预测的实时系统。不幸的是，研究人员还不能建立一个从原始信号中学习可行特征的模型。虽然DL通过从预处理数据中自动提取特征，极大地解决了特征提取问题，但其局限性在于，这些方法需要大量数据才能进行有效预测[90]。

D.缺乏高效的硬件应用

ES预测研究的主要目的是提高患者的生活质量。在这篇综述中，我们对ML应用于ES预测的最新技术进行了全面评估，但成本效益和高效的硬件实现仍然是瓶颈。虽然已经在硬件实现方面进行了一些初步工作[91]，但对于如何制造成本效益高、产生优化结果的设备，以及如何使它们的使用变得普遍，还需要做很多工作？只有这样，患者才能从这项研究中受益。

5 - 未来方向和开放性研究问题

在本节中，我们将介绍未来ES预测工作的方向，以及需要进一步研究的各种开放性研究问题。

A. 数据维度的诅咒

EEG信号是使用多个电极记录的，因此记录信号的维数增加，分析多通道EEG信号变得困难。理想的方法是通过应用适当的信号分析技术（例如，将其转换为频谱图）将多通道EEG数据转换为单通道，或利用大脑信号集合中的单通道EEG信号。据观察，在多通道EEG的一些信号中，有趣的癫痫相关大脑活动较弱[92]。因此，选择高质量的信号对有效预测癫痫发作至关重要。在最近的一项研究中，提出了一种基于信号质量指数（SQI）的自适应算法，用于非惊厥性癫痫患者的多通道EEG最佳通道选择[92]，并且已经做出了大量努力，使用不同的降维技术，如主成分分析（PCA）[93]，开发了用于EEG通道选择的自适应算法，独立成分分析（ICA）[94]和基于区分矩阵的降维[95]等。然而，最优策略的制定仍然是一个开放的研究问题。

B. 数据注释

在文献中，ES预测和检测问题大多被描述为一个需要标记数据的有监督学习任务。脑电图记录由神经科专家和内科医生手动标注，这是一项昂贵、耗时且整洁的任务。ML技术的性能在很大程度上取决于注释的质量和提高ML技术的效率，尤其是自然的方法是使用更多的训练数据。开发用于评估训练模型性能的真实验证集也很重要。然而，将大规模收集的脑电记录注释到各自的类别实际上是不可行的，这妨碍了ML/DL技术的适用性。这就需要开发数据标记的自动化方法，例如主动学习、使用生成模型的数据标记（例如，在[74]中介绍了使用GAN的ES预测），以及基于无监督聚类的分类等。

C. 数据共享和管理的分配

在临床环境中，患者的数据是跨不同设施生成的，为了开发高效的ML/DL技术，需要在不同部门以及不同医院之间共享分布式数据。此外，可以整合来自不同领域的数据，以提取不同任务（例如标注）所需的知识。递归模型和不同的自然语言处理（NLP）技术可用于从原始临床笔记和电子健康记录（EHR）中提取丰富的知识，从而增强数据标注者的能力。此外，还可以开发能够从异构源和分布式数据中学习的ML/DL模型。然而，数据共享和管理的成本可能是巨大的，这也将给数据完整性、可用性和隐私带来新的挑战。这一工作方向需要创新的方式来鼓励数据pooling和共享。

D. 可解释ML

尽管DL技术具有最先进的性能，但这些方法都是黑盒模型，缺乏关于其学习行为和思维过程的基本理论。因此，他们的决定无法解释，因此预测的不确定性量化变得极其困难。此外，医疗保健应用程序的生命关键性要求DL模型的决策同时具有可解释性和可解释性。有人认为，可解释模型能够为其开发的特定任务提取最相关和重要的特征[96]。在最近的一项研究中，提出了一个名为Deep-Tune的可视化框架，该框架使神经科学家能够识别CNN模型中激活特定神经元的模式，该CNN模型是为神经棘波率预测任务而训练的[97]。开发可解释的最大似然模型的工作正在迎头赶上，仍然是一个开放的研究问题。

6 - 结论

在本文中，我们全面回顾了现有文献，强调了为什么需要早期预测ES，以及ML和DL技术如何用于ES预测。在EEG分析、特征选择、ES检测和预测以及预测或检测算法的评估方面，ES预测是一个广阔的主题。与本文的研究结果相反，以前的调查论文大多只关注EEG分析，少数涉及预测技术的发展；虽然我们试图通过考虑特征选择、预测技术和评估方法等方面来提供见解。此外，我们还强调了未来的工作方向和有待进一步研究的开放性研究问题。

你可能感兴趣的:(深度学习,医学信号处理,新项目,深度学习,机器学习)

什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
star31.6k，Aider：让代码编写如虎添翼的终端神器
ider是一款运行在终端中的AI结对编程工具，它能与大型语言模型（LLM）无缝协作，直接在您的本地Git仓库中编辑代码。无论是启动新项目，还是优化现有代码库，Aider都能成为您最得力的助手。它支持Claude3.5Sonnet、DeepSeekV3、GPT-4o等顶级AI模型，几乎可以连接任何LLM，让编程体验如虎添翼。Stars数35,188Forks数3,230主要特点Git操作：Aider
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
vue+typeScript 中 webpack.ProvidePlugin的使用随便放个文字在这里 vue.js webpack typescript
用vue+ts写新项目，想偷懒，少写一些代码，研究了一下providePlugin，之前写js的有用到，但是在ts里面用还是有些区别的，特意在这里记录一下。有疑问的朋友可以留言，共同学习进步。webpack.providePlugin官方文档介绍vue.config.js文件配置项constwebpack=require('webpack')constpath=require('path')mod
进程 ⇢ JVM ⇢ 线程＋内存关系 MYGAG jvm
.从零到跑起一个Java程序OS创建进程execvejava…→新进程的地址空间、handle、时间片就位。JavaLauncher进场可执行文件里的C/C++的main()解析参数，dlopenlibjvm.so/jvm.dll。JNI_CreateJavaVM诞生JVM实例△分配堆、元空间、代码缓存等△拉起GC/JIT/信号处理等守护线程把Launcher的原生线程变成Javamain线程开始
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
支持向量机（SVM）在肝脏CT/MRI图像分类（肝癌检测）中的应用及实现猿享天开医学影像支持向量机机器学习人工智能算法
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。