麻花地

Transformers 在医疗图像中的应用综述

Transformers in Medical Image Analysis: A Review

Abstract

Transformers在自然语言处理领域占据主导地位，最近影响了计算机视觉领域。在医学图像分析领域，Transformers还成功应用于全堆栈临床应用，包括图像合成/重建、配准、分割、检测和诊断。我们的论文介绍了一份立场文件和一本初级读物，以提高人们对Transformers在医学图像分析领域的认识和应用。具体来说，我们首先概述了Transformers和其他基本组件中内置的注意力机制的核心概念。其次，我们给出了为医学图像应用定制的各种Transformers架构的新分类，并讨论了它们的局限性。在这篇综述中，我们研究了围绕Transformers在不同学习范式中的使用、提高模型效率以及它们与其他技术的耦合等关键挑战。我们希望这篇综述能给医学图像分析领域的读者提供一个全面的Transformers图片。

**关键词：**Transformers、医学图像分析、深度学习、诊断、配准、分割、图像合成、多任务学习、多模式学习、弱监督学习。

1 INTRODUCTION

Transformers[1]主导了自然语言处理（NLP）领域，包括语音识别[2]、合成[3]、文本到语音翻译[4]和自然语言生成[5]。作为深度学习体系结构的一个引人注目的例子，Transformer首次被引入NLP中处理顺序推理任务。虽然，递归神经网络（RNN）[6]（例如，长-短期记忆网络（LSTM）[7]）明确地使用一系列推理过程，显著地捕获具有堆叠的自我注意层的序列数据的长期依赖性。通过这种方式，Transformers既能有效地一次性解决顺序学习问题，又能有效地叠加非常深的模型。几个在大规模体系结构上训练的Transformers体系结构在解决NLP任务时变得广泛流行，例如BERT[8]和GPT[9]，[10]——仅举几个例子。

卷积神经网络（CNNs）及其变体在多个计算机视觉（CV）任务[11]中达到了最先进的水平，部分原因是它们的感受野逐渐扩大，可以将结构化图像表示的层次结构学习为语义。在图像中捕捉视觉语义通常被认为是在计算机视觉中构建成功网络的核心思想[12]。然而，在CNN中，图像内部的长期依赖性（如图像中对象的非局部相关性）被忽略。受上述NLP中Transformers成功的启发，Dosovitskiy等人[13]提出了视觉Transformers（ViT），将图像分类作为图像块（区域）序列的序列预测任务，从而捕获输入图像中的长期依赖关系。ViT及其派生实例在多个基准数据集上取得了最先进的性能。Transformer在各种计算机视觉任务中非常流行，包括图像分类[13]、检测[14]、分割[15]、生成[16]和字幕[17]。此外，Transformers在基于视频的应用中也发挥着重要作用[18]。

最近，Transformers还将医学图像分析领域用于疾病诊断[19]、[20]、[21]和其他临床目的。例如，【22】、【23】中的工作利用Transformers，利用计算机断层扫描（CT）或X射线图像将COVID19与其他类型的肺炎区分开来，满足了快速有效治疗2019冠状病毒疾病患者的迫切需要。此外，Transformers还成功地应用于图像分割[24]、检测[25]和合成[26]，显著获得了最先进的结果。图1显示了Transformers对不同医学图像应用的时间适应性，将在第3节中进一步讨论。

尽管许多研究致力于为医学图像分析任务定制Transformers，但这种定制带来了尚未解决的新挑战。为了鼓励和促进基于Transformers的医学图像分析应用的发展，我们广泛审查了该领域现有的120多种基于Transformers的方法，为医学应用提供了解决方案，并展示了Transformers在各种临床环境中的应用。此外，我们还深入讨论了如何设计基于Transformer的方法来解决更复杂的现实任务，包括弱监督/多任务/多模式学习范式。本文包括Transformers和CNN之间的比较，并讨论了提高Transformers网络效率和解释的新方法。

以下各节的组织如下。第二节介绍了Transformers的基本知识及其在视觉上的发展。第3节回顾了Transformers在医学图像分析中的最新应用，第4节讨论了Transformers未来的潜在发展方向。第五部分总结全文。

2 TRANSFORMERS

介绍transformer和attention，

略

3 TRANSFORMERS IN MEDICAL IMAGE APPLICATIONS

Transformers已广泛应用于全堆叠临床应用。在本节中，我们首先介绍基于Transformers的医学图像分析应用，包括分类、分割、图像到图像的转换、检测、注册和基于视频的应用。我们根据学习任务对这些应用程序进行分类，如图5所示。

3.1 Classification

将Transformers用于疾病诊断和预后的方法制定为分类任务，可分为三类，包括：

1）将ViTs直接应用于医学图像；

2）将ViTs与卷积相结合，实现更具代表性的局部特征学习；

3）将VIT与图形表示相结合，以更好地处理复杂数据。

本节将全面概述用于医学图像分类任务的上述三种Transformers类别（1）。

3.1.1 Applications of pure T ransformers

我们将与最初提议的类似的VIT称为纯Transformers[13]。这些方法通常不包含显著的结构变化。我们通过图像模态介绍纯Transformers的文献，例如X射线[43]，[41]、计算机断层扫描[20]、[19]、磁共振成像[21]、超声[52]、OCT[58]等

**X-Ray:**X射线是一种廉价且方便的成像技术，广泛应用于多种疾病的筛查和诊断，例如乳腺癌、肺炎、骨折等。特别是在2019冠状病毒疾病大流行期间，X射线在疾病筛查中发挥了非常重要的作用，因此是人工智能研究人员在设计基于Transformers的方法时使用的一种流行模式。Liu等人[43]提出了视觉观察者（VOLO），这是一种ViT模型，用所谓的观察者注意取代了原有的注意机制。他们的模型在诊断2019冠状病毒疾病方面达到了最先进水平（SOTA），无需在ImageNet上进行预训练。Shome等人[46]提出了一种基于ViT的2019冠状病毒疾病诊断模型，方法是在自行收集的大型2019冠状病毒疾病胸部X射线图像数据集上训练该模型。他们还使用Grad-CAM（59）来显示2019冠状病毒疾病的进展。Krishnan等人【47】应用ImageNet预训练ViT-B/32网络，通过使用胸部X射线图像中的补丁作为输入来区分2019冠状病毒疾病。尽管ViT对2019冠状病毒疾病有效，但Tanzi等人【41】应用ViT模型对股骨骨折进行分类。他们的工作利用聚类方法验证了ViT提取特征的能力，并将其性能与CNN进行了比较。

**Computed T omography:**基于气体和组织的高对比度，CT通常用于胸部疾病的诊断。因此，纯Transformers在CT图像中的应用主要集中在胸部疾病上。Costa等人[22]建议使用ViT及其变体将2019冠状病毒疾病和其他肺炎与正常病例区分开来。通过比较几种模型的性能，他们发现预训练模型，如数据高效图像转换器（DeiT）[30]取得了竞争性的结果。

同时，传统的ViT以及使用Performer编码器的ViT变体即使在没有预训练的情况下也取得了良好的效果。Li等人[39]设计了一个基于ViT的2019冠状病毒疾病诊断平台。他们将CT图像转换成一系列扁平的斑块，以适应诊断所需的ViT输入。他们还采用了一个师生模型，从对自然图像进行预训练的CNN中提取知识。Gao等人【19】将ViT应用于2D和3D CT扫描，以诊断2019冠状病毒疾病。他们提出通过提取固定数量的切片来构造图像子体积，从而用不同数量的切片“规范化”成像序列。他们还证明，ViT的性能优于DenseNet，后者是一种有竞争力的CNN模型。Zhang等人[20]在CT图像上训练了流行的SwinTransformers。具体来说，该框架首先通过一个Unet对肺部进行分割，然后将肺部区域提供给特征提取程序。这种策略有助于减少Transformer框架的计算负担

Magnetic Resonance Imaging: 磁共振成像（MRI）具有更好的成像质量，尤其是对于包括血管和神经在内的细微解剖结构，但它在采集过程中非常耗时。由于MRI代表了一种强大的软组织无创成像技术，因此它通常用于神经成像研究。例如，他等人[21]提出了一个用于大脑年龄估计的双通路网络。全局路径用于从大脑MRI中捕获全局上下文信息，而局部路径负责从局部斑块中捕获细粒度信息。然后，通过一个全局-局部注意机制将局部和全局语境表征融合在一起。接下来，融合特征和局部补丁的串联被馈送到修改后的全局-局部转换器中。此外，MRI具有广泛的临床应用，例如癌症诊断，这使其成为训练VIT的有力候选方式。

**Ultrasound:**带护理点的超声波（POC）扩展了适用场景，因为获取图像不需要特定位置。Perera等人的研究[52]提出了一种基于Transformers的架构，用于基于超声片段诊断2019冠状病毒疾病。为了确保记忆和时间效率，他们提议用Linformer取代标准vit，将传统自我注意机制的时空复杂度从O（n2）降低到O（n）。此外，由于其易用性、低成本和安全性，超声波也成为乳腺癌成像的一种重要方式。Gheflati等人[53]使用ViTs对正常、恶性和良性乳腺组织进行超声图像分类。他们还比较了不同配置的VIT与CNN的性能，以证明其效率。

Others:除了上述成像方式外，还采用了其他成像技术来检查和诊断特定疾病，例如皮肤镜图像，这是皮肤病诊断中常用的一种方法。例如，Xie等人[57]的目标是利用皮肤镜图像检测黑色素瘤。他们提议将SWN Transformer与无参数注意模块SimAM相结合，以便为目标分类任务学习更好的特征。考虑到输入分类器的特征包含丰富的语义信息，但缺乏详细信息，他们将前三个Swin Transformer块的输出设计为三个单独输入的SimAM块，然后将包括最终特征映射在内的所有SimAM块输出连接在一起，形成新的最终特征映射，作为最终分类层的输入。

3.1.2 Applications of hybrid Transformers

虽然纯VIT可以在不做太多修改的情况下获得有希望的结果，但人们已经投入了大量的努力，探索将VIT与其他学习组件相结合，以更好地捕获复杂的数据分布或获得更好的性能。典型情况是具有1）卷积层和2）图形表示的Transformers组合。接下来我们将介绍这两个类别。

Transformers with convolutions: Vision Transformers更关注数据中的全局关系建模，而传统CNN更关注局部纹理。这种差异促使研究人员将ViTs和CNN的优势结合起来。此外，医学图像的分析不仅涉及图像中区域的相关性，还涉及细微的纹理。因此，许多作品致力于探索这种CNN-ViT组合。

大多数应用集中于胸部疾病的诊断，尤其是2019冠状病毒疾病或其他相关疾病。得益于ViT的功能整合能力，Van等人[23]利用Transformers对未注册的医学图像进行多视图分析，对胸部X光进行分类。他们提出了一种基于变换器的方法，利用可训练的注意机制，在特征层面上考虑不同视图的空间信息。他们将转换器应用于CNN生成的中间特征图，以从一个视图检索特征，并将其转移到另一个视图。因此，在原始视图中添加了额外的上下文，而不需要像素级的对应。他们的工作也有助于降低计算复杂度，因为他们建议用较少数量的视觉标记来代替源像素。

V erenich等人[42]将VIT中的全局空间信息引入CNN，用于肺部疾病分类，同时保持空间不变性和等变性。Liang等人[37]使用CNN挖掘有效的特征，并使用转换器进行特征聚合。此外，还采用了有效的数据采样策略，以减少输入的大小，同时保留足够的诊断信息。Park等人[40]设计了一个经过预训练的CNN主干，然后是一个ViT，用于2019冠状病毒疾病诊断。在模型预训练中使用了用于CXR分类的大规模公共数据集。

除了2019冠状病毒疾病诊断，Yassine等人[38]通过将提取的特征输入ViT，将几个CNN与ViT结合。他们比较了CNN的数量及其预训练配置与混合CNN ViT模型。值得一提的是，他们在ImageNet数据集[12]生成的图像上对CNN进行了预训练，使用了在脑部CT图像上预训练的生成性对抗网络（GAN）。他们声称，在生成的图像上进一步预训练可能会导致目标计算机断层扫描数据集产生更好的诱导偏差，因为两个域的差异减小。Zhao等人[49]考虑利用CNN和Transformers的组合，使用多期对比增强磁共振成像（CEMRI）对肝细胞癌（HCC）进行多指标量化。他们提出了mrTrans网络，其中有三个并行编码器，每个编码器后面都有一个非本地Transformers，用于提取动脉相位、PV相位和延迟相位的特征。接下来，添加相位感知Transformers，以量化每个相位对于目标多相位CERMI信息融合和选择的相关性。量化不仅在相位感知Transformers之后进行，而且在非局部Transformers之后进行，以形成增强的损耗函数来约束量化任务。Jiang等人[56]通过将VIT和CNN作为基础学习者，根据B淋巴细胞前体细胞和白血病B淋巴细胞的显微图像诊断急性淋巴细胞白血病，探索了集成学习的有效性。他们提出了一个基于ViT和EfficientNet的集合模型。由于这两个基本模型是互补的，所以集合结果显示出一些改进。他们还提出了一种数据增强方法来处理每张图像中的正常/癌细胞失衡。Chen等人[51]提出了多尺度视觉变换模型，如图6所示，称为GasHis Transformer，用于处理胃组织病理学图像分类。他们设计了全局信息模块（GIM）和局部信息模块（LIM）（基于CNN）来提取特征。此外，他们借鉴了InceptionV3中的并行结构来学习多尺度局部表示。此外，他们的模型对十种不同的对抗性攻击或常规噪声具有鲁棒性，并可推广到其他癌症组织病理学图像分类任务。Gao等人[50]提出了基于Vison Transformer（iViT）的乳头状肾细胞癌分型实例。i-ViT首先从instancelevel面片中提取并选择实例特征，其中包括一个包含部分周围背景和nucleus等级的nucleus。接下来，它聚集这些特征，以进一步捕获细胞级和细胞层级特征。最后，该模型将获得的两个精细特征编码到最终的图像级表示中，其中嵌入了等级和职位以进行子类型划分。

**Transformers with graphs:**使用图形学习是MIA的常见做法。图学习的核心概念是学习每个样本的紧凑表示（例如嵌入），同时通过数据图保留样本间的内在关系[60]。Transformer是一种基于注意的网络，适合于对图形数据进行操作，包括聚合节点特征和计算节点关系。

在网络神经科学领域，大脑网络被建模为一个图形，其中每个节点表示一个感兴趣的解剖区域（ROI），连接两个节点的边缘编码它们的交互作用（例如，神经放电）。脑图在促进我们对大脑作为健康和疾病中高度互联系统的理解方面发挥着重要作用[61]，[62]。Kim等人[48]的工作利用了功能连接（FC）网络的动态特征，将动态特征整合到紧凑的脑图表示中。具体来说，他们提出了时空注意图同构网络（STAGIN），用于学习具有时空注意的大脑连接组的动态图形表示。GNN用于在每个时间步提取功能性大脑连接组的图形级表示。最后，该模型使用Transformer编码器获得动态图序列的最终表示。具体而言，他们将编码的时间戳与节点特征连接起来，以嵌入时间信息。他们声称，Transformers的使用不仅提高了分类性能，还提高了时空可解释性。

3.2 Segmentation

基于Transformers的方法也被应用于各种分割任务，包括腹部多器官分割[68]、[69]、[70]、[72]、[81]、[25]、[95]、[96]、[100]、[102]、胸部多器官分割[96]、心脏分割[68]、[70]、[74]、[81]、[95]、[100]、[102]、胰腺分割[71]、[99]、脑肿瘤/组织分割[72]、[76]、[84]、[90]、[99]、[103]，[104]、息肉分割[79]、[87]、[101]、皮损分割[79]、[87]、[91]、[101]、髋部分割[79]、前列腺分割[79]、前列腺分割[79]，腺体分割[24]、[84]、[101]、[91]、细胞核分割[24]、[84]、[91]、[101]、细胞分割[87]、[105]、[106]、脾脏分割[90]、肺野/新冠肺炎病变分割[91]、高光谱病理图像分割[107]。表2列出并详细说明了几种值得注意的方法。

在大多数医学图像分割任务中，U形卷积神经网络结构（简称Unet）取得了巨大的成功。然而，由于卷积运算的内在机制，Unet在建模长期依赖性方面通常受到限制。为了克服这一限制，研究人员努力设计与Unet架构相结合的Transformers的健壮变体。这赋予了Unet在长期依赖关系中捕获上下文信息的能力。此外，还有几种方法使用纯Transformers进行分割任务。我们将在本节的下一部分介绍它们。

3.2.1 Unet-based Transformers

为了构建与流行的Unet架构相结合的Transformers，我们发现现有的研究主要关注以下三类：

1）在Unet的不同级别插入Transformers层；

2）使用不同的策略组合Transformers和UNET；

3）使用多尺度特征或注意机制。

下面我们将详细介绍这三个类别。

Location of Transformer in Unet:

要将转换器与Unet结合起来，一个直观的想法是在Unet的编码器和解码器块之间插入一个转换器，从而在高级视觉概念之间建立长期依赖关系。根据这个想法，Chen等人[68]提出了Transune，如图7所示，它通过CNN提取高分辨率的空间特征，然后通过转换器对全球环境进行编码。然后对Transformers编码的自我关注特征进行上采样，并与使用跳转连接从编码路径提取的多尺度特征进行组合，以实现精确定位。在多器官和心脏分割任务中，与V-Net、AttnUNet和ViT相比，Transune取得了优异的性能。与Transune类似，Yao等人[69]将Transformers网络与 Claw Unet结构相结合，在突触多器官分割方面优于Transune。例如，Xu等人[70]提出了LeViT UNet，将LeViTTransformers集成到UNet架构中。在[71]中，Sha等人通过在Unet中添加Transformers模块设计了TransformersUnet，其性能优于TransUnet。

与上述研究不同的是，Transformer在编码器块之后滑动，李等人[72]在解码器中添加了注意上采样（AU）组件。他们还提出了窗口注意解码器（WAD）和窗口注意上采样（WAU），用于本地窗口，以减少内存和计算成本。Gao等人[74]提出了一种UTNet，它在编码器和解码器块中应用自我关注模块，以最小的开销捕获不同规模的长距离依赖关系。他们提出了一种有效的自我注意机制和相对位置编码，将自我注意操作的复杂性从O（n2）显著降低到接近O（n）

Strategies of bridging Transformer and Unet:

与上述在单一推理路径中结合Transformer和Unet架构的方法不同，其他工作探索了不同的Transformer-Unet耦合策略。Sun等人[76]使用Unet和Transformer编码器独立生成表示，然后集成它们的表示以进行后续解码。Zhang等人[79]提出了TransFuse，它还以并行方式将Transformer和Unet结合起来。与上述工作相比，本文提出了一种新的融合技术，即双融合模块，可以有效地融合两个分支的多层次特征。Zhou等人[81]声称，最近提出的大多数基于Transformer的分割方法只是将Transformer作为辅助模块，以帮助在卷积表示中编码全局上下文，而没有研究如何将自我关注与卷积最佳结合。为了解决这个问题，他们引入了一种基于自我注意和卷积经验组合的交叉结构的nnFormer。

Multi-scaling:

MIA中Transformer的多尺度策略以多尺度方式使用特征，或将多尺度图像作为输入。

（1） 多分辨率图像。Zhang等人[24]提出了一种金字塔网络结构，即金字塔医疗Transformer（PMTrans），它通过处理多分辨率图像来捕获多范围关系。Valanarasu等人[84]在编码器中添加了选通轴向Transformer层，其中包含高度和宽度选通多头注意块的基本构建块。利用整体图像和补丁对应地学习全局和局部特征，并提出局部全局训练策略（LoGo），进一步提升整体性能。

（2） 多尺度特征。与Transune不同，Transune仅使用Transformer来处理从上一层学习到的低分辨率特征地图，Xie等人[25]提出了一种可变形Transformer（DeTrans）来处理多尺度和高分辨率特征地图。Ji等人[87]提出了多复合变换器（MCTrans），它将多尺度卷积特征嵌入为一系列标记，并执行尺度内和尺度间的自我注意。与这些使用CNN提取特征的作品不同，Hatamizadeh等人[90]介绍了利用纯Transformer作为编码器来学习输入体积序列表示的UNEtTransformer（UNETR）。Transformer编码器通过不同分辨率的跳过连接直接连接到解码器，以计算最终的语义分段输出。

（3） 多层次的关注。Chen等人[91]提出了TransAttUnet，其中多层次引导注意和多尺度跳跃连接被联合设计，以有效增强传统的U形结构。为了有效地学习编码特征之间的非局部交互作用，Transattune将**变换器自我注意（TSA）和全局空间注意（GSA）**结合到Transattune中。Wang等人[95]提出了混合变换模块（MTM），该模块通过精心设计的局部全局高斯加权自我注意（LGG-SA）计算自我亲和力，然后通过外部注意（EA）挖掘数据样本之间的相互联系。

（4） 多轴融合。Yan等人[96]采用轴向融合变换器对切片间和切片内信息进行融合，降低了在3D空间计算自我注意的计算复杂度。

总之，上述方法都利用了使用特征融合策略学习的其他特征，以实现更有效的学习。

3.2.2 Pure Transformer

除了前面提到的将Transformer与卷积相结合的Unet achitecture变体，Karimi等人[99]尝试在相邻图像块之间使用简单的自我注意，而不进行任何卷积操作。给定一个3D图像块，他们的网络将其划分为 $n^3$ 个3D面片，其中n=3或5，并学习每个面片的1D嵌入。该网络基于块嵌入之间的自我注意来预测块中心块的分割图。这种假设下的方法很容易被认为是纯Transformer。

Cao等人[100]提出了一种用于医学图像分割的类Unet纯变换器，方法是将标记化图像块馈送到类变换器的U形编码器架构中，该架构具有跳跃连接，用于局部-全局方式的语义特征学习。Lin等人[101]更进一步，提出了DS-Transune，它首先采用基于Swin-Transformer的双尺度编码器子网络来提取不同语义尺度的粗粒度和细粒度特征表示。此外，还提出了一个设计良好的Transformer交互式融合（TIF）模块，通过自我注意机制有效地建立不同尺度特征之间的全局依赖关系。为了更好地利用Transformer的自然多尺度特征层次，Huang等人[102]提出了MISSFormer，它有两个吸引人的设计：1）增强Transformer块作为前馈网络，具有更好的特征一致性、长期依赖性和局部上下文；2）增强的Transformer Context Bridge，用于对分层Transformer编码器生成的多尺度特征的长期依赖性和局部上下文进行建模。

3.3 Image-to-image translation(图像生成和恢复)

略

3.4 Detection

略

4 DISCUSSION

Transformer已成功应用于医学图像分析的几乎所有领域。然而，由于一些挑战，机器学习方法在实际临床应用中的部署可能会导致性能不佳。其中，最迫切的挑战在于标签的稀缺性，尤其是在场景理解任务中，例如分割和检测，这通常需要像素级的精确标签。从嘈杂的标签中学习是一个更大的挑战。此外，建立先进的CADx方法需要以多任务的方式使用多模态临床数据——这是一种多功能的学习方法，但在设计上很困难。

4.1 Transformers under different learning scenarios

4.1.1 Multi-task learning

建立具有多个任务的模型有助于提高其通用性，这在医学图像分析领域有着很高的要求。Sui等人[143]提出了一种新的转移学习方法，即CST，该方法具有一个基于转换器的框架，用于联合结直肠癌区域检测和肿瘤分割。对于检测，输入图像的生成区域建议以及编码器-解码器模块获得的位置特征被用作DETR网络的输入。对于分割，该模型使用图像块作为输入，这些图像块被投影成一系列嵌入，输入到转换器中进行掩模预测。

4.1.2 Multi-modal learning

使用多模态数据为诊断提供补充证据。例如，研究人员探索了光学相干断层扫描（OCT）和视野（VF）测试的结合，以帮助诊断眼部疾病。Song等人[58]提出将Transformer用于青光眼诊断。该模型利用注意机制来模拟OCT特征和VF特征之间的成对关系。然后，再次应用注意机制计算视野区域和视网膜神经纤维层象限之间的区域特征关系。利用Transformer模型将互补信息从一种模态传递到另一种模态。

Monajatipoor等人[141]提出了一种基于转换器的视觉和语言模型，该模型将高效的PixelHop++模型与BERT模型相结合。具体来说，使用领域内知识对BERT模型进行预训练。

当在小规模数据集上训练时，该模型被证明是有效的。提取的视觉特征和单词嵌入被送入Transformer进行最终诊断。虽然该模型减少了对医学图像大量注释的需求，但语言模型的预训练仍然需要大量的临床报告。

Zheng等人[139]通过考虑潜在的模态间相关性，专注于多模态信息的特征融合。他们提出了Transformer式模态触动特征融合方法（MaFF），从每个模态中提取丰富的信息，同时挖掘模态间的关系。然后，利用自适应图学习机制（AGL）基于融合特征为下游任务构造潜在鲁棒图。该方法在预测AD和自闭症方面取得了显著的进步。Dai等人[142]提出将TransMed用于腮腺肿瘤的诊断。TransMed结合了CNN和Transformer networks的优点，可以捕获低级纹理和跨模态高级关系。该模型首先将多模态图像作为序列进行处理，将其链接并发送给CNN进行特征提取。然后将特征序列输入Transformer，学习序列之间的关系，并进行特征融合。他们的工作利用Transformer从不同模式的图像中捕获相互信息，从而显示出更好的性能和效率。Nguyen等人[138]试图模拟放射科医生和全科医生在膝骨关节炎的诊断和预后方面的相互作用。他们提出了一个受临床启发的多智能体Transformer（CLIMAT）框架，该框架采用三Transformer架构。首先，使用Transformer和CNN相结合的特征提取工具来预测疾病的当前状态。然后，将非图像辅助信息输入另一个转换器，以提取上下文嵌入。最后，一个附加的基于转换器的全科医生模块根据当前状态和上下文嵌入预测疾病轨迹。

总之，Transformer被认为是连接CV和NLP任务的一种很有前途的方法[144]。在这种假设下，Radford等人[145]构建了一个多模式转换器，即CLIP，它提供了零镜头能力，可以从文本描述中识别图像，而无需图像标签。这种优势还指出了一种潜在的方法，可以为实际的临床应用构建更强大、更准确的计算机辅助诊断（CADx）方法，其中多种数据类型，例如临床、实验室和成像数据被视为不同的信息源。

4.1.3 Weakly-supervised learning

医学图像中的弱监督条件之一是，特定疾病的ROI在图像中相对较小，而只有图像级别的标签可用。为了解决这个问题，多实例学习（MIL）被作为一个合适的解决方案。在MIL中，训练样本表示一组实例，称为BAG。仅对行李进行监督，未提供行李中所含实例的单独标签[154]。

尽管许多现有的MIL方法都假设正和负实例独立于正和负分布[154]进行采样，但包中的实例是相关的，尤其是在医学图像分析中。MIL的学习场景没有遵循i.i.d假设，因为实例之间的关系没有被忽略。在这种情况下，可以利用VIT在实例之间建立关联，以获得更好的高级表示。Li等人[146]提出了基于变换器的MIL框架，其中包含一个诱导注意块，用于计算注意，同时绕过由成对点积引起的二次计算复杂性。该框架的特征聚合器也是基于多头注意的。它将前面提到的功能合并到包表示中。Yang等人[148]将患者的多个肺结节视为一个袋子，并以每个结节为例。与传统的MIL方法不同，MIL方法使用池运算来获得baglevel表示，他们建议使用3D Denset来学习体素级别的孤立结节级别表示。接下来，将生成的表示输入转换器，以了解同一患者的结节关系。为了减少计算负担，他们将注意力从分裂通道特征中提取出来，应用于群体规模的网点制作。邵等人[150]专注于不同实例之间的相关性，而不是简单地假设实例是独立的、分布相同的。为此，他们提出了一个基于Transformer的MIL框架来处理整个幻灯片图像分类问题。他们的框架使用了Transformer层为了聚集形态信息，提出了金字塔位置编码生成器（PPEG）来提取空间信息。此外，他们采用Nystrom方法来计算近似的自我注意，这可以将计算复杂度从O（n2）降低到O（n）。Rymarczyk等人[147]更加关注注意机制。他们的工作有助于修订基于注意力的MIL池（AbMILP），该池从不同数量的实例中收集信息。他们提出了基于自我注意的MILPooling（SA-AbMILP）来模拟一个包中不同实例之间的依赖关系。他们还建议通过引入不同的内核来扩展注意力的计算，这些内核与点产生的作用相同。他们评估了他们在组织学、微生物学和视网膜数据集上的工作。Yu等人[149]的研究探索了ViTs在眼底图像视网膜疾病分类中的适用性。他们提出了多实例学习增强型视觉转换器（MIL-VT），通过在ViT中添加一个即插即用多实例学习头来利用从单个补丁中提取的特征。

4.1.4 Self-supervised learning

Transformer的成功训练依赖于大规模的注释数据，而这些数据在实际的临床设施中很少可用。自我监督学习（SSL）的范例就是为了解决这个问题而创建的。自监督学习旨在通过转移相关无监督上游任务（即视觉概念学习）的知识，提高下游任务（例如分类、检测和分割）的性能，并使用未标记数据中的自包含信息预训练模型[155]。训练SLL ViTs的实践通常植根于在ImageNet上预训练模型，然后在目标医学图像数据集上进行微调。与CNN相比，这提高了VIT的性能，并实现了SOTA精度[156]。

Truong等人[152]的工作评估了医学图像中自我监督特征的可转移性。他们使用DINO（一种自我监督的ViT）对特征进行预训练。他们使用ViT作为主干，并与SimCLR和SwA V相比显示出其优越性。Park等人[40]提议使用公共的大规模CXR分类数据集对主干网进行预训练。然后将预训练主干模型提取的特征输入ViT诊断2019冠状病毒疾病。Jun等人[104]提出了一种自监督转移学习框架，该框架可以更好地表示三维体积图像中的空间关系，以方便后续任务。他们将三维体积图像转换为来自三个视图的二维图像切片序列，并将其输入到由卷积编码器和Transformer组成的预训练主干网络中。Transformer的预训练是通过屏蔽编码向量实现的，它充当SSL的代理任务。后续任务包括脑病诊断、脑年龄预测和脑肿瘤分割三维立体图像。他们还探索了3D医学图像的参数高效转移学习框架。Wang等人[151]收集了一个大型公共组织病理学图像数据集，对他们提出的混合CNNTransformer框架进行预训练。此外，他们还设计了令牌聚合和激励（TAE）模块，通过考虑所有令牌，进一步增强全球权重关注。Sriram等人【153】探索了Transformer在2019冠状病毒疾病预测中的应用。他们提出了一种多图像预测（MIP）模型，该模型将一系列图像以及相应的扫描时间作为输入。为了处理缺失的2019冠状病毒疾病图像，他们使用动量对比度学习，这是一种自我监督的方法来预训练特征提取网络。除了从X射线中提取的特征外，他们还提出了连续位置嵌入（CPE）来添加基于时间步长的信息。特征串联和连续位置嵌入被输入Transformer，以预测不良事件的可能性。

4.2 Model-improvement: quantification, acceleration and interpretation

有几项工作专注于医学成像领域内的模型效率。一个自然的想法是简化注意力机制，这在Transformer中需要最大的工作量。Gao等人[74]提出了一种有效的自我注意机制和位置编码，这显著降低了自我注意操作的复杂性，从O（n2）降低到接近O（n）。这绕过了Transformer需要大量数据才能了解视觉感应偏差这一障碍。他们的混合层设计将Transformer初始化为卷积网络，无需预训练。此外，Liu等人[43]提出的上述视觉观察者（VOLO）将标准VIT替换为执行内部自我注意机制的Linformer，从而将原来的时空复杂度O（n2）降低到更小的复杂度O（n）。我们在MIA中看到的试图解决模型效率问题的工作比在CV中看到的要少。然而，随着医学图像越来越大、越来越少，迫切需要在该领域解决这一问题。因此，我们希望在这个特定的研究方向上看到更多的作品。

4.3 Comparison with convolutional neural networks

在ViTs出现之前，卷积神经网络在CV中占主导地位，包括医学图像分析领域。为了提高基于CNN的分类器在自然图像和医学图像中的性能，人们投入了大量精力。为了研究基于CNN的方法是否仍然适用于VIT，提出了几项工作。同时，由于ViTs在多个基准测试中排名靠前，很多研究都集中在ViTs和CNN之间的性能比较上。

为了获得理想的Transformer性能，需要大规模数据集。然而，在医学图像分析领域，可用的图像和注释是有限的。为了缓解这一问题，许多方法在ViTs中采用卷积层来提高有限医学图像的性能，并利用转移学习和自监督学习的能力。Matsoukas等人[156]探讨了转移学习和自我监督学习机制是否有利于VIT。他们进行了几项实验，以比较CNN（即ResNet50）和ViT（即DEIT-S）使用不同初始化策略的性能：1）随机初始化权重，2）使用ImageNet预训练权重的转移学习，3）在目标数据集上的自我监督预训练，2）中的初始化相同。他们在APTOS 2019、ISIC 2019和CBIS-DDSM数据集上评估了这些方法。可以得出结论，标准程序，例如使用ImageNet预训练权重初始化，以及利用自我监督学习，可以弥合CNN和ViT之间的性能差距。Krishnamurthy等人[157]在CNN和ViTs中采用转移学习方案进行肺炎诊断。他们首先在ImageNet上对模型进行预训练，并在他们的私有数据集上微调分类器。然而，他们的比较是基于对冻结主干层的微调，这限制了适应目标域时特征提取的性能。Truong等人[152]评估了医疗成像任务中自我监督特征的可转移性。他们选择ResNet-50作为主干，并使用三种自我监督的方法（SimCLR、SwA V和DINO）对其进行预训练。DINO使用ViT作为主干，这一技术在很大程度上优于其他自我监督技术和监督基线。他们提出了一种模型不可知技术，即动态视觉元嵌入（DVME），将多种自监督学习方法的预训练特征与自我注意相结合。

对于多尺度细胞图像分类的任务，Liu等人[158]提出了一个实验平台来比较多种深度学习方法，包括CNN和ViTs。他们通过改变图像的内部细胞比率，验证了深度学习模型在标准和缩放数据上的性能。结果表明，包括ViTs在内的深度学习模型对宫颈细胞病理图像中内部细胞比率的变化具有鲁棒性。对于肩部植入物X射线制造商分类，Zhou等人[159]比较了各种模型的性能，包括传统的机器学习方法、基于CNN的深度学习方法和ViTs。结果表明，ViT在这些任务中表现最好，迁移学习显著提高了ViT。Altay等人[160]旨在利用MRI对AD进行早期临床前预测。他们将Transformer与基线3D CNN模型和3D反复视觉注意模型进行了比较，结果表明Transformer的准确度和F1分数最高。

总之，现有的研究并没有表明ViTs在所有情况下都优于CNN，尤其是在医学图像分析领域。因此，与CV中的方法类似，考虑到卷积的优点，最近的工作采用了构建混合模型。

5 CONCLUSION

Transformer正在改变计算机视觉领域。此外，在医学图像分析领域，使用Transformer的研究正在迅速发展。然而，大多数Transformer-based的方法自然且简单地应用于医学成像问题，没有发生剧烈的变化。换句话说，先进的方法，例如弱监督学习、多模式学习、多任务学习和模型改进，很少被探索。此外，我们只看到少数关注模型一般问题的工作，例如并行化、可解释性、量化和安全性。这些表明了医疗Transformer的未来发展方向。

你可能感兴趣的:(深度学习,深度学习框架,经典论文阅读,深度学习,人工智能,计算机视觉)

LLM系统性学习完全指南（初学者必看系列） GA琥珀 LLM 学习人工智能语言模型
前言这篇文章将系统性的讲解LLM（LargeLanguageModels,LLM）的知识和应用。我们将从支撑整个领域的数学与机器学习基石出发，逐步剖析自然语言处理（NLP）的经典范式，深入探究引发革命的Transformer架构，并按时间顺序追溯从BERT、GPT-2到GPT-4、Llama及Gemini等里程碑式模型的演进。随后，我们将探讨如何将这些强大的基础模型转化为实用、安全的应用，涵盖对齐
六项精进琪琪兒
公司:宁波市镇海承迪文具有限公司【日精进打卡第146天】一、【知～学习】1：《六项精进》诵读0遍共30遍2：《大学》诵读1遍共221遍【经典名句分享】曾经以为“老去”是很遥远的事情，突然发现“年轻”已经是很久以前的事了…时光好不经用抬眼已然半生！！很多付出，可能永远都没有回报，但依旧乐意全情付出，是要为了给自己内心一个交代。二：【行及践行】1、修身（对自己）1.1吃好吃的1.2喝好多水1.3走了好
探索OpenCV 3.2源码：计算机视觉的架构与实现轩辕姐姐
本文还有配套的精品资源，点击获取简介：OpenCV是一个全面的计算机视觉库，提供广泛的功能如图像处理、对象检测和深度学习支持。OpenCV3.2版本包含了改进的深度学习和GPU加速特性，以及丰富的示例程序。本压缩包文件提供了完整的OpenCV3.2源代码，对于深入学习计算机视觉算法和库实现机制十分宝贵。源码的模块化设计、C++接口、算法实现、多平台支持和性能优化等方面的深入理解，都将有助于开发者的
为广大网友收集的经典小游戏合辑(VC++)，你想要的都有程序员欧阳沐
很多经典小游戏合辑(VC++)，有超级玛丽，坦克大战，黑白棋，飞机大战，还有两款不知道名字，还附有源码，学习和娱乐都有哦。源码目录结构图：部分源码展示（由于源码比较多，所以就不在此全部展示，需要的可以私信me）：如果你想学c++编程可以私信小编，发送“01”获取源码或2019年最新学习资料“从零基础到精通”。部分资料展示如下：您的关注便是小编每日不断更新分享的源动力，谢谢。学c++可抠裙：74五五
今日头条极速版邀请码是多少？(附22个邀请码三连冠与填写方法)确定详细桃朵十三
今日头条极速版(免费22个邀请码三连冠)邀请码大全，今日头条极速版邀请码是【1552042938】或【Q04911201】或【1451455648】百人大战的战场上需要的是对局势的把控，下面给大家带来一些今日头条极速版专属的福利，大家可以免费的兑换到不少皮肤和道具，今日头条极速版app上吃鸡其实更有把握。今日头条极速版是一款十分精彩的动作新闻app，根据热门动漫改编的资讯软件，还原经典角色和技能，
苔 coffee漫
一滴清如澈的水珠苔清·袁枚白日不到处，青春恰自来。苔花如米小，也学牡丹开。过年那会第一次看到好多公众号上分享了《经典咏流传》中梁俊老师和他的孩子们一起唱的《苔》，于是我也去看看到底有多好。当梁老师问到你知道为啥要带你们唱《苔》吗？是希望我们可以像牡丹一样开放。当孩子们开口唱《苔》时，那纯真的声音，简单的曲调，就像是见到了许久未见的老朋友，见到了倾慕已久的心上人的感觉，激动，更多的是感动。教孩子们唱
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
【Python】人脸识别宅男很神经 python 开发语言
第一章：计算机视觉与图像处理的基石在深入人脸识别之前，我们必须首先牢固掌握计算机视觉和图像处理的基本概念。人脸，本质上就是一张复杂的图像，对图像的理解是所有高级视觉任务的起点。1.1图像的本质：像素与数字化表示图像，在我们看来是连续的画面，但在计算机内部，它却是离散的数值矩阵。1.1.1什么是像素？图像的最小单元像素（Pixel），是构成数字图像的最小单位。可以将其想象成一个微小的彩色点。一张数字
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
计算机视觉算法实战——关键点检测
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言关键点检测（KeypointDetection）是计算机视觉领域中的一个重要研究方向，旨在从图像或视频中检测出具有特定语义信息的关键点。这些关键点通常代表了物体的特定部位或特征，例如人体的关节、面部特征点、车辆的轮子等。关键点检测在姿态估计、动作识别、目标跟踪、三维重建等任务中
“希望是比钻石更珍贵的，在当下最需要的东西”，袁明辉《六项精进》打卡学习273天 YuanWelldon
流浪地球流浪地球姓名：袁明辉公司：宁波惠尔顿婴童安全科技股份有限公司364期学员组别：利他一组403期志工组别:谦虚一组宁波盛和塾8月月度学习会《用数字经营企业》志工宁波盛和塾道盛哲学全国企业家践行成果发表会志工【知～学习】背诵《六项精进大纲》3遍，共761遍。背诵《大学》3遍，共761遍。【经典名句分享】今天开启2019年农历新年计划一、修身1、背诵《般若波罗蜜多心经》0遍，共808遍2、陪女儿
既然 IP 层会分片，为何 TCP 层还需要 MSS？
这是一个非常经典且深入的问题！IP分片和TCP的MSS（MaximumSegmentSize）看似功能重叠，实则设计目标完全不同。MSS的存在正是为了规避IP分片的缺陷。以下是逐层解析：一、IP分片的核心问题IP层虽然支持分片（Fragmentation），但存在三大致命缺陷：问题后果1.分片丢失导致整个包重传若任一分片丢失，TCP层需重传整个原始数据包（所有分片），浪费带宽。2.重组消耗资源接收
【日精进打卡第31天】扬州方圆__周亮
扬州方圆~~周亮【知～学习】复习水利考试基本知识《六项精进》3遍。累积93遍《大学》3遍。累积93遍【经典名句分享】积善行，思利他【行～实践】一、修身：（对自己个人）1、学习永无止境。二、齐家：（对家庭和家人）1、整理内务。三、建功：（对工作）1、在家休息。｛积善｝：发愿从2018年4月29日起2019年4月29日内完成730件善事。今日2善，累计62善。【省～觉悟】1、考试时间临近，抓紧复习，其
复杂场景检测老翻车？陌讯算法实测提升 40% 2501_92453489 算法视觉计算机视觉视觉检测
在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达20%以上，泛化能力不足成为项目落地的最大阻碍。而陌讯AI视觉算法通过架构创新，正在重新定义复杂场景下的检测精度标准。技术解析：从单模态到多模态的跨越传统目标检测模型多依赖单一RGB图像输入，在特征提取阶段容易受环境干扰。以经典的FasterR-CNN为例，其区域提议网络（RPN）
C语言实现扫雷游戏：从经典玩法到代码构建
文章目录C语言实现扫雷游戏：从经典玩法到代码构建一、游戏简介：经典玩法回顾二、扫雷游戏的设计与实现2.1整体设计思路与技术选型核心技术栈多文件分工2.2棋盘设计：核心数据结构棋盘尺寸与扩展设计双棋盘机制2.3核心功能实现1.棋盘初始化与打印2.随机布置地雷3.地雷排查与数字计算2.4游戏流程控制4.排查逻辑完整实现三、功能扩展：提升游戏体验四、总结C语言实现扫雷游戏：从经典玩法到代码构建扫雷作为一
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
六项精进打卡11天王尚涛
每日打卡模板姓名：王尚涛公司：为福投资控股集团【日精进打卡第11天】【知～学习】《六项精进》纲要读1遍，共17遍《大学》读1遍共11遍《论语》第12-24页【经典名句分享】付出不亚于任何人的努力；要谦虚不要骄傲；每天都要反省；活着，就要感谢；积善行，思利他；不要有感性的烦恼；若无相欠，怎会相见；人不知而不愠，不亦君子乎；命由我作，福自己求；小人闲居为不善。言不及之而言谓之躁，言及之而不言谓之隐，未
恩格斯的经典名言语录(82条) 汉唐雄风
1、利用时间是一个极其高级的规律。2、篝火能把严寒驱散，团结能把困难赶跑。3、最好你们能独立处理事情，这将使你们获得自信心。4、史的必然要求和这个要求的实际上不可能实现之间的悲剧性的冲突。5、只有以爱情为基础的婚姻才是合乎道德的。6、痛苦中最高尚的最强烈的和最个人的乃是爱情的痛苦。7、数学是研究现实生活中数量关系和空间形式的数学。8、为了进行斗争，我们必须把我们的一切力量拧成一股绳，并使这些力量集
工业大模型应用报告：新机遇、挑战与未来展望花生糖@ AIGC学习资料库大模型人工智能应用扩展屏应用开发 AI 机器学习
大模型在工业智能化发展中的新机遇、挑战与展望。以下是报告的核心内容概述：大模型为工业智能化发展带来新机遇大模型开启人工智能应用新时代，推动技术创新和应用。大模型有望成为驱动工业智能化的引擎，提高研发效率、拓展生产制造智能化应用边界、提升经营管理水平。大模型应用落地需要深度适配工业场景，解决行业知识和企业特定环境的理解问题。大模型和小模型在工业领域将长期并存小模型应用呈现倒U型分布，主要集中在生产制
一起读经典《道德经》第三十八章第三十九章学业平台发起人
行礼求道，探一以正己《老子·第三十八章》道德高尚的人，不必以道德诫命来自律，因为他内心自有道德。道德低下的人，需要恪守道德诫命，因为他内心没有道德。道德高尚的人是无为的，其道德不是刻意为了实现什么。道德低下的人是在追求道德，其道德是为了达到某种目的。有大仁爱的人，是在追求仁爱，却不是刻意实现某种目的。有大正义的人，是在追求正义，而且其正义是为了实现某种目的。有大礼法的人，是在追求礼法，却没有人响应
真正不充钱的经典复古传奇手游有哪些真正不充钱的传奇手游排行榜2023 会飞滴鱼儿
游戏一直以来都是游戏玩家们非常喜爱的产品，其便捷的游戏体验和丰富的游戏内容吸引了众多爱好者。在众多的传奇游戏网站中，哪些最热门呢？现在对于传奇手游，玩家最注重的就是游戏内部号的由来，这类账号不仅每日都有运营商328-1688免费充值卡礼包，还有兑换码礼包，道具扶持礼包，所以普通玩家一对比，基本难以生存，好了，下面就给大家盘点几个知名内部号官网！对此推荐的热门传奇游戏网站有三个：1.游人特权站官网2
AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
全栈Todo应用实战：从零到一的本地部署与深度解析
全栈Todo应用实战：从零到一的本地部署与深度解析前言在现代Web开发中，全栈应用已成为主流。本文将以一个经典的Todo（待办事项）应用为例，详细记录从项目下载、环境配置、后端启动、数据库交互到前端运行的完整流程。我们将深入探讨在此过程中遇到的一个典型问题——CORS与API请求失败，并提供从“快速修复”到“最佳实践”的解决方案。这不仅是一份操作指南，更是一次宝贵的实战经验总结。你将从本博客中学到
十大经典排序算法——冒泡排序 ————————————————— 算法排序排序算法算法
冒泡排序（BubbleSort）是一种简单的排序算法，它通过重复地遍历待排序的列表，比较相邻的元素并交换它们的位置来实现排序。该算法的名称来源于较小的元素会像"气泡"一样逐渐"浮"到列表的顶端。一、算法步骤比较相邻元素：从列表的第一个元素开始，比较相邻的两个元素。交换位置：如果前一个元素比后一个元素大，则交换它们的位置。重复遍历：对列表中的每一对相邻元素重复上述步骤，直到列表的末尾。这样，最大的元
读书丨《我们仨》观后感一棵两棵三棵树_8622
那些相濡以沫的爱情“从今往后，咱们只有死别，再无生离。”——钱钟书“人间不会有单纯的快乐，快乐总夹杂着烦恼和忧虑，人间也没有永远。”“我们这个家，很朴素；我们三个人，很单纯。我们与世无求，与人无争，只求相聚在一起，相守在一起，各自做力所能及的事。碰到困难，我们一同承担，困难就不复困难；我们相伴相助，不论什么苦涩艰辛的事，都能变得甜润。我们稍有一点快乐，也会变得非常快乐。”这是本书的经典句子。相比平
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比