hahahayyds

【论文阅读】FFUNet：一种新的特征融合为医学图像分割提供了强大的解码器

参考文献：Xie, J., et al.: FFUNet: a novel feature fusion makes strong decoder for medical image segmentation. IET Signal Process. 16(5), 501–514(2022).https://doi.org/10.1049/sil2.12114

摘要

一、引言

二、相关工作

2.1 基于CNN的编码器和解码器方法

2.2 transformer用于医学分割

2.3 跳跃连接

2.4 特征融合网络

三、研究方法

3.1 结构概述

3.2 带两个分支的编码器

3.3 ConvUpBlock

3.4 特征融合模块(FFM)

四、实验

4.1 数据集

4.2 实现细节

4.3 与现有技术的比较

4.4 消融研究

4.5 泛化到其他数据集

五、结论

参考文献

摘要

卷积神经网络（CNN）具有很强的提取局部特征的能力，但在提取全局上下文方面稍有欠缺。相比之下，transformer由于全局自注意机制，擅长远距离建模，而其局部性能有限。另一方面，编码器和解码器之间的特征差距对于采用普通跳跃连接的U形网络也具有挑战性。

在卷积网络和transformers的基础上，提出了一种用于医学图像分割的混合网络结构FFUNet，该结构具有一个新的模块，即特征融合模块（FFM）。所提出的FFM由特征注意力选择、交叉偏移生成和可变形卷积层组成，旨在取代原始的简单跳跃连接，以缓解编码器和解码器之间的模糊语义信息，从而实现更强大的医学图像分割网络。

实验表明，文章所提出的FFUNet在Synapse数据集的分割增益方面具有惊人的性能。此外，在其他四个流行的数据集上基于CNN或基于transformer的分割网络一致的实现了改进，这表明所提出的方法在泛化和紧凑性方面具有优势。

关键字：注意机制、一致性、可变形卷积、特征融合、医学图像分割、跳跃连接

一、引言

医学图像分割对患者的诊断和后续治疗计划的制定具有积极作用。分割通常需要有经验的医生进行，这非常耗时，可能会导致一些主观错误。近年来，受益于卷积神经网络（CNN；例如，全卷积网络[1]），医学图像的自动和高精度分割已经成为可能。

在医学图像分割领域，包括具有跳过连接的对称编码器-解码器的U形结构[2,3]已成为主流的分割网络架构。后续网络的主要部分是精细设计这三个部分（即编码器、解码器和跳过连接），以获得更好的分割性能。在transformer[4]应用于计算机视觉（CV）任务之前，编码器和解码器主要依赖卷积运算。编码器用于从原始特征图中提取语义信息，以生成低分辨率和高维图像特征，解码器对编码器的最终输出进行上采样，以逐渐将分辨率恢复到原始特征图大小，以进行密集预测。在编码器过程中，连续下采样操作通常用于获得具有大感受野的高水平语义特征图。然后，在解码过程中，使用相应的跳过连接来弥补由编码器中的下采样引起的空间信息的损失。使用这种简洁的结构，U-Net及其变体（Res‐UNet[5]、MultiResUNet[6]、U-Net++[7]和U-Net3+[8]）在各种医学图像数据集上取得了令人鼓舞的结果。

尽管基于CNN的U‐Net结构在多个医学图像数据集上取得了巨大的分割成就，但卷积运算专注于局部特征图的固有缺陷导致缺乏对远距离建模的能力。另一方面，得益于全局自注意力机制，transformer是远程建模的专家。因此，越来越多的研究人员正在尝试采用CNN和transformer的混合组合（例如Conformer[9]、BotNet[10]和TransFuse[11]）或纯transformer（如Swin transformer[12]和Shuffle transformer[13]）来提取高级语义信息，以进行精确分类，同时消除卷积的固有局部性。基于transformer的识别网络已经在一些大型数据集（例如，ImageNet‐22K）上匹敌或超过了基于CNN的最新网络，同时具有相似或甚至更少的参数和计算成本。为了顺应潮流，在出色性能的激励下，U‐Net结构的编码器和解码器逐渐采用transformer进行分割任务。例如，SwinUNet[14]，一种用于医学图像分割任务的U形纯变换器，在Synapse多器官CT数据集（Synapse）[15]和自动心脏诊断挑战数据集（ACDC）[16]上优于最先进的方法。

除了精心设计功能强大的编码器和解码器外，适当的跳跃连接对于正确融合功能也至关重要。由于编码器和解码器级之间的特征差异降低了分割性能，因此提出了一系列方法来探索如何缓解编码器和解码器之间的差异。名为U‐Net++[7]的典型网络在编码器和解码器之间的跳跃连接中使用密集连接，与普通跳跃连接相比，该网络获得了更好的分割结果。UCTransNet[17]从信道方向的角度设计了跳跃连接，该连接包括带变压器的信道交叉融合（CCT）和信道交叉注意（CCA），并在文中提到的数据集上产生了优异的分段性能。

受Conformer‘s[9]惊人成功的启发，我们提出的FFUNet在这项工作中利用CNN和transformer的力量进行二维医学图像分割。FFUNet是一种混合U形架构，由编码器、解码器和跳过连接组成。编码器基于Conformer模块构建，该模块具有双分支（即CNN和变压器分支）。值得一提的是，我们在解码器中没有使用transformer分支。此外，为了增强编码器提取高级语义信息的能力，跳过连接在解码器恢复空间细节的能力中也起着重要作用。不同的渠道和空间维度通常侧重于不同的语义模式；自适应和有效地融合特征有利于复杂的密集预测（如医学图像分割）以提高精度。我们重新思考跳跃连接的特征差距，并重新设计替代架构，而不是简单的连接操作（例如，元素相加或信道级联），以更好地融合编码器和解码器级之间的特征。更具体地，提出了一种名为特征融合模块（FFM）的新模块，该模块通过选择卷积核中具有可学习偏移的每个计算位置来学习将编码器特征映射与解码器对齐，以有效融合编码器和解码器级的不兼容特征集。FFM可以很容易地嵌入并应用于医学图像分割任务中流行的UNet。一系列实验表明，在Synapse、ACDC和Gland segmentation（GlaS）数据集上，FFUNet分别比SwinNet提高了1.50%、0.70%和1.24%的DSC绝对增益，从而大大改善了分割流水线。文章贡献可以总结如下：

由于Conformer的优异性能，我们基于Conformer模块构建了编码器，该模块由CNN块、transformer块和特征耦合单元（FCU）组成[9]。解码器仅保留Conformer的CNN块。ConvUpBlock用于通过插值操作对提取的深度特征进行上采样，用于像素级语义预测。
为了缓解编码器和解码器级之间的特征差距，精心设计了FFM，该FFM由特征注意选择（FAS）、交叉偏移生成（COG）和可变形卷积层（DCL）组成，以提高跳跃连接的效率。我们引入了一种新的视角，通过与注意力机制[18]和可变形卷积操作[19]进行更有效的特征融合来弥补编码器和解码器之间的特征差距，以捕获更复杂的相关性。
我们提出了一项彻底的实验评估，表明FFUNet在五个公共数据集上的优异性能，包括Synapse[15]、ACDC[16]、GlaS[20]、MoNuSeg[21，22]和ISIC‐2017[23]。所提出的FFUNet具有显著的分割精度，在Synapse数据集上，DSC/HD达到80.63/18.15，与最近最先进的SwinNet相比，总体得分提高了1.50/3.40[14]。与基于CNN或基于transformer的分割网络相比，其余四个数据集都取得了一致的改进。通常，对多个数据集的广泛实验表明，我们的网络具有强大的鲁棒性和泛化能力。

本文的其余部分组织如下。在第2节中，我们回顾了关于医学图像分割任务的相关工作。第3节介绍了网络结构和详细方法。然后，第4节介绍了比较和消融实验，第5节总结了我们提出的方法。

二、相关工作

2.1 基于CNN的编码器和解码器方法

在过去的一段时间里，依赖卷积运算和残差连接的CNN[24-29]在图像识别中占据了主流地位。医学图像分割是一项密集的预测任务，用于识别分类中的每个像素。由于U形结构的出色性能和优雅，基于UNet的方法被广泛用于分割任务。Res‐UNet[5]是在原始UNet模型基础上构建的残差网络，并添加了加权注意机制。这种设计允许模型学习更多的信息，以区分血管和非血管像素的特征，并更好地维护视网膜血管树结构。CT体积中的肝脏和肿瘤分割面临两个挑战，即二维CNN无法学习三维空间信息，三维CNN需要高计算成本和GPU内存消耗。为了克服上述问题，Li等人。[30]提出了一种新的混合密集连接UNet（H‐DenseUNet），它由简单的ResNet、2D Dense UNet、3D DenseUNet和混合特征融合层组成。目前，基于CNN的方法由于其强大的特征提取能力，不仅在自然图像分类领域，而且在医学图像分割领域都取得了令人印象深刻的成功。

2.2 transformer用于医学分割

最近，一种开创性的视觉transformer[4]依靠自我注意机制，可以消除卷积运算的有限长距离依赖能力，在自然图像分类方面实现了最先进的性能。受各种CV领域中transformer令人印象深刻的准确性的激励，最近开发了用于医学图像分割的新框架，以便对全局上下文进行建模。例如，Chen等人[15]首次尝试将transformer引入名为TransUNet的编码器，并在Synapse和ACDC数据集上的医学图像分割中取得了良好的性能。与TransUNet不同，TransBTS[31]基于三维CNN，一次处理所有图像切片，从而更好地表示切片之间的连续信息。Medical Transformer[32]旨在满足以下事实：与使用门控轴向注意力模型和局部-全局训练策略的CV数据集相比，医学成像数据相对较低。由于Swin Transformer[12]的出色性能，Cao等人[14]提出了由纯transformer编码器和纯transformer解码器组成的SwinUNet，以揭示U形结构编码器和解码器中纯变压器的可行性和潜力。总之，我们在TABLE 1中介绍了transformer在医学图像分割编码器和解码器中的应用。

值得一提的是，Conformer[9]提出了一种双网络框架（CNN分支和变压器分支），它利用CNN提取局部特征，并利用transformer捕获全局上下文，作为通用主干网络。Conformer利用FCU融合CNN的局部特征和transformer的全局特征，在包括图像分类、对象检测和实例分割在内的各种CV任务中实现了惊人的性能。在这项工作中，我们探索使用Conformer模块作为基本单元，利用精心设计的用于医学图像分割的编码器构建合格的编码器-解码器网络。

2.3 跳跃连接

当UNet[2]被提出时，跳过连接机制被应用于桥接编码器和解码器之间的特征，并在恢复更精细的细节方面发挥了重要作用[33]。UNet的跳跃连接强加了不必要的限制性融合方案，仅在编码器和解码器子网的相同尺度特征图上强制融合。为了克服不必要的限制，UNet++[7]不仅结合了深度特征，还结合了浅层特征，用于收集多尺度特征，以缓解语义差距，更有利于特征融合。Wang等人[17]分析了跳过连接到医学图像分割对GlaS和MoNuSeg数据集的影响，并提出了UCTransNet，该网络从信道注意力的角度由CCT和CCA组成，具有优异的分割性能。Huang等人[34]认为，在编码器和解码器之间采用像素相加或信道级联会导致特征图未对齐，并降低分割精度，尤其是在对象边界上。他们提出了特征对齐金字塔网络（FaPN），该网络由特征对齐模块和特征选择模块组成，当与Faster/Mask R‐CNN在平均精度/平均交集上配对时，其性能优于FPN[35]。

2.4 特征融合网络

涉及不同阶段的特征融合是提高分割性能的重要手段。低级别特征具有更高的分辨率，并包含更多得细节信息；然而，它们缺乏语义，并且由于卷积较少而具有更多的噪声。高级特征具有更多的语义信息，而它们的分辨率很低，对细节的感知能力很差。因此，如何有效地整合这两种特征是分割模型的关键。如TABLE 2所示，我们介绍了最近流行的融合方法。

在这项工作中，我们设计了FFM，它不仅利用了当前阶段的特征图，还利用了前一阶段的特征图来有效融合特征，如图1所示。FFM的详细介绍将在第3节中说明。

三、研究方法

figure.2展示了我们精心设计的FFUNet架构的概述。据信，出色的分割性能需要编码器、解码器和跳过连接三个部分之间的紧密合作。然后，解码器如何有效地使用编码器和跳过连接来执行精确的像素分类，这是密集预测的关键。在这个问题的驱动下，我们详细阐述了解码器的设计，该解码器采用了一个名为FFM的新模块，通过更有效的特征融合与注意力机制[18]和可变形卷积运算[19]来桥接编码器和解码器之间的特征差距，以捕获更复杂的相关性。

在这个问题的驱动下，我们详细阐述了解码器的设计，该解码器采用了一个名为FFM的新模块，通过更有效的特征融合与注意力机制[18]和可变形卷积运算[19]来桥接编码器和解码器之间的特征差距，以捕获更复杂的相关性。

3.1 结构概述

如figure2所示，提出的FFUNet包括四个重要模块：即Conformer模块（由TransBlock和CNNBlock组成），ConvUpBlock，以及FFM（由FAS、COG和DCL组成）和跳跃连接。具体而言，FFUNet编码器的基本单元是Conformer模块[9]，用于提取多尺度特征和建模长距离相关性。ConvUpBlock专门设计用于执行像素级语义预测的2×上采样和插值操作。FAS使用注意力机制来选择来自编码器的特征图的重要性，并作为COG的输入来生成DCL的偏移。COG用于融合ConvUpBlock、FAS和最后一级低级特征产生的特征，有效地为DCL生成有益的局部特征。DCL设计用于根据COG学习到的偏移量选择有用的特征。三个部分的有效合作使FFUNet在多个数据集上表现良好。

给定输入图像X∈ ℝ^H×W×C， H× W和C分别表示空间分辨率和通道数。基于使用局部特征和全局上下文的原则，Conformer被设计为双网络结构，包括CNN分支和变压器分支。我们首先使用stem和Conformer模块生成五个层次特征Fi ∈ ℝ^Ci ×H/2i ×W/2i , where i ∈ {1; 2; 3;4; 5}and Ci ∈ {64; 64; 128; 256; 256},最后一个解码器块用于恢复大小为H×W的全空间分辨率.

3.2 带两个分支的编码器

继[9]之后，我们的编码器除主干块外还包括TransBlock、CNNBlock、FCU[9]和ConvDownBlock。输入图像X首先经过干块和最大池层，分别生成特征图F1 ∈ C×H/2i×W/2和F2 ∈ C×H/4×W/4（C=24）。F2被馈送到CNN分支和变换器分支以进一步执行表示学习。具体而言，CNN分支由七个CNNBlock和ConvDownBlock组成，生成特征金字塔结构。ConvDownBlock执行下采样以降低特征图的分辨率并扩展感受野。变压器分支由六个TransBlock组成，旨在为CNN分支提供远距离上下文，而CNN分支则为变压器分支提供详细的本地特征。为了缓解两个分支之间的不一致，建议FCU[9]以交互方式将局部特征与全局上下文进行转换。与之前的文献[36-38]相似，TransBlock中的自我注意如下：

其中Q; K; V ∈ ℝ^M^2×d表示the query, key and value matrices；M2表示窗口中的补丁数；d是query或者key的维度；B取自较小尺寸的偏置矩阵B∈ ℝ^(2M-1)(2M-1) [36]. SoftMax将输入映射到从0到1的实数，并且标准化确保总和为1。

自注意力机制，计算TransBlock内部元素之间的关注度，允许网络整合整个图像中的信息，即使是在最底层。注意力可以解释为将可用计算资源的分配偏向于信号中最有用的分量的一种方式。聚焦过程反映在权重系数的计算中。权重越大，越关注其对应的值，即权重表示信息的重要性，而值就是对应的信息。

3.3 ConvUpBlock

如图3所示，ConvUpBlock设计为2× 对特征图进行上采样，这在通道数减少的同时增加了地图的分辨率。首先，我们使用双线性插值对输入特征图进行上采样以提高空间分辨率。按照ResNet[25]中的布局，ConvUpBlock由一个上采样层和两个瓶颈组成，其中包括1× 1个卷积以减小信道尺寸（4倍），3×3空间卷积，a 1×1卷积以恢复信道号和使网络更深的剩余连接。

3.4 特征融合模块(FFM)

由于ConvDownBlock的下采样操作，编码器和解码器的跳跃连接之间存在可预见的语义差异。为了减少这种差距，提出了FFM（见figure.2），具体来说，我们将跳跃链接的输出定义为Si∈ℝ^Hi×Wi（i∈{1，2，3，4}，Hi=H/2^i,Wi=W/2^i）,W×H是原始输入图像的空间分辨率。以第一个跳跃链接为例，FFM有三个输入，即来自ConvUpBlock的X∈ℝ^14×14,来自跳跃链接的S4∈R^14×14和S3∈R^28×28。S4通过FAS(表示为fFAS（·）)，通向A4∈ℝ^14×14。然后X和COG(表示为fCOG（·）)馈入DCL(表示为fd（·）)对采样的重点进行预测。简而言之，FFM的流程课制定如下：

其中[]是两个参数的串联。

3.4.1 特征注意力选择(FAS)

根据参考文献[39–42]，注意机制在分割任务中起着重要作用。解码器尝试减少信道数，同时使用跳跃连接提供的详细特征来增加密集预测的空间分辨率。因此，在抑制跳过连接的无用特征的同时，增强有用的特征图以实现精确分配是至关重要的，也是具有挑战性的。如图4所示，FAS旨在克服这一挑战。与参考文献[18]中的CBAM一样，FAS由通道注意力模块和空间注意力模块[43]组成，其公式如下：

其中Conv（·）是1×1卷积层，Atts（·）和Attc（·）分别表示空间关注模块和通道关注模块。根据图4，Atts（·）和Attc（·）可以公式如下：

其中fc（·）和fc（·）的实现与参考文献[18]中的CBAM相同。

值得注意的是，我们FAS的设计灵感来自CBAM，它们之间主要有两个不同。首先，我们在逐元素乘法之后采用加法运算，以增加重要特征的值。其次，在模块的最后，采用1×1的卷积核和组归一化[44]来调整信道数。

3.4.2 交叉偏移生成(COG)

COG的数据流如图5所示。X表示自下而上路径ConvUpBlock、Si和Si的特征图−1来自跳跃连接，COG可数学公式如下：

四、实验

4.1 数据集

Synapse多器官分割数据集（Synapse）包含8个腹部器官（主动脉、胆囊、脾脏、左肾、右肾、肝、胰腺、脾脏、胃），包含3779张中向腹部临床CT图像。参考文献[[14]，[15]，在我们的实验中，Synapse的18个病例用于训练，其他12个病例用于测试。类似于参考。[[14]，[15]]我们使用的ACDC是使用MRI扫描仪从100例患者中收集的。数据集中标记了左心室、右心室和心肌，其中包括 70 个训练样本、10 个验证样本和 20 个用于测试的样本。由国际皮肤图像协作组织（ISIC）档案馆提供的ISIC-2017挑战数据集通常分为2000张训练图像，150张验证图像和600张测试图像。此外，GlaS有85张图像用于训练，80张用于测试，而MoNuSeg数据集有30张用于训练的图像和14张用于测试的图像。

4.2 实现细节

实验中使用的硬件设备是**Intel Intel（R） Xeon（R） CPU E5-2680 v4 2.40GHz和NVIDIA GeForce RTX 3060（12G）。PyTorch 1.9和Python 3.6用于实现所提出的网络。**对于所有实验，输入图像调整为224 ×224，批次大小设置为24，GlaS除外，MoNuSeg在参考文献之后设置为4[[17][32]]。除非另有说明，否则我们使用 ImageNet 上的 Conformer 预训练权重来初始化网络。在训练阶段，采用动量参数为0.9、权重衰减为1e−4的随机梯度下降法对模型进行优化。对于所有实验，仅应用简单的数据增强（例如，随机翻转和旋转）来增加数据多样性，以增强模型的泛化能力。计算骰子损失和二进制交叉熵损失以优化反向传播模型。

值得指出的是，Synapse 和 ACDC 数据集是 3-D 体积，以逐个切片的方式进行训练，最终输出由 2-D 切片重建以进行 3-D 预测。

4.3 与现有技术的比较

为了验证所提出的FFUNet的整体分割性能，我们对Synapse多器官分割数据集进行了主要实验，并与现有技术进行了比较，特别是TransUNet [15]，UCTransNet [17]和SwinUNet [14]的方法。结果如表[3]所示，其中最佳结果以粗体显示。表[3]显示，我们的FFUNet在DSC 80.63%和HD 18.15毫米下实现了最佳性能。与TransUNet [15]、UCTransNet [17]和SwinUNet [14]相比，尽管所提出的方法在DSC评估指标上仅略高于现有技术，但在HD方面增加了[13.5]毫米，这表明FFUNet可以改善医学图像分割任务中的边缘预测。

继SwinUNet [14]之后，一个直观的解决方案是简单地使用具有CNN和变压器分支的对称编码器和解码器进行全分辨率预测。这就是FFUNet-trans设计背后的原则，与TransUNet相比，FFUNet-trans实现了有竞争力的性能[15]。然而，FFUNet-trans的参数量几乎是FFUNet的两倍，而其性能弱于FFUNet。该结果表明解码器中的transformer是一个负担;除了增加网络参数的数量外，它并没有带来任何分段性能的改进。因此，我们采用没有transformer分支的解码器作为最终设计。另一方面，我们使用 Ref. [47] 提供的发布代码来实现 U-Net [[2]]，实验结果也如表3 所示。

表[3]还显示，在最近的技术中，胰腺分割通常得分最低，甚至比U-Net [2]更差（例如，TransUNet [15]和SwinUNet [14]）。但拟议的FFUNet在胰腺分割方面有显着改善（与SwinUNet相比，DSC约为7%）。特别是，与SwinUNet相比，具有双分支（即FFUNet-trans）的编码器产生近8%的DSC，甚至优于FFUNet。这是由于胰腺具有长而扁平的形状，这对于纯基于CNN，纯变压器或混合CNN变压器的简单融合方式难以分割胰腺的精细形状。基于Conformer[9]模块，FFUNet利用FCU逐步融合CNN和变压器分支生成的特征图。由于全局自注意力机制，Transformer可以进行远距离建模，但定位能力有限，而CNN具有很强的获取低级线索的能力，这对于分割任务至关重要。因此，当变压器分支保留在解码器中时，FFUNet-trans获得了更好的胰腺分割，并且优于所提出的FFUNet。四种方法的可视化分割结果如图[6]所示。它揭示了我们的FFUNet产生更好的密集预测，这些预测比其他预测更接近地面真相。更具体地说，FFUNet的胰腺分割在四种情况下实现了最佳性能，特别是图[6]所示的第三行和第四行的分割结果，这与上述分析一致。

我们还对ACDC数据集进行了一系列比较实验，定量结果总结在表[4]中。结果表明，FFUNet仍然能够获得优异的性能，平均Dice得分为90.70%，证明了FFUNet的有效性。

4.4 消融研究

为了彻底研究每个组件的影响并验证不同设置下的性能，对Synapse数据集进行了一系列消融研究。具体来说，FFM的影响，前跳跃连接特征图si-1、FAS 和跳跃连接数。

4.4.1 FFM的影响

如[第3]节所述，开发FFM是为了缩小编码器和相应解码器级之间的差距。我们采用FFM模块来有效地融合特征，而不是逐元素添加或通道级串联。为了探索FFM的有效性，我们分别在Synapse数据集的融合阶段应用了逐元素加法（表示为FFUNet-add）和通道级串联（表示为FFUNet-cat）。结果总结在表[5]中，表明无论是应用逐元素加法还是使用逐通道级串联，性能损失都相对较大，例如*，*使用FFUNet-add的DSC从80.63%急剧下降到74.84%。但如表[5]所示，胰腺分割的性能分别达到58.50%和57.78%，超过了近期优秀的网络SwinUNet（获得56.58%）。这是由于我们使用的主干（即Conformer[[9]），它将CNN与视觉转换器相结合，以提取局部特征并捕获全局上下文。总之，FFM在我们的模型中是必不可少的。

4.4.2 前跳跃连接特征图si-1的影响

前跳跃连接功能图si-1在最初的U-Net [[2](https://ietresearch.onlinelibrary.wiley.com/doi/10.1049/sil2.12114#sil212114-bib-0002)]设计中没有使用。在这项工作中，使用的目的在融合阶段就是利用它提供的详细特征来引导特征融合，达到缓解语义鸿沟的目的。为了评估效果作为COG的输入，我们对“FFUNet（无预跳过）”版本进行消融实验;结果如表[6]所示。结果发现，前跳跃连接特征图的配置导致性能提升了 1.45% DSC。

4.4.3 FAS的影响

本工作采用FAS来细化编码器Si到Ai的重要特征。先前的消融实验表明，FFM在我们的模型中是必不可少的。然而，还需要确定FAS是否对FFM不可或缺。为了证明FAS的有效性，我们将其从FFUNet中删除，表示为FFUNet（w/o FAS）。如表[7]所示，与原始 FFUNet 相比，没有 FAS 的模型在 Synapse 数据集上略有下降。具体来说，DSC从80.63%降低到80.16%

4.4.4 跳跃连接数

与TransUNet [15]和SwinUNet [14]不同，我们的FFUNet的跳跃连接集成在1/2，1/4，1/8和1/[16](https://ietresearch.onlinelibrary.wiley.com/doi/10.1049/sil2.12114#sil212114-bib-0015)分辨率的四个位置。在U-Net形状的网络中，跳跃连接可以通过融合编码器级提供的低级线索来增强更精细的分割细节。与前两个出色的网络类似，我们探索了通过将跳跃连接数分别设置为 0、1、2、3 和 4 来验证 FFUNet 中不同跳跃连接的影响。例如，仅在 1/16 的位置添加跳过连接表示为“skip-1”，而“2”的数量是指在 1/8 和 1/16 分辨率比例（表示为“skip-2”）的位置添加跳跃连接。所有实验结果如图[7]所示，通过融合所有四个跳跃连接到FFM来获得最佳DSC。显然，分割性能随着跳跃连接的增加而提高，但并非所有器官都具有相同的优势。例如，当跳跃连接从 0 增加到 4 时，肝脏分割仅改善约 6%，而主动脉和胆囊增加超过 30%。结果是由较大的器官（例如肝脏）引起的，即使没有跳跃连接，也可以在解码器阶段保留低级细节，在某种程度上。但是，小物体（例如主动脉和胆囊）需要使用跳跃连接来恢复特征细节。此外，与TransUNet的结果相比[15]，FFUNet中拟议的FFM获得了更多的DSC分数。

4.5 泛化到其他数据集

为了进一步揭示FFUNet的泛化和鲁棒性能力，我们对其他三个数据集进行了各种实验，包括ISIC-2017，GlaS和MoNuSeg。FFUNet的持续改进超越了现有技术，这与Synapse和ACDC数据集的先前性能相似。

4.5.1 对ISIC-2017的概括

在表[8]中，我们将FFUNet与三种艺术方法和前3名ISIC-2017皮肤病变分割挑战记录进行了比较。请注意，Jaccard 指数（JAC）是黄金评估指标，所有参与者都根据该指标进行排名。这些关于ISIC-2017挑战的报告结果可以在一定程度上反映皮肤病变分割任务的最新表现。就JAC而言，我们的方法略好于ISIC-2017皮肤病变分类挑战排行榜中的前1名。

4.5.2 推广到GlaS和MoNuSeg

继UCTransNet [17]之后，我们使用Dice系数和IoU作为评估指标来评估FFUNet在GlaS和MoNuSeg数据集上的性能。FFUNet-nopre表示不使用任何预先训练的权重来训练FFUNet。表[9]的实验结果表明，所提方法的泛化能力较好。具体来说，在GlaS数据集上，FFUNet在Dice和IoU方面分别获得了1.24%和1.76%的改善。另一方面，与UCTransNet相比，MoNuSeg数据集上实现了有竞争力的性能，UCTransNet是从头开始训练的，不使用预训练。我们还在图[8]中可视化了 FFUNet 和其他最先进方法的分割结果。

4.6 讨论

在Conformer模块中，我们利用卷积运算符来提取局部特征和自我注意机制来捕获全局上下文。为了减轻由于降采样操作而导致编码器和解码器跳跃连接之间的差距，提出了FFM。FFM的可变形卷积可以根据COG提供的偏移调整其卷积样本位置。如第4.1.1节所述，FFM与其他两种方法相比，性能最佳。由于所提方法的输入是二维的，而大部分医学图像数据是三维的，我们将在未来的研究中探索FFUNet在三维医学图像分割中的应用。

五、结论

医学图像分割是医疗保健系统发展的重要先决条件，尤其是疾病诊断和治疗计划。在本文中，我们介绍了一种新的混合架构设计，该设计由基于Conformer模块的双分支编码器组成，该编码器将能够提取局部特征并捕获全局上下文;基于CNN的解码器，具有高效的FFM，可学习以下可变形卷积操作的偏移，以减轻编码器和相应解码器之间的特征差距;并跳过当前阶段和上一阶段提供的连接。在Synapse和ACDC数据集上进行的大量实验表明，与各种竞争方法相比，FFUNet具有出色的性能。为了进一步评估泛化能力，在ISIC-2017、GlaS和MoNuSeg数据集上进行了一系列分割实验，结果表明了一致的改进。综上所述，FFUNet具有比最先进的方法更好的分割性能。

参考文献

1. Shelhamer, E., Long, J., Darrell, T.: Fully convolutional networks for semantic segmentation. IEEE Trans. Pattern Anal. Mach. Intell. 39(4), 640–651 (2017)

2. Ronneberger, O., Fischer, P., Brox, T.: U‐net: convolutional networks for biomedical image segmentation. In: Medical Image Computing and ComputerAssisted Intervention (MICCAI), ser. LNCS, vol. 9351, pp.234–241. Springer (2015)

3. Isensee, F., et al.: nnu‐net: a self‐configuring method for deep learning‐ based biomedical image segmentation. Nat. Methods. 18(2), 203–211 (2021)

4. Dosovitskiy, A., et al.: An image is worth 16x16 words: transformers for image recognition at scale. arXiv:2010.11929 (2020). [http://arxiv.org/](http://arxiv.org/) abs/2010.11929

5. Xiao, X., et al.: Weighted res‐unet for high‐quality retina vessel segmentation. In: 2018 9th International Conference on Information Technology in Medicine and Education (ITME), pp.327–331 (2018)

6. Ibtehaz, N., Rahman, M.S.: MultiResUNet : rethinking the U‐Net architecture for multimodal biomedical image segmentation. Neural Network.121, 74–87 (2020). [https://doi.org/10.1016/j.neunet.2019.08.025](https://doi.org/10.1016/j.neunet.2019.08.025)

7. Zhou, Z., et al.: Unet++: a nestedu‐net architecture for medical image segmentation, pp. 3–11. Springer Verlag (2018)

8. Huang, H., et al.: Unet 3+: a full‐scale connected unet for medical image segmentation. arXiv:2004.08790 (2020). [http://arxiv.org/abs/2004.08790](http://arxiv.org/abs/2004.08790)

9. Peng, Z., et al.: Conformer: local features coupling global representations for visual recognition. arXiv:2105.03889 [cs] (2021). [http://arxiv.org/](http://arxiv.org/) abs/2105.03889

10. Srinivas, A., et al.: Bottleneck transformers for visual recognition.arXiv:2101.11605 (2021). [http://arxiv.org/abs/2101.11605](http://arxiv.org/abs/2101.11605)

11. Zhang, Y., et al.: TransFuse: fusing transformers and CNNs for medical image segmentation. arXiv: 2102.08005 (2021). [http://arxiv.org/abs/](http://arxiv.org/abs/) 2102.08005

12. Liu, Z., et al.: Swin transformer: hierarchical vision transformer using shifted windows. arXiv:2103.14030 (2021). [http://arxiv.org/abs/2103](http://arxiv.org/abs/2103).14030

13. Huang, Z., et al.: Shuffle transformer: rethinking spatial shuffle for vision transformer. arXiv:2106.03650 (2021). [http://arxiv.org/abs/2106.03650](http://arxiv.org/abs/2106.03650)

14. Cao, H., et al.: Swin‐Unet: Unet‐like pure transformer for medical image segmentation. arXiv:2105.05537 (2021). [http://arxiv.org/abs/2105](http://arxiv.org/abs/2105).05537

15. Chen, J., et al.: TransUNet: transformers make strong encoders for medical image segmentation. arXiv:2102.04306 (2021). [http://arxiv.org/](http://arxiv.org/) abs/2102.04306

16. Luo, X., et al.: Semi‐supervised medical image segmentation through dual‐ task consistency. In: AAAI Conference on Artificial Intelligence (2021)

你可能感兴趣的:(论文阅读,深度学习,人工智能)

进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
AI如何塑造下一代网络安全防御体系 weishi122 web安全人工智能网络人工智能网络安全威胁检测行为分析漏洞挖掘
AI如何塑造下一代网络安全防御体系随着网络威胁日益复杂化，传统安全措施已难以应对。人工智能(AI)正通过创新解决方案重塑网络安全格局。本文将探讨AI如何推动网络安全革命，并分析实施过程中的关键挑战。日益严峻的威胁形势到2025年，网络犯罪预计将造成全球10.5万亿美元损失。传统防御手段已无法应对快速演变的威胁，这正是AI发挥关键作用的领域。人工智能：新一代数字卫士AI能实时分析海量数据，在威胁发生
深度学习方法生成抓取位姿与6D姿态估计的完整实现 ZPC8210 ROS 深度学习人工智能
如何将GraspNet等深度学习模型与6D姿态估计集成到ROS2和MoveIt中，实现高精度的机器人抓取系统。1.系统架构text[RGB-D传感器]→[物体检测与6D姿态估计]→[GraspNet抓取位姿生成]→[MoveIt运动规划]→[执行抓取]2.环境配置2.1安装依赖bash#安装PyTorch(根据CUDA版本选择)pip3installtorchtorchvisiontorchaud
基于深度学习的目标检测：从基础到实践 Blossom.118 机器学习与人工智能深度学习目标检测人工智能音视频语音识别计算机视觉机器学习
前言目标检测（ObjectDetection）是计算机视觉领域中的一个核心任务，其目标是在图像中定位和识别多个对象的类别和位置。近年来，深度学习技术，尤其是卷积神经网络（CNN），在目标检测任务中取得了显著进展。本文将详细介绍如何使用深度学习技术构建目标检测模型，从理论基础到代码实现，带你一步步掌握目标检测的完整流程。一、目标检测的基本概念（一）目标检测的定义目标检测是指在图像中识别和定位多个对象
【国内超大型智能算力中心建设白皮书 2024】 AI大模型 lose and dream 人工智能开源 git 开源软件 github gitlab 开放原子
文末有福利！智算中心建设通过领先的体系架构设计，以算力基建化为主体、以算法基建化为引领、以服务智件化为依托，以设施绿色化为支撑，从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构（一）总体架构图8智算中心总体架构智能算力中心建设白皮书，重点围绕基础、支撑、功能和目标四大部分，创新性地提出了智算中心总体架构。其中，基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构；
高并发解决方案：SpringBoot+Redis分布式缓存实战 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人高并发解决方案：SpringBoot
SpringBoot缓存技术全解析：Redis+Caffeine二级缓存架构 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot缓存技术全解析：
米信使股票群诈骗真相！郑洪盛国浩盟国一带一路项目就是资金盘不要被骗了！不成功不收费
讲述:郑洪盛国浩盟国慈善投票被骗无法出金真相！套路太深教你该如何避！！骗子引诱人上当方式很简单：先给你一点甜头尝尝，一开始入金能正常提现，也能赚一点，但当投入更多钱时，你发现你的运气开始变差了。所以，荐股类骗局最大的迷惑性是：给受害人一种假象，你是投资亏损的，而不是被骗的！广大市民对此要提高警惕，如果是还没有投资，千万不要抱有侥幸心理，一定要及时远离！一定不要打草惊蛇低碳项目数字体育，人工智能ai
实现大语言模型与应用的无缝对接 meslog 技术分享语言模型 microsoft 人工智能
在当今人工智能快速发展的时代，大语言模型（LLMs）已经成为众多应用的核心驱动力。然而，如何让这些强大的模型与各种数据源和工具进行有效集成，仍然是一个挑战。ModelContextProtocol（MCP）正是为解决这一问题而设计的开放协议，它标准化了应用程序如何向大语言模型提供上下文信息。本文将介绍MCP的基本概念，并通过C#SDK展示如何实现客户端和服务器端的交互。什么是MCP？ModelCo
解决引入TransXNet模块后显存爆炸问题的全面指南 pk_xz123456 算法大数据 python 机器人数据挖掘深度学习
解决引入TransXNet模块后显存爆炸问题的全面指南前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.问题背景与现状分析1.1MF-PSN和TransXNet项目概述MF-PSN（Multi-FeaturePyramidStereoNetwork）是一个基于金字塔特征的多特征立体匹配网络，它通过构建多层次的特征金字塔来处理不同尺度的立体匹配问题
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
现代人工智能综合分类：大模型时代的架构、模态与生态系统司南锤 economics 人工智能分类数据挖掘
目录引言：人工智能的第四次浪潮与新分类的必要性第一节：大型模型范式的基础支柱1.1规模化假说：算力、数据与算法的三位一体1.2“涌现能力”之谜：当“更多”变为“不同”1.3自监督学习（SSL）革命第二节：大型模型的技术分类学2.1Transformer：现代人工智能的架构基石2.2架构分化：一种功能性分类2.3提升效率与规模：专家混合模型（MoE）2.4超越Transformer：下一代架构的探索
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
Sequential Thinking：AI深度思考的新范式及其与CoT、ReAct的对比分析码字的字节人工智能 Sequential CoT ReAct
引言：AI深度思考的演进与SequentialThinking的崛起在人工智能技术快速发展的今天，AI模型的思考能力正经历着从简单应答到深度推理的革命性转变。这一演进过程不仅反映了技术本身的进步，更体现了人类对机器智能认知边界的持续探索。早期的大语言模型虽然能够生成流畅的文本，但在处理复杂问题时往往表现出"浅思考"的局限性——答案可能看似合理，却缺乏严谨的推理过程和系统性考量。例如，2022年的一
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录推荐算法系统系列二算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南更多技术内容总结推荐算法系统系列二算
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
【DL经典回顾】激活函数大汇总（四）（Softmax & Softplus附代码和详细公式）夺命猪头 python 机器学习人工智能神经网络 numpy
激活函数大汇总（四）（Softmax&Softplus附代码和详细公式）更多激活函数见激活函数大汇总列表一、引言欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里，激活函数扮演着不可或缺的角色，它们决定着神经元的输出，并且影响着网络的学习能力与表现力。鉴于激活函数的重要性和多样性，我们将通过几篇文章的形式，本篇详细介绍两种激活函数，旨在帮助读者深入了解各种激活函数的
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
Spring AI 概述与功能简介 drebander AI 编程 spring 人工智能 java
SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
Spring AI从入门到精通：构建智能Spring应用的全面指南 java干货仓库 Spring 八股文汇总大模型 spring 人工智能 java
随着人工智能技术的快速发展，将大语言模型（LLM）与企业应用集成已成为趋势。SpringAI作为Spring官方推出的AI集成框架，为开发者提供了便捷、标准化的方式来构建智能应用。本文将从基础概念到高级应用，全面介绍SpringAI的核心功能与实践技巧。一、SpringAI概述1.1什么是SpringAI？SpringAI是VMware于2023年推出的开源框架，旨在简化大语言模型（LLM）与Sp
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
对话新希望CDO李旭昶：立足核心诉求，积极拥抱人工智能
“转型焕新，希望无限。”整理|王娴编辑|云舒出品｜极新4月12日，在「2024飞书先进生产力峰会|成都站」活动中，新希望首席数字官李旭昶先生做了主题为“转型焕新，希望无限”的分享。上次见他是4个月前，当时我们聊了1个多小时，内容涉及数字化转型、人工智能、管理、技术商业等话题。今天顺着他分享的内容，将这篇对话分享出来。随着信息科技的发展，我国传统企业在过去几年中逐步进行数字化转型，利用先进的科学技术
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

【论文阅读】FFUNet：一种新的特征融合为医学图像分割提供了强大的解码器

摘要

一、引言

二、相关工作

2.1 基于CNN的编码器和解码器方法

2.2 transformer用于医学分割

2.3 跳跃连接

2.4 特征融合网络

三、研究方法

3.1 结构概述

3.2 带两个分支的编码器

3.3 ConvUpBlock

3.4 特征融合模块(FFM)

四、实验

4.1 数据集

4.2 实现细节

4.3 与现有技术的比较

4.4 消融研究

4.5 泛化到其他数据集

五、 结论

参考文献

你可能感兴趣的:(论文阅读,深度学习,人工智能)

五、结论