Focal-UNet

目录

摘要

方法

编码器

Bottleneck

解码器

总结


摘要

由于在Transformer中的Patch划分操作,在分割预测结果中仍然存在着严重的块状和裁剪边缘问题。在这项工作中,我们提出了一种新的u型结构的医学图像分割借助于新引入的焦点调制机制。所提出的架构具有不对称的编码器和解码器深度。由于焦点模块能够聚合局部和全局特征,我们的模型可以同时受益于Transformer的全局感受野和cnn的局部细节特征。这有助于所提出的方法平衡局部和全局特征的使用。

本文的主要贡献为:1)使用焦点模块作为u型架构的基础块2)加大了编码器层的深度,增强U型架构的问题建模能力。

方法

本文提出的网络结构Focal-UNet如下图所示:它由一个编码器,Bottleneck,解码器以及一个跳跃连接组成

Focal-UNet_第1张图片

编码器

 编码器是由三个focal layers组成的,每个focal layer层包括4个focal module(FM)块和一个下采样卷积块,对网络的接受域更大,从输入特征向量中提取出更多可泛化特征的能力更高。更高的接受域有助于网络在训练过程中考虑更多的可泛化特征,这似乎对分割问题有效。此外,这个块的计算效率更高,综上所述,这个FM块似乎很适合用作构建u型架构的基础块。在每一层中增加一个卷积块的目的是减小图像大小并增加通道数量,这在设计u型架构时是很常见的。

Bottleneck

Bottleneck是基于四个FM块构建的,从输入中提取更深层次的特征,并增加网络的容量,以建模更复杂的问题空间。

解码器

解码器的构造类似于编码器部分,主要的区别在于每一层中使用了一个FM块和一个转置卷积进行上采样,并将每一层的通道数量减少为原来的2倍

跳跃连接

U型网络的关键在于跳跃连接,它使得网络同时使用更高和更低级别的特征来构建出所需的输出,我们还在提出的体系结构中使用了类似于U型网络中跳跃连接以促进输入到输出的特征传输,跳跃连接

总结

本文提出了一种新的基于焦点的u型结构的医学图像分割方法。因此,我们的focus - unet模型在Synapse数据集上取得了比最先进的方法更好的结果。此外,我们的实验表明,对于小型训练集,与Swin-UNet相比,所提出的FocalUNet具有出色的性能和泛化能力。

你可能感兴趣的:(医学图像分割论文,深度学习,人工智能,transformer)