BCNet论文总结

论文:Boundary Constraint Network With Cross LayerFeature Integration for Polyp Segmentation

目录

一、背景和出发点

二、创新点

三、BCNet具体实现

1. 跨层特征集成策略(CFIS)

2. 跨层特征交互模块(ACFIM)

(1)获得F3'

(2)获得F4' 

(3)输出F1

3. 全局特征集成模块(GFIM)

4. 双边边界提取模块(BBEM)


一、背景和出发点

研究背景:大多数现有的基于CNNs的方法进行息肉分割效果往往不理想,作者希望通过增加边界约束,来提高息肉分割的精确度。

出发点:融合跨层上下文信息和利用边缘信息,以提高息肉分割的精确度。

主要工作:1. 跨层特征集成策略(CFIS) 2. 跨层特征交互模块(ACFIM) 3. 全局特征集成模块(GFIM) 4. 双边边界提取模块(BBEM

研究成果:在三个公共数据集上的实验结果表明,所提出的BCNet在有效性和通用性方面都优于七种最先进的竞争方法。

二、创新点

1. 为了准确地分割息肉,考虑到息肉的挑战性特征,作者提出了一种新的深度网络(称为BCNet),重点是跨层特征集成和边界提取。

2. 提出了一种新的跨层特征融合策略(CFIS),该策略由ACFIMGFIM组成。ACFIM自适应地桥接了前三个最高层的上下文信息。GFIM通过全局注意力引导跨层聚合融合的信息。提出的CFIS避免了简单的特征添加或集中带来的缺点,提高了分割性能。

3. 提出了一种新的边界提取模块BBEM。在高级位置特征和边界约束的帮助下,BBEM协同探索浅层的息肉和非息肉信息,并产生更好的分割性能。

4. 在三个公共数据集上进行的大量实验表明,我们的BCNet具有很高的有效性和通用性,并且优于为通用和特定目的设计的最先进的方法。

三、BCNet具体实现

BCNet总体架构如下所示:

BCNet论文总结_第1张图片

RFB:是一种新的特征提取模块。它可以增大特征图的感受野。

参考博客:RFB(Receptive Field Block)。

对于一个输入图像 ,从骨干的卷积块中获得一组输出X_1X_2X_3X_4X_5,将X_2X_3X_4X_5分别送入RFB中,提取其上下文信息\widehat{X}_2\widehat{X}_3\widehat{X}_4\widehat{X}_5

1. 跨层特征集成策略(CFIS

BCNet论文总结_第2张图片

目的:融合前三层的上下文信息 ,获得息肉感知特征。

过程:CFIS获取最高的前三层的上下文信息 \widehat{X}_3\widehat{X}_4\widehat{X}_5作为息肉感知特征 \chi 的输入和输出。首先,将\widehat{X}_3\widehat{X}_4\widehat{X}_5ACFIM融合,分别得到F_1F_2F_3。其次,将F_1F_3分别馈入同一层的两个GFIM中,将输出相加生成 \chi

2. 跨层特征交互模块(ACFIM

BCNet论文总结_第3张图片

目的:通过应用注意力机制,将相邻层之间的上下文信息连接起来,自适应地选择和加强用于息肉分割的重要特征。因此需要获取F_3'(提取前景特征)和F_4'(提取背景特征),并将二者融合。

(1)获得 F_3'

BCNet论文总结_第4张图片

过程:首先,分别通过1×1卷积reshape操作\widehat{X}_3\in \mathbb{R}^{C_3\times H_3\times W_3 } 转换为 Q\in \mathbb{R}^{C'\times (H_3 \cdot W_3)}V_1\in \mathbb{R}^{C_3\times (H_3 \cdot W_3)}Q的通道数由 C_3降为{C}',同时通过1×1卷积reshape操作\widehat{X}_4'\in \mathbb{R}^{C_4\times H_3\times W_3 }转换成K\in \mathbb{R}^{C'\times (H_3\cdot W_3)}。得到Q,V1,K之后,将Q和K相乘再经过softmax处理,将得到的特征图再与V1进行相乘,再经过reshape操作还原回来原形状,与一个可学习的权重参数\alpha相乘,再与\widehat{X}_3相加得到F_3'

对应的算子公式

其中,C'=C_3 / 8 是Q和K的通道维数,C_3 = C_4 = 64,H_3 = H/8 和 W_3 = W/8 分别是X_3的高度和重量。\widehat{X}_4'\widehat{X}_4 的2倍空间上采样,为了与 X_3 进行尺寸匹配。\alpha 是一个可学习的权重参数\tau (\cdot )reshape操作,将特征投影为 C_3\times H_3\times W_3 的大小。δ(·)表示Sigmoid函数,⊗表示矩阵乘法。(\cdot )^T为转置运算。

不难看出,经过以上操作,经过训练最终可以学习到一个利于提取前景特征的权重参数\alpha

(2)获得 F_4' 

BCNet论文总结_第5张图片

过程: 与获取 F_3'类似,分别通过1×1卷积reshape操作\widehat{X}_3\widehat{X}_4' 转化为Q,K,V2,然后Q与K相乘得到的特征图再经过revese操作得到\mathcal{A}\mathcal{A}与V2相乘,再经过reshape操作还原回来与\widehat{X}_3相同的大小,再与一个可学习的权重参数\beta相乘,再与\widehat{X}_4'相加得到F_4'

对应的算子公式

                                                                           \mathcal{A}=E-\delta (Q^T\otimes K)

其中,\beta 是可学习的权重参数,V_2\in \mathbb{R}^{C_4\times (H_3 \cdot W_3)}\tau (\cdot )reshape操作\mathcal{A}=E-\delta (Q^T\otimes K)reverse操作,其中,E是单位矩阵。

(3)输出F_1

目的:可以协同学习重要特征和不重要特征,共同定位息肉预测。

算子公式F_3'F_4'进行相加操作。

Q:什么是上下文信息?

对象场景之间的相互作用信息作为条件来对新目标进行识别、处理。

Q:为什么要对Q与K相乘得到的特征图,进行reverse处理?

reverse操作的作用:得益于reverse操作F_4'更倾向于提取不重要的特征(即背景),与F_3'更侧重于捕获重要特征(即前景)完全不同。

Conclusion

因为ACFIM的目的是获取上下文信息,因此通过获取F_3'(提取前景特征),F_4'(提取背景特征),再融合相加,达到获取上下文信息,协同学习重要特征和不重要特征,共同定位息肉预测的目的。

Difficult Problem:原文中给出的reverse操作的算子公式真的有效吗?

                                                                                        \mathcal{A}=E-\delta (Q^T\otimes K)

一个同等大小的单位矩阵减去Q与K相乘再经过sigmoid得到的特征图,从感官上来看应该不能达到上图的效果吧??这个问题只能等待源码开源了。

3. 全局特征集成模块(GFIM

BCNet论文总结_第6张图片

目的ACFIM模块通过提取上下文信息,完成了对息肉分割位置的定位,但是分割性能不理想,因此为了进一步提高分割性能,引入GFIM提取全局信息

补充:1. GFIM模块根据使用不同池化方式分为GFIM maxGFIM avg。目的是为了提高特征表达。

           2. GFIM模块是通道注意力模块。过程类似SE模块。

过程GFIM模块有两个支路,输入从上到下依次为F1和F3。首先,使用两个3×3卷积来处理每个分支的输入,用于局部调整特征。然后,在较低的分支中使用全局最大池化(GMP)/全局平均池化(GAP),来压缩全局信息,再通过一组全连接层+ReLU全连接层+Sigmoid,最终得到\mathcal{G} \in \mathbb{R}^{C_3\times 1\times 1}。接下来, 上分支卷积所得结果,通过与 \mathcal{G}相乘来细化上分支的局部特征,得到\mathcal{F}_m,最后,再进行一次两个3×3卷积并与\mathcal{F}_m相加,得到\mathcal{X}_{max}。对应的算子公式如下:

其中,\mathcal{M}(\cdot )表示全局最大池化\phi _c(\cdot )表示两次3×3卷积\odot元素乘法\mathcal{F}_m \in \mathbb{R}^{C_3\times H_3\times W_3}\mathcal{X}_{max} \in \mathbb{R}^{C_3\times H_3\times W_3}。同样,GFIMavg的输出\mathcal{X}_{avg} \in \mathbb{R}^{C_3\times H_3\times W_3},将上述步骤中全局最大池化替换为全局平均池化即可得到。

注意:通道注意力向量\mathcal{G}与上分支卷积结果通过点乘得到\mathcal{F}_m,与SE模块类似,通道注意力向量中的每个权重值与对应通道上的feature map相乘。

4. 双边边界提取模块(BBEM

四、DWT与池化运算和膨胀卷积相关性证明

五、DWT、IWT代码实现

六、实验

七、总结

你可能感兴趣的:(注意力机制,BCNet,息肉分割)