【Pranet】论文及代码解读——cfsong

  • 模型框架
  1. 【Pranet】论文及代码解读——cfsong_第1张图片整体模型架构

【Pranet】论文及代码解读——cfsong_第2张图片

2、Res2Net50

【Pranet】论文及代码解读——cfsong_第3张图片

Res2Net是在原始的ResNet的基础上加入了一个scale (s = 4)维度,将原始的3×3(通道数是n)滤波器替换成一组有w个通道的3×3滤波器

【Pranet】论文及代码解读——cfsong_第4张图片【Pranet】论文及代码解读——cfsong_第5张图片

3、Paralleled Connection

【Pranet】论文及代码解读——cfsong_第6张图片

该模块包含两部分:一部分是扩大感受野的RFB-like multi-scale module ,

【Pranet】论文及代码解读——cfsong_第7张图片

【Pranet】论文及代码解读——cfsong_第8张图片

【Pranet】论文及代码解读——cfsong_第9张图片

4.反转注意力模块:

【Pranet】论文及代码解读——cfsong_第10张图片【Pranet】论文及代码解读——cfsong_第11张图片

  • 模型训练

【Pranet】论文及代码解读——cfsong_第12张图片

  • 模型测试

【Pranet】论文及代码解读——cfsong_第13张图片

实验结果:

【Pranet】论文及代码解读——cfsong_第14张图片 【Pranet】论文及代码解读——cfsong_第15张图片

5. 模型框架

输入一息肉图像X,X={Tensor:(1,3,352,352)},大小为352*352,3通道;

【Pranet】论文及代码解读——cfsong_第16张图片

【Pranet】论文及代码解读——cfsong_第17张图片 

【Pranet】论文及代码解读——cfsong_第18张图片 

【Pranet】论文及代码解读——cfsong_第19张图片

X~X4作为五个级别特征,其中X2,X3,X4作为高级特征;

【Pranet】论文及代码解读——cfsong_第20张图片

【Pranet】论文及代码解读——cfsong_第21张图片 

X2_rfb,X3_rfb,X4_rfb通过一个并联连接来聚合高级特征:

ra5_feat对应图中Global Map

【Pranet】论文及代码解读——cfsong_第22张图片

ra5_feat={Tensor:(1,1,44,44)},其会作为反向注意模块(Reverse Attention, RA)的输入。

其中,ra5_feat的大小改变,lateral_map_5={Tensor:(1,1,352,352)}作为损失函数的输入。

RA中,

Crop_4={Tensor:(1,1,11,11)}

X={Tensor:(1,1,11,11)}

X={Tensor:(1,2048,11,11)}

【Pranet】论文及代码解读——cfsong_第23张图片

 【Pranet】论文及代码解读——cfsong_第24张图片

,其中X={Tensor:(1,1,11,11)}

lateral_map_4={Tensor:(1,1,352,352)},lateral_map_4会作为损失函数的输入和下一次RA的输入;

循环以上过程,得到 lateral_map_5={Tensor:(1,1,352,352)};

lateral_map_4={Tensor:(1,1,352,352)};

lateral_map_3={Tensor:(1,1,352,352)};

lateral_map_2={Tensor:(1,1,352,352)};作为损失函数的输入。

 6.对比

Ablation Study消融实验

根源于20世纪60年代和70年代的实验心理学领域,其中动物的大脑部分被移除以研究其对其行为的影响。

含义:设立对照组的意思,通过去除某个模块的作用,来证明该模块的必要性,如果消融实验后得到结果不好或者性能大幅下降,说明该模块起到了作用。

在本节中,作者在可见和不可见的数据集上测试PraNet的每个组件,以提供对模型的更深入了解。

首先评估了并行部分解码器(PDD)的重要性。从表4中,作者观察到2号(主干+PPD)优于1号(主干),这清楚地表明并行机制对于提高性能是必要的。请注意,原文的PPD仅适用于部署在高级功能上,大大缩短了训练的时间(请参阅表3)。

第二部分评估了反向注意模块(RA)的重要性。结果列在表4的第一列和第三列。作者观察到No.3改善了CVC-612的主体部分的(No.1)性能,将平均相似系数从0.747增加到0.888,可信度0.735增加到0.912。这些改进表明,引入反向注意模块可以使原文中的模型准确区分真正的息肉组织。

最后评估了前两部分组合的结果。作者测试了No.4(PPD+RA+主干网)的性能。如图所示在表4中,PraNet(第4位)通常优于其他设置(第1-3位)。此外,PraNet在所有测试数据集上的表现都优于之前的四种模型,其中显著改进(>5%),使其成为一个健壮、统一的体系结构有助于推动息肉分割的未来研究。

 7.结论

本文提出了一种新的结构PraNet,用于从结肠镜图像中自动分割息肉。

优点1:准确

大量实验证明在五个具有挑战性的数据集中,PraNet的表现始终大大优于所有最先进的方法(>5%)。此外,PraNet实现了一个高精度的目标(平均相似系数=0.898),无需任何预处理和后续处理。

优点2:灵活

PraNet具有通用性和灵活性,这意味着可以添加更有效的模块,以进一步提高精度。与目前排名靠前的SFA模型相比,PraNet可以实现强大的学习能力,泛化能力强,实时分割效率高。

你可能感兴趣的:(计算机视觉)