我对BANet,SeMask的理解

一、 BANet

1.创新点

  • 本文提出了一种双向感知网络(BANet),用于VFR(very fine resolution)城市场景图像的精确语义分割。
  • 与传统的单路径卷积神经网络不同,BANet通过构建两条特征提取路径并由一个特征聚合模块来处理来解决城市场景分割的难题。

2.模型结构

我对BANet,SeMask的理解_第1张图片
特征聚合模块:
我对BANet,SeMask的理解_第2张图片

二、SeMask

1.创新点

  • 是第一个研究添加 semantic context到预训练的transformer backbones对语义分割任务的效果的论文
  • 提出使用一个简单的semantic decoder来聚合来自编码器不同阶段的semantic priors

2.模型结构

我对BANet,SeMask的理解_第3张图片
我对BANet,SeMask的理解_第4张图片
在Swin Transformer层之后添加了一个带有SeMask块的语义层(图b),以捕获编码器网络中的语义上下文。
我对BANet,SeMask的理解_第5张图片

你可能感兴趣的:(2022暑假机器学习,深度学习,人工智能)