论文阅读——RS DINO

RS DINO: A Novel Panoptic Segmentation Algorithm for High Resolution Remote Sensing Images

基于MASKDINO模型,加了两个模块:

论文阅读——RS DINO_第1张图片

BAM:Batch Attention Module

遥感图像切分的时候把一个建筑物整体比如飞机场切分到不同图片中,这样就切分成几块了,这样会使图片特征产生一些裁剪损失。

所以,提出通过计算不同图片patch之间的注意力提取长距离上下文信息,来减小这种损失。

另外dataloader并没有打乱顺序,而是设定为一个预定好的顺序放到dataloader中。

具体如下:

论文阅读——RS DINO_第2张图片

操作起来就是,把一个batch的特征打成一个向量,然后不同batch之间计算注意力,然后再reshape回去。

CAM:Channel Attention Module

一个特征图在通道级别上做注意力,得到注意力分数后和原来的特征图相乘,然后再加上原始特征图,相当于一个残差连接。

实验结果:

论文阅读——RS DINO_第3张图片

论文阅读——RS DINO_第4张图片

你可能感兴趣的:(论文,人工智能)