【论文浅读】《Contextual Pyramid Attention Network for Building Segmentation in Aerial Imagery》

创新思想:

为了改进航空影像中提取建筑物的效果,文章提出了远程金字塔模型(Contextual Pyramid Attention, CPA),捕获远程依赖项来改进不同大小的建筑分段。

主要原理:

【论文浅读】《Contextual Pyramid Attention Network for Building Segmentation in Aerial Imagery》_第1张图片
CPA是在ResNet中Block 4的基础上再增加的模块,在多个尺度下卷积激活再卷积,产生一个加权输出,该输出被馈送到FPN解码器。

在这里插入图片描述
上下文信息的算子以及整合公式。
在这里插入图片描述
自身信息的算子公式。

主要实验结果:

【论文浅读】《Contextual Pyramid Attention Network for Building Segmentation in Aerial Imagery》_第2张图片
评价指标有IoU和Acc:
IoU(Intersection over Union)重叠度:实际和预测为建筑面积的 交集/并集;
Acc(Accuracy)正确率:正确分类的像素与总像素的比率;

【论文浅读】《Contextual Pyramid Attention Network for Building Segmentation in Aerial Imagery》_第3张图片
左上,右上:原图;
左下:ResNet101-FPN;
右下:ResNet101-FPN + CPA模型;

你可能感兴趣的:(CV)