建筑物提取 Building Extraction 算法论文

文章目录

  • 建筑物提取


建筑物提取

Building Extraction from Remote Sensing Images with Sparse Token Transformers

深度学习方法在遥感影像建筑物提取方面取得了长足的进步。大多数建筑物提取方法都基于卷积神经网络(CNN)。最近,Transformer为图像中的远距离上下文建模提供了更好的思路,但通常会受到高计算复杂性和内存使用量的影响。在本文中,探讨了使用Transformer进行高效建筑物提取的潜力。设计了一种高效的双路Transformer结构,可以学习Token在空间和通道上的长期依赖性,并在建筑物提取数据集上实现了先进的精度。由于遥感图像中的单个建筑物通常只占图像像素的一部分,因此通过引入一个称为“稀疏Token采样器”的新模块将建筑物表示为其特征空间中的一组“稀疏”特征向量。通过这样的设计,Transformer的计算复杂度可以降低一个数量级。我们将我们的方法称为Sparse Token Transformer (STT)。在武汉大学航空建筑数据集 (WHU) 和 Inria 航空图像数据集 (INRIA) 上进行的实验表明了方法的有效性和高效性。与一些广泛使用的分割方法和一些最先进的建筑物提取方法相比,STT 以较低的时间成本取得了最佳性能。

代码和论文全文请移步Github

你可能感兴趣的:(论文,算法,python,transformer)