第一次写东西。
本文的工作:翻译(多数是机器翻译)一下官网的介绍,帮助自己理清一下ISPRS数据的内容
关键词:ISPRS RS 数据集 遥感 语义分割 土地分类 深度学习 DL DeepLearning ML 人工智能
若有侵权,联系俺,立即删(为啥删?穷且保命;[email protected]王大白菜)
https://www.isprs.org/education/benchmarks/UrbanSemLab/default.aspx
https://blog.csdn.net/m0_56881410/article/details/125942996
https://www2.isprs.org/media/komfssn5/complexscenes_revision_v4.pdf (官网的文件,En)
验证码是图片格式,需要自己输入。(可能需要你会点别的东西才能看见网页,你懂的!)
https://www.isprs.org/education/benchmarks/UrbanSemLab/default.aspx
数据集大小:≈17GB
Vaihingen/images:包含图像数据文件(name.tif,其中name是本文中使用的图像标识符,例如图像10040082的10040082.tif)和包含方向参数的文件(daporo.dat、daporp.dat)
Vaihingen/ALS:包含las格式的ALS数据,每个条带有一个名为Vaihingen_Strip_NN.LAS的las文件,其中NN是两位数的条带编号。
Vaihingen/DSM:包含作为 Geo-TIFF 文件的数字表面模型,每个(浮点)高度值具有 32 位。来自 ALS 的 DSM 名为DSM_25cm_ALS.tif,而来自匹配的 DSM 名为DSM_09cm_matching.tif。此外,还有两个世界文件DSM_25cm_ALS.tfw 和 DSM_09cm_matching.tfw,分别包含地理配准。
Vaihingen/Ortho:包含真正的正射影像图像作为 8 位 RGB GeoTIFF 文件,名为 TOP_Mosaic_09cm.tif。世界文件是TOP_Mosaic_09cm.tfw。
数据集大小:≈5.5GB
Toronto/images:包含图像数据文件(name.tif,其中 name 是本文中使用的图像标识符,例如 03947.tif 表示图像 03947)和包含方向参数的文件(daporo.dat、daporp.dat)。
Toronto/ALS:包含 las 格式的 ALS 数据。每个条带有一个名为 Toronto_Strip_NN.LAS 的 las 文件,其中 NN 是两位数的条带编号。
Toronto/DSM:包含数字表面模型作为 Geo-TIFF 文件,每个(浮动)高度值 32 位。有一个名为 Toronto_DSM_25cm_ALS.tif 的 Geo-TIFF 文件,此外还有一个包含地理配准的 World File Toronto_DSM_25cm_ALS.tfw。
城市目标检测:
参与者可以选择检测单个对象类,也可以尝试同时提取多个对象类,例如从上下文信息中受益,即包含在复杂城市场景中对象相互排列的信息,例如本项目中分布的那些。
参考数据可用于各种对象类。
在城市分类中通常识别的对象类包括建筑物、道路、树木、低植被/草地和人工地面。
如果使用非常高分辨率的数据(例如本项目中的数据),则此列表有时会通过汽车进行增强。(由于汽车会导致道路分割出现歧义),由于这样的定义对于评估道路提取的结果没有用处,因此在本项目中,将人工地面分为道路和道路以外的人造地面。
它由三个测试区域组成,可为各种对象类提供参考数据(黄色区域)和一个用于道路提取的“道路”(蓝色区域):
1区域:该测试区域位于Vaihingen市中心。它的特点是密集的发展,由形状相当复杂的历史建筑组成,但也有一些树木。
2区域:该区域的特征是一些被树木包围的高层住宅建筑。
3区域:“住宅区”:这是一个纯粹的住宅区,拥有小型独立房屋(大别野)。
Roads:用于道路提取。
该数据集包含 33 个影像(大小不同),每个斑块由从较大的 TOP 影像中提取的真正射影像 (TOP) 组成,。有关原始输入数据的更多信息,请参阅对象检测和3D重建基准的数据描述。
地面采样距离为9厘米。DSM是通过与Trimble Inpho 5.3软件匹配的密集图像生成的,并且使用Trimble Inpho Orthovista生成真正射影像。为了避免在真正射影像和DSM中没有数据(“孔”)的区域(“孔”),从真正射影像的中心部分选择了斑块,而在边界则没有。TOP和DSM的剩余(非常小)孔被插值。
真正射影像是带有三个波段的8位TIFF文件;TIFF文件的三个RGB频段对应于相机传递的近红外,红色和绿色带。DSM是带有一个波段的TIFF文件;灰度(对应于DSM高度)被编码为32位浮点值。真正射影像和DSM在同一网格上定义,因此无需考虑处理中的地理编码信息。
只有部分地物有标签。其余场景的地物标签将保持不到发行,并与基准测试组织者一起使用,以评估提交的结果。
数字航空图像和方向参数(Digital Aerial Images and Orientation Parameters):图像是具有8 cm地面分辨率的InterGraph/Zi DMC块的一部分。每个区域都可以在多个条带中可见。方向参数与图像一起发布。
机载Laserscanner数据:测试区域被完全用Leica ALS50系统捕获的10条条覆盖。在单个带中,平均点密度为4分/m2。除原始点云外,还提供了数字表面模型(DSM)。
DSM数据
单个路径的概述(带有.tif扩展)。TOP数据:正射影像。DSM:DSM的文件名。NCOL,NROW:列和行的数量。GT:包含地面真相的文件名(如果没有提供给参与者的空,则由基准组织者使用以评估结果)
该数据集覆盖了加拿大多伦多市中部地区约1.45 km2的面积,该区域由Microsoft Vexcel的Ultracam-D(UCD)摄像头和Optech的空中Laserscanner(Altm-Orion M)捕获。这些图像的接地分辨率为15厘米,而Laserscanner提供了6分/m2。“多伦多市中心”数据包含北美现代大型城市的代表场景特征,其中包括低层和高级建筑,具有各种各样的屋顶结构以及街道和道路特征。测试数据可以分为三个测试站点:“区域4”,“ 5区”和“整个区域”。“区域4”和“区域5”的区域应用于测试物体提取和建筑重建技术,而整个测试区域可用于道路检测。
4区域:该区域包含低和高建筑,显示了屋顶结构和屋顶家具的各种形状复杂性。现场还包含不同的城市物体,包括汽车,树木,街头家具,道路和停车场。
5区域:该区域代表了北美现代大型城市中高层建筑集群的一个典型例子。该场景包含由高建筑物铸造的阴影,在这些阴影下,可以找到各种类型的城市物体(例如汽车,街头家具和道路)。
该数据集包含 38 个斑块(大小相同),每个斑块都由从较大的真正射影像 中提取的真正射影像 (TOP) 组成。
TOP和DSM的地面分辨率为5 cm。DSM是通过与Trimble Inpho 5.6软件匹配的密集图像生成的,并且使用Trimble Inpho Orthovista生成TOP图像。为了避免在TOP图像和DSM中没有数据(“孔”)的区域(“孔”),从TOP图像图像的中心部分选择了斑块,而在边界则没有。TOP图像和DSM的剩余(非常小)孔被插值。
TOP图像作为在不同频道组合中的TIFF文件时出现的,每个频道的光谱分辨率为8位:
IRRG: 3 channels (IR-R-G)
RGB: 3 channels (R-G-B)
RGBIR: 4 channels (R-G-B-IR)
这样,参与者可以方便地选择所需的数据。
DSM是带有一个频段的TIFF文件;灰度(对应于DSM高度)被编码为32bits。顶部和DSM定义在同一图(UTM WGS84)上。每个斑块都带有一个仿射转换文件((tiff world file),以便根据需要将图像重新分配到更大的图像。
除了DSM外,我们还提供了所谓的归一化DSM,也就是说,在接地过滤后,每个像素去除地面高度,从而导致高度在地形上方的高度表示。这些数据是使用一些全自动滤波工作流进行的,而无需手动质量控制。因此,我们不保证这里无错误的数据,这仅适用于研究人员使用“绝对DSM( absolute DSM)”以外的高度数据。在下载文件夹中,您可以找到相应的Zip-File。如果您打开,则在使用数据之前找到应该阅读的readme.txt。还包含一个脚本,因此参与者可能希望对其进行调整。但是,我们不提供支持。
某个路径的概述(带有.tif文件后缀,所有图像均具有6000 x 6000像素的尺寸)。
正射影像RGBIR的文件名:真实的正射图像,带有四个通道红色,绿色,蓝色,红外线;
正射影像IRRG:真正的正射影像,带有三个通道红外,红色,绿色;
正射影像RGB:真正的正向方,带有三个通道红色,绿色,蓝色;
DSM:数字表面模型;
GT:地面真相标签(如果没有提供给参与者的空白,则由基准组织者使用以评估结果)。请注意,相邻的图像图块之间没有差距可以启用具有上下文,更好地计算归一化DSM的模型等。
第一个数字始终表示行(上到底部,即北到南)和第二个数字(列为列)(从左到右,即西到东)。例如,5_12的直接邻居为4_12(上),6_12(下图),5_11(左)和5_13(右)。所有图像均带有相应的.tfw文件,可在UTM WGS84坐标中提供地理参考。
尽管Vaihingen是一个相对较小的村庄,那里有许多独立的建筑物和小型多层故事建筑,但Potsdam展示了一个典型的历史城市,拥有大型的建筑区,狭窄的街道,狭窄的街道和密集的定居点结构。
每个数据集已手动分为六个最常见的土地覆盖类别(land cover classes)。我们为大约一半的图像提供了分类数据(标签图像),而其余场景的基础真相将保持不发行,并与基准测试组织者一起使用,以评估提交的结果。参与者应使用所有具有地面真相的数据进行培训或内部评估其方法。
6个类别对应的RGB值:
PS:6.混乱/背景类别包括水体(以河流的一部分形式出现在两张图像中)和其他与其他物体截然不同的物体(例如,罐子,网球场,游泳池),通常对语义对象不感兴趣但是,在城市场景中的分类,但是请注意,参与者必须提交所有类(包括混乱/背景类)的标签。例如,不可能仅提交类别构建的分类结果。
略(只是用数据,评估指标很传统)
有用了再补充吧。
https://www.isprs.org/education/benchmarks/UrbanSemLab/results/default.aspx