数据下载
该集合包含206 个Landsat 7增强型主题映射器(ETM +)1G级场景,显示在以下生物群系中。手动生成的云遮罩用于训练和验证云覆盖评估算法,该算法又用于计算每个场景中云覆盖的百分比。 最初报告为207个Mask,但错误地计算了一个。
来自此数据集的102个场景用于Foga,Scaramuzza等人中描述的云验证研究中
[Foga, S., Scaramuzza, P.L., Guo, S., Zhu, Z., Dilley, R.D., Beckmann, T., Schmidt, G.L., Dwyer, J.L., Hughes, M.J. & Laue, B. (2017). Cloud detection algorithm comparison and validation for operational Landsat data products. Remote Sensing of Environment, 194, 379-390. ](doi: 10.1016/j.rse.2017.03.026.)
每个文件包含.TIF格式的1级数据带文件、元数据文件(MTL.txt)和.TIF格式的手动掩码。
每个手动掩码中的位解释如下:
Value | Interpretation |
---|---|
0 | Fill |
64 | Cloud Shadow |
128 | Clear |
192 | Thin Cloud |
255 | Cloud |
数据下载
该集合包含96个Landsat 8操作性陆地成像仪(OLI)热红外传感器(TIRS)地形校正(Level-1T)场景,显示在以下生物群系中。手动生成的云遮罩用于验证云覆盖评估算法,该算法又用于计算每个场景中云覆盖的百分比。
每个文件都包含.TIF格式的Landsat 8 Level-1数据带文件,质量带.TIF文件,元数据文件(MTL.txt)和.img(ENVI)格式的手动掩码。
CCA:cloud cover assessment (CCA)
近似云状态列使用以下指南表示每个场景的估计云百分比:
场景云量等级 | 条件 |
---|---|
Clear | 低于35% |
Mid Cloud | 35%-65% |
Cloudy | 高于65% |
每个手动掩码中的位解释如下: | |
Value | Interpretation |
– | – |
0 | Fill |
64 | Cloud Shadow |
128 | Clear |
192 | Thin Cloud |
255 | Cloud |
数据下载
这些场景的整个图像被裁剪成多个384 384碎片,适用于基于深度学习的语义分割算法。每个碎片具有4个相应的光谱通道,其为红色(带4),绿色(带3),蓝色(带2)和近红外(带5)。与其他计算机视觉图像不同,这些通道不会组合在一起。相反,它们对应于目录中。
该数据集包含38个Landsat 8场景图像及其手动提取的像素级地面真相,用于进行云检测。
这些场景的整个图像被裁剪为多个384384个补丁,以适合于基于深度学习的语义分割算法。有用于训练的8400补丁和用于测试的9201补丁。每个贴片具有4个对应的光谱通道,分别是红色(波段4),绿色(波段3),蓝色(波段2)和近红外(波段5)。与其他计算机视觉图像不同,这些通道不会合并在一起。相反,它们位于其对应目录中。
下载地址:
百度网盘-密码rbwb
Google Drive
其中包括108个GF-1宽视野(WFV)2A级场景及其参考云和云阴影遮罩。利用这些数据集对MFC算法在GF-1wfv云和云影检测中的性能进行了评价。全球分布的验证图像采集于2013年5月至2016年8月。参考遮罩是由经验丰富的用户目测后手工绘制云/云影边界得到的。
场景在中提供。焦油.gz格式,以及.tif fromat中的掩码,其中每个像素值表示:
Value | Interpretation |
---|---|
0 | Fill |
1 | Clear |
128 | Cloud Shadow |
255 | Cloud |
数据下载
该数据集包含513个1022 × 1022像素子场景的云遮罩,分辨率为20米,随机采样自2018年1c级Sentinel-2存档。这个数据集的设计遵循了一些关于云遮蔽的观察
不幸的是,云屏蔽是一项固有的模糊任务。当被构建为一个二元分割任务时,一个注释者必须决定如何区分云和清晰,他们的定义和另一个注释者的定义之间的差异是不可避免的。我们使用我们的校准流程来确保两个注释器尽可能相似,并且我们的决定尽可能一致。然而,错误仍然存在于整个数据集。其中一些是可以估计的,而另一些是已知的,但不一定可以解释。在本节中,我们首先概述一些不容易量化的已知问题,然后,我们使用一些统计指标来量化注释者之间的协议级别。
数据下载
论文出处
数据集为 38 个 Sentinel-2 场景提供了参考云掩码数据集。这些参考掩模是使用ALCD工具创建的,该工具由Louis Baetens开发,在CESBIO / CNES的Olivier Hagolle的指导下。它们的创建是为了验证MAJA软件生成的云掩码.
空间分辨率为60m
说明 每个场景目录的名称是相应 Sentinel-2 L1C 产品的名称。
在场景目录中,可以找到三个子目录。
Classification/classification_map.tif
主产品,即分类场景。有7个类型可供选择。每个都用不同的整数表示。
Classification/confidence_enhanced.tif
增强的分类置信度图。这些值介于 0 和 255 之间(以 1 位编码)。
对于每个像素,原始置信度图是多数类的投票比例,因为分类图是通过随机森林算法创建的。
中位数过滤器已应用于此置信度图。最后,该值保存在 1 位上,导致值介于 0 和 255 之间。
Classification/contours.png
分类地图中类的等值线,叠加在场景中。颜色代码取决于每个类别。
绿色:低云和高云。黄色:云影。蓝色:水。紫色:雪。
Classification/used_parameters.json
用于对场景进行分类的参数。它包括磁贴代码、模糊和清晰的日期,以及他们的产品参考。
Samples/
此目录包含所有 shapefile,每个类一个
Statistics/k_fold_summary.json
现场10倍交叉验证的结果。
按“metrics_names”中给出的顺序计算 5 个指标。“all_metrics”是 10 个折叠的列表,每个折叠的 5 个指标按正确的顺序排列。“均值”和“stds”是 10 倍的均值和标准差。
数据下载
论文出处
GSFC云参考数据是通过NASA戈达德航天飞行中心(GSFC)收集的(Skakun等人,2021)。该地区非常不均匀,主要土地覆盖类别为森林(约52%)和不透水表面(31%),其中有自然植被斑块和耕地(总计17%)(图3)。NASA GSFC还有一个AERONET站(Holben等人,1998年),提供气溶胶光学厚度(AOT)和水蒸汽。2017年至2019年间,使用带有鱼眼镜头的智能手机摄像头采集了地面天空图像。这些数据是在陆地卫星8号和哨兵2号天桥期间手动收集的。收集了6个陆地卫星8和28个哨兵-2场景的参考数据。目的是捕捉各种云层条件和季节变化。将卫星图像标记为云、薄云(半透明)、阴影和透明类(图3)。由于云的确切边界存在很大的不确定性,尤其是在Sentinel-2图像上,云边界内的区域被排除在参考数据之外(Skakun等人,2021)。为了便于标记过程,Sentinel-2和Landsat 8图像以各种光谱组合呈现,包括真彩色(红-绿-蓝)和假彩色(近红外-红-绿,SWIR1-近红外-红),并使用卷云带(1.38μm)。Skakun等人(2021)对GSFC数据集进行了详细描述。
数据下载
论文出处
“S2 Hollstein数据集”是一个人工标记的哨兵2A云光谱数据库(Hollstein等人,2016)。通过不同的光谱工具,选择像素并将其分为以下六类之一(图4):云(不透明云)、卷云(卷云、半透明云和蒸汽轨迹)、雪(雪和冰)、阴影(来自云、卷云、山脉、建筑物等的阴影)、水(湖泊、河流、海洋)和晴空(其他剩余区域)。光谱工具包括Sentinel-2图像的假彩色合成、图像增强和光谱的图形可视化。其目的是创建具有均衡像素数的高度异构类。共有59个Sentinel-2场景和1593911个参考(标记)像素。
空间分辨率为20m
我们的数据集总共由N = 5647725像素组成。像素信息保存在 HDF5 文件的不同表中。相对于 Sentinel-2 的空间和光谱分辨率:
PixBox的总体思想是对像素分类质量的定量评估,这是自动化算法/程序的结果。像素分类定义为为图像像素分配一定数量的属性,例如云,晴朗的天空,水,土地,内陆水,洪水,雪等。此类像素分类属性通常用于进一步指导更高级别的处理。
数据下载
PixBox-S2-CMIX数据集被用作2019年在委员会地球观测卫星(CEOS)校准与验证工作组(WGCV)内进行的第一个云掩码相互比较eXercise(CMIX)中的验证参考。PixBox-S2-CMIX像素集合在CMIX之前就已经存在,并且已经在2018年进行了。
PixBox-S2-CMIX 数据集是一个像素集合,包含从 29 个 Sentinel-2 A & B Level 1C 产品中手动收集的 17,351 个像素。数据集在空间、时间和主题上分布良好。
PixBox-S2-CMIX 数据集由两个主要的 ZIP 文件组成,一个保存像素集合和描述,另一个包含所有使用的 Sentinel-2 L1C 数据。数据集的结构如下:
此文件包含所有收集的 CSV 格式的像素信息。所有收集的类都存储为整数值。类别的描述和类名的整数的定义在附加描述文件中给出。
此文件提供了类别和类的清晰描述。它可用于将存储在 CSV 中的类 ID 号转换为类字符串。此外,它还将 CSV 中给出的卫星产品 ID 链接到 Sentinel-2 L1C 产品名称。
数据下载
PixBox-L8-CMIX数据集被用作2019年在委员会地球观测卫星(CEOS)校准与验证工作组(WGCV)内进行的第一个云掩码相互比较eXercise(CMIX)中的验证参考。PixBox-L8-CMIX像素集合在CMIX之前就已经存在,并且已经在2015年进行了。
PixBox-L8-CMIX 数据集是一个像素集合,包含从 11 个 Landsat 8 Level 1 产品中手动收集的 18,830 个像素。数据集在时间上分布良好。在空间上,它主要集中在沿海地区,主要是在欧洲。从主题上讲,它侧重于沿海地区,但仍然代表陆地和水面。
PixBox-L8-CMIX 数据集由两个主要的 ZIP 文件组成,一个包含像素集合和描述,另一个包含所有使用的 Landsat 8 L1 数据。数据集的结构如下:
收集的要素(CSV 文件)。
所有类别和类的说明,包括与所使用的Landsat 8 L1产品的链接。
11 个压缩 Landsat 8 1 级产品[1],用于生成数据集。
此文件包含所有收集的 CSV 格式的像素信息。所有收集的类都存储为整数值。类别的描述和类名的整数的定义在附加描述文件中给出。
此文件提供了类别和类的清晰描述。它可用于将存储在 CSV 中的类 ID 号转换为类字符串。此外,它还将 CSV 中给出的卫星产品 ID 链接到 Sentinel-2 L1C 产品名称。11 个采用 ZIP 格式的 Landsat 8 L1 产品。