遥感影像-语义分割数据集:山体滑坡数据集详细介绍及训练样本处理流程

原始数据集详情

简介:该遥感滑坡数据集由卫星光学图像、滑坡边界的形状文件和数字高程模型组成。该数据集中的所有图像,即770张滑坡图像(红点)和2003张非滑坡图像,都是从2018年5月至8月拍摄的TripleSat卫星图像中截取的,影像分辨率0.8米。对于滑坡实例,我们提供了滑坡图像、滑坡掩码文件和相应的DEM数据。所有数据都经过了仔细的三次检查,以确保其可靠性。

Key Value
卫星类型 TripleSat
覆盖区域 毕节市
场景 未知
分辨率 0.8m
数量 2773张
单张尺寸 不固定
原始影像位深 8位
DEM影像位深 8位
标签图片位深 8位
原始影像通道数 三通道
DEM影像通道数 单通道
标签图片通道数 单通道

标签类别对照表

像素值 类别名(英文) 类别名(中文) RGB
0 非滑坡区域
1 滑坡区域

数据处理部分

大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
有滑坡影像:
遥感影像-语义分割数据集:山体滑坡数据集详细介绍及训练样本处理流程_第1张图片
无滑坡影像:
遥感影像-语义分割数据集:山体滑坡数据集详细介绍及训练样本处理流程_第2张图片

最后可以直接用于训练的数据集结构如下所示

├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

需要原始数据集、预处理后数据集、裁剪后可训练数据集、数据处理完整代码的小伙伴可私信哦!

你可能感兴趣的:(语义分割数据集,深度学习,数据挖掘,计算机视觉,图像处理,人工智能)