遥感影像-语义分割数据集:iSAID数据集详细介绍及训练样本处理流程

原始数据集详情

iSAID是第一个用于航空图像分割的基准数据集。这个大规模且注释密集的数据集包含2806张高分辨率图像中15个类别的655451个对象实例。iSAID的显著特征如下:(a)具有高空间分辨率的大量图像,(b)15个重要且常见的类别,(c)每个类别有大量实例,(d)每个图像有大量标记实例,这可能有助于学习上下文信息,(e)巨大的对象尺度变化,包含小、中、大对象,通常在同一幅图像中,(f)图像中具有不同方向的物体分布不平衡且不均匀,描绘了现实生活中的空中条件,(g)几个外观模糊的小尺寸物体只能通过上下文推理来解决,(h)由专业注释者进行精确的实例级注释,由符合明确定义的指南的专家注释器进行交叉检查和验证。

Key Value
卫星类型 未知
覆盖区域 不确定
场景 城市
分辨率 未知(高分辨率)
数量 训练集:1411,验证集:458
单张尺寸 不固定
原始影像位深 8位
标签图片位深 8位
原始影像通道数 三通道
标签图片通道数 三通道
官网 https://captain-whu.github.io/iSAID/dataset.html

标签类别对照表

像素值 类别名(英文) 类别名(中文) RGB
1 ship 船舶 0, 0, 63
2 storage tank 储罐 0, 63, 63
3 baseball diamond 棒球场 0, 63, 0
4 tennis court 网球场 0, 63, 127
5 basketball court 篮球场 0, 63, 191
6 ground track field 田径场 0, 63, 255
7 bridge 桥梁 0, 127, 63
8 large vehicle 大型车辆 0, 127, 127
9 small vehicle 小型车辆 0, 0, 127
10 helicopter 直升机 0, 0, 191
11 swimming pool 游泳池 0, 0, 255
12 roundabout 环岛 0, 191, 127
13 soccer ball field 足球场 0, 127, 191
14 plane 飞机 0, 127, 255
15 harbor 港口 0, 100, 155

数据处理部分

大家是否有这样的困惑,真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
遥感影像-语义分割数据集:iSAID数据集详细介绍及训练样本处理流程_第1张图片

下面我们就对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:

遥感影像-语义分割数据集:iSAID数据集详细介绍及训练样本处理流程_第2张图片

最后可以直接用于训练的数据集结构如下所示

/path/to/LoveDA
├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

需要原始数据集、已处理数据、裁剪后可训练数据集的小伙伴可私信哦!

你可能感兴趣的:(语义分割数据集,计算机视觉,人工智能,数据分析,数据挖掘,图像处理,深度学习)