遥感图像场景分类数据集

遥感图像场景分类数据集

1. 简介

数据集包含 45 个典型场景类别,训练集包含 177409 张图像,验证集包含 19712 张图像,初赛测试集包含 89233 张图像,详细的类别名称和对应的类别 id 见 ClsName2id.txt。

training set: 177409 jpgs
validation set: 19712 jpgs
class id: 45

2. 数据集结构

场景分类数据集的文件夹结构如下:

  - train
    - 旱地
        - dry-field_xxxxx.jpg
        - dry-field_xxxxx.jpg
        - ...
    - 水田
        - paddy-field_xxxxx.jpg
        - paddy-field_xxxxx.jpg
        - ...
        
  - val
    - 旱地
        - dry-field_xxxxx.jpg
        - dry-field_xxxxx.jpg
        - ...
    - 水田
        - paddy-field_xxxxx.jpg
        - paddy-field_xxxxx.jpg
        - ...
        
  - test
    - 00001.jpg
    - 00002.jpg
    - ...
    
  - ClsName2id.txt

训练集 (train) 和验证集 (val) 中每个文件夹代表一类,分别存放对应类别的图像。初赛测试集 (test) 中为 89233 张测试图像。

ClsName2id.txt 提供了场景类别中英文名称与 id 的对照,文件格式如下:

中文名称:英文名称:id
旱地:dry-field:1
水田:paddy-field:2
梯田:terraced-field:3
草地:meadow:4
林地:forest:5
商业区:commercial-area:6
油田:oil-field:7
油罐区:storage-tank:8
工厂:works:9
矿区:mine:10
太阳能发电厂:solar-power-plant:11
风力发电站:wind-turbine:12
公园:park:13
游泳池:swimming-pool:14
教堂:church:15
墓地:cemetery:16
棒球场:baseball-field:17
篮球场:basketball-court:18
高尔夫球场:golf-course:19
足球场:soccer-field:20
温室:greenhouse:21
网球场:tennis-court:22
居民区:residential-area:23
岛屿:island:24
河流:river:25
停机坪:apron:26
直升机场:helipad:27
机场跑道:runway:28
桥梁:bridge:29
停车场:parking-lot:30
公路:road:31
路边停车区:roadside-parking-lot:32
转盘:roundabout:33
立交桥:viaduct:34
港口:port:35
铁路:railway:36
火车站:train-station:37
裸地:bare-land:38
沙漠:desert:39
冰岛:ice-land:40
山地:mountain:41
石质地:rock-land:42
稀疏灌木地:sparse-shrub-land:43
海滩:beach:44
湖泊:lake:45

3. 注意事项

  • 分类算法训练可以利用验证集、外部数据,测试集不能参与算法训练。
  • 训练集、验证集和测试集是随机分配的,质量一致。难免有标注问题和检查疏漏,可以对数据进行预处理,可以扩充训练数据,或者通过设计算法解决。
  • 初始版本训练集 residential-area_02938.jpg 图片损坏。

你可能感兴趣的:(remote,sensing,image,processing)