mmsegmentation自定义新数据集

注册数据集类型

1、mmseg/datasets/中创建数据集类型py文件,指定CLASSES、PALETTE,修改__init__函数参数,更新影像和标注后缀。

2、mmseg/datasets/__init__.py中添加类型,并更新__all__

# add
from .c6 import C6Dataset

3、configs/_base_/datasets/中添加该类型的数据集元数据,更新dataset_type、data_root、crop_size、pipeline等。

数据一般在data目录,结构参考:

├── data
│   ├── my_dataset
│   │   ├── img_dir
│   │   │   ├── train
│   │   │   │   ├── xxx{img_suffix}
│   │   │   │   ├── yyy{img_suffix}
│   │   │   │   ├── zzz{img_suffix}
│   │   │   ├── val
│   │   ├── ann_dir
│   │   │   ├── train
│   │   │   │   ├── xxx{seg_map_suffix}
│   │   │   │   ├── yyy{seg_map_suffix}
│   │   │   │   ├── zzz{seg_map_suffix}
│   │   │   ├── val

一个训练对将由 img_dir/ann_dir 里同样首缀的文件组成。

如果给定 split 参数,只有部分在 img_dir/ann_dir 里的文件会被加载。 我们可以对被包括在 split 文本里的文件指定前缀。

除此以外,一个 split 文本如下所示:

xxx
zzz

只有

data/my_dataset/img_dir/train/xxx{img_suffix}data/my_dataset/img_dir/train/zzz{img_suffix}data/my_dataset/ann_dir/train/xxx{seg_map_suffix}data/my_dataset/ann_dir/train/zzz{seg_map_suffix} 将被加载。

注意:标注是跟图像同样的形状 (H, W),其中的像素值的范围是 [0, num_classes - 1]。 您也可以使用 pillow 的 'P' 模式去创建包含颜色的标注。

参考:

教程 2: 自定义数据集 — MMSegmentation 0.15.0 文档

你可能感兴趣的:(AI/ML/DL)