使用labelme进行语义分割数据标注

Contents

  • 1. Labelme Install
  • 2. How to use?
    • 1)dataset file
    • 2) Implement
    • 3) labelimg Introduction
    • 4)Configuration
  • 3、json2png


1. Labelme Install

打开Anaconda终端,输入即可安装完成:

pip install labelme -i https://pypi.tuna.tsinghua.edu.cn/simple

2. How to use?

1)dataset file

data-
--images #装有你待标注图像的子文件夹
--labels #等会需要保存标注txt文件的子文件夹
--class.txt #里面保存有你的标注类别

class.txt格式如下:

__ignore__
_background_
dog
cat

每一行代表一个类型的名称,前两行是固定格式__ignore__和_background_都加上,否则后续使用作者提供的转换脚本(转换成PASCAL VOC格式和MS COCO格式)时会报错。从第三行开始就是我们需要分割的目标类别。这里以分割猫狗为例。

2) Implement

使用anaconda终端 ,依次输入:

cd  [data文件夹所在路径]

labelme --labels class.txt #即labelme  --labels  [类别txt文件]

即可用labelimg标注工具打开类别文件

3) labelimg Introduction

使用labelme进行语义分割数据标注_第1张图片Open Dir:待标注图片数据的路径文件夹,即选择images文件夹后即可打开图像进行标注
在这里插入图片描述
打开图像后显示如上图,点击Creat Polygons即可进行多边形标注,使用Edit Polygons可以对标注后的图像进行精细修正。

4)Configuration

使用labelme进行语义分割数据标注_第2张图片

  • 先点击左上角FileChange Output Dir设置标注结果的保存目录,即label文件保存目录可自定义,不然就是默认保存在images文件夹。
  • 建议将Save With Image Data取消掉,默认是选中的。如果选中,会在保存的标注结果中将图像数据也保存在.json文件中(个人觉得没必要,还占空间)。
  • 然后点击界面左侧的Save按钮即可保存标注结果,默认每张图片的标注信息都用一个json文件存储。建议选择Save Automatically,这样不用每次都要自己保存

3、json2png

全部标注后的label文件是json格式,如果需要进行格式转换。
首先给出命令行:

python labelme2voc.py labels voc_data --labels class.txt

labelme2voc.py是下述代码的文件名,一般放在data数据文件中,较为方便运行。
labels是标签文件夹即json保存的文件夹
voc_data是需要保存的文件名,无需提前定义该文件夹,可随便命名
class.txt是上面说明的类别文件
labelme2voc.py代码如下:

from __future__ import print_function

import argparse
import glob
import os
import os.path as osp
import sys

import imgviz
import numpy as np

import labelme


def main():
    parser = argparse.ArgumentParser(
        formatter_class=argparse.ArgumentDefaultsHelpFormatter
    )
    parser.add_argument("input_dir", help="input annotated directory")
    parser.add_argument("output_dir", help="output dataset directory")
    parser.add_argument("--labels", help="labels file", required=True)
    parser.add_argument(
        "--noviz", help="no visualization", action="store_true"
    )
    args = parser.parse_args()

    if osp.exists(args.output_dir):
        print("Output directory already exists:", args.output_dir)
        sys.exit(1)
    os.makedirs(args.output_dir)
    os.makedirs(osp.join(args.output_dir, "JPEGImages"))
    os.makedirs(osp.join(args.output_dir, "SegmentationClass"))
    os.makedirs(osp.join(args.output_dir, "SegmentationClassPNG"))
    if not args.noviz:
        os.makedirs(
            osp.join(args.output_dir, "SegmentationClassVisualization")
        )
    print("Creating dataset:", args.output_dir)

    class_names = []
    class_name_to_id = {}
    for i, line in enumerate(open(args.labels).readlines()):
        class_id = i - 1  # starts with -1
        class_name = line.strip()
        class_name_to_id[class_name] = class_id
        if class_id == -1:
            assert class_name == "__ignore__"
            continue
        elif class_id == 0:
            assert class_name == "_background_"
        class_names.append(class_name)
    class_names = tuple(class_names)
    print("class_names:", class_names)
    out_class_names_file = osp.join(args.output_dir, "class_names.txt")
    with open(out_class_names_file, "w") as f:
        f.writelines("\n".join(class_names))
    print("Saved class_names:", out_class_names_file)

    for filename in glob.glob(osp.join(args.input_dir, "*.json")):
        print("Generating dataset from:", filename)

        label_file = labelme.LabelFile(filename=filename)

        base = osp.splitext(osp.basename(filename))[0]
        out_img_file = osp.join(args.output_dir, "JPEGImages", base + ".jpg")
        out_lbl_file = osp.join(
            args.output_dir, "SegmentationClass", base + ".npy"
        )
        out_png_file = osp.join(
            args.output_dir, "SegmentationClassPNG", base + ".png"
        )
        if not args.noviz:
            out_viz_file = osp.join(
                args.output_dir,
                "SegmentationClassVisualization",
                base + ".jpg",
            )

        with open(out_img_file, "wb") as f:
            f.write(label_file.imageData)
        img = labelme.utils.img_data_to_arr(label_file.imageData)

        lbl, _ = labelme.utils.shapes_to_label(
            img_shape=img.shape,
            shapes=label_file.shapes,
            label_name_to_value=class_name_to_id,
        )
        labelme.utils.lblsave(out_png_file, lbl)

        np.save(out_lbl_file, lbl)

        if not args.noviz:
            viz = imgviz.label2rgb(
                lbl,
                imgviz.rgb2gray(img),
                font_size=15,
                label_names=class_names,
                loc="rb",
            )
            imgviz.io.imsave(out_viz_file, viz)


if __name__ == "__main__":
    main()

执行后会生成如下目录:

- voc_data /JPEGImages
- voc_data /SegmentationClass
- voc_data /SegmentationClassPNG
- voc_data /SegmentationClassVisualization
- voc_data /class_names.txt

你可能感兴趣的:(dataset,python)