Mask-Rcnn数据制作最详细教程(labelme版)

Mask-Rcnn数据制作最详细教程(labelme版)

  • 摘要
  • 1.数据集制作
    • 1. labelme的安装及使用
    • 2.标注图片及批量转换

摘要

你好! 本文将从数据标注开始,详解每一步直至成功制作自己的Mask-Rcnn数据集。

1.数据集制作

本文选择labelme软件进行数据集的标注工作,labelme下载链接如下:
链接: link.

1. labelme的安装及使用

labelme的安装及使用很简单,可参考下面的链接:
链接: link.

2.标注图片及批量转换

标注好的每个数据会有一个对应的json文件,如下图所示
Mask-Rcnn数据制作最详细教程(labelme版)_第1张图片
Mask-Rcnn训练集需要的文件就由上面的json文件转换得到,首先找到你的labelme安装路径,例如我是在Anaconda中安装的,那么我的操作路径就是C:\PersonalApp\Anaconda3\Scripts,该路径根据个人实际情况进行修改,键盘输入win+r,进入运行,输入cmd后点击回车进入命令行模式,如下图所示:
Mask-Rcnn数据制作最详细教程(labelme版)_第2张图片
Mask-Rcnn数据制作最详细教程(labelme版)_第3张图片
此时输入cd C:\PersonalApp\Anaconda3\Scripts,进入该文件夹,需要用到该文件夹中的labelme_json_to_dataset.exe文件,在命令行输入labelme_json_to_dataset <文件名>.json,即可生成所需的五个文件,如下图所示:
Mask-Rcnn数据制作最详细教程(labelme版)_第4张图片
Mask-Rcnn数据制作最详细教程(labelme版)_第5张图片
生成的这五个文件中最重要的就是其中的labelme.png文件,很多Mask-Rcnn的文章都将其转为8位深度图片,但是注意当前版本的labelme生成的label.png本身就是8位的,不需要转换,这是数据制作中最重要的一步,一定注意,图片深度可鼠标右键查看属性的详细信息,如下图所示:Mask-Rcnn数据制作最详细教程(labelme版)_第6张图片
上述命令行可以转换一张图片和相应的json文件,但是我们在制作训练集时,逐张转换实在过于繁琐,本文使用一种批量转换json文件的方法。首先找到安装路径的Lib文件夹,如我的就是C:\PersonalApp\Anaconda3,进入其中的site-packages文件夹,找到其中的labelme文件夹,进入cli文件夹找到json_to_dataset.py文件,修改该文件为:
(其中路径改为自己的json文件路径)

// json_to_dataset.py
import argparse
import base64
import json
import os
import os.path as osp
import warnings

import PIL.Image
import yaml

from labelme import utils
###############################################增加的语句,改下路径即可##############################
import glob
json_list = glob.glob(os.path.join('C://Users////Desktop//1','*.json'))
###############################################   end    ##################################


def main():
    # warnings.warn("This script is aimed to demonstrate how to convert the\n"
    #               "JSON file to a single image dataset, and not to handle\n"
    #               "multiple JSON files to generate a real-use dataset.")

    parser = argparse.ArgumentParser()
    ###############################################  删除的语句  ##################################
    # parser.add_argument('json_file')
    # json_file = args.json_file
    ###############################################    end       ##################################
    parser.add_argument('-o', '--out', default=None)
    args = parser.parse_args()

    ###############################################增加的语句##################################
    for json_file in json_list:
    ###############################################    end       ##################################

        if args.out is None:
            out_dir = osp.basename(json_file).replace('.', '_')
            out_dir = osp.join(osp.dirname(json_file), out_dir)
        else:
            out_dir = args.out
        if not osp.exists(out_dir):
            os.mkdir(out_dir)

        data = json.load(open(json_file))

        if data['imageData']:
            imageData = data['imageData']
        else:
            imagePath = os.path.join(os.path.dirname(json_file), data['imagePath'])
            with open(imagePath, 'rb') as f:
                imageData = f.read()
                imageData = base64.b64encode(imageData).decode('utf-8')
        img = utils.img_b64_to_arr(imageData)

        label_name_to_value = {'_background_': 0}
        for shape in data['shapes']:
            label_name = shape['label']
            if label_name in label_name_to_value:
                label_value = label_name_to_value[label_name]
            else:
                label_value = len(label_name_to_value)
                label_name_to_value[label_name] = label_value
        # lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)
        #
        # label_names = [None] * (max(label_name_to_value.values()) + 1)
        # for name, value in label_name_to_value.items():
        #     label_names[value] = name
        # lbl_viz = utils.draw_label(lbl, img, label_names)
                # label_values must be dense
        label_values, label_names = [], []
        for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]):
            label_values.append(lv)
            label_names.append(ln)
        assert label_values == list(range(len(label_values)))

        lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)

        captions = ['{}: {}'.format(lv, ln)
                    for ln, lv in label_name_to_value.items()]
        lbl_viz = utils.draw_label(lbl, img, captions)

        PIL.Image.fromarray(img).save(osp.join(out_dir, 'img.png'))
        utils.lblsave(osp.join(out_dir, 'label.png'), lbl)
        PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, 'label_viz.png'))

        with open(osp.join(out_dir, 'label_names.txt'), 'w') as f:
            for lbl_name in label_names:
                f.write(lbl_name + '\n')

        warnings.warn('info.yaml is being replaced by label_names.txt')
        info = dict(label_names=label_names)
        with open(osp.join(out_dir, 'info.yaml'), 'w') as f:
            yaml.safe_dump(info, f, default_flow_style=False)

        print('Saved to: %s' % out_dir)


if __name__ == '__main__':
    main()

当然,也可以直接下载后替换即可(其中路径改为自己的json文件路径),连接如下:
链接: link.
替换后打开json_to_dataset.py文件,直接执行即可,相应文件夹会批量转换,如下图所示:
Mask-Rcnn数据制作最详细教程(labelme版)_第7张图片
至此,Mask-Rcnn数据制作基本完成,后面只需要将转换后的文件分配到相应文件夹即可。若代码可用请点颗星星,谢谢

你可能感兴趣的:(语义分割)