你好! 本文将从数据标注开始,详解每一步直至成功制作自己的Mask-Rcnn数据集。
本文选择labelme软件进行数据集的标注工作,labelme下载链接如下:
链接: link.
labelme的安装及使用很简单,可参考下面的链接:
链接: link.
标注好的每个数据会有一个对应的json文件,如下图所示
Mask-Rcnn训练集需要的文件就由上面的json文件转换得到,首先找到你的labelme安装路径,例如我是在Anaconda中安装的,那么我的操作路径就是C:\PersonalApp\Anaconda3\Scripts,该路径根据个人实际情况进行修改,键盘输入win+r,进入运行,输入cmd后点击回车进入命令行模式,如下图所示:
此时输入cd C:\PersonalApp\Anaconda3\Scripts,进入该文件夹,需要用到该文件夹中的labelme_json_to_dataset.exe文件,在命令行输入labelme_json_to_dataset <文件名>.json,即可生成所需的五个文件,如下图所示:
生成的这五个文件中最重要的就是其中的labelme.png文件,很多Mask-Rcnn的文章都将其转为8位深度图片,但是注意当前版本的labelme生成的label.png本身就是8位的,不需要转换,这是数据制作中最重要的一步,一定注意,图片深度可鼠标右键查看属性的详细信息,如下图所示:
上述命令行可以转换一张图片和相应的json文件,但是我们在制作训练集时,逐张转换实在过于繁琐,本文使用一种批量转换json文件的方法。首先找到安装路径的Lib文件夹,如我的就是C:\PersonalApp\Anaconda3,进入其中的site-packages文件夹,找到其中的labelme文件夹,进入cli文件夹找到json_to_dataset.py文件,修改该文件为:
(其中路径改为自己的json文件路径)
// json_to_dataset.py
import argparse
import base64
import json
import os
import os.path as osp
import warnings
import PIL.Image
import yaml
from labelme import utils
###############################################增加的语句,改下路径即可##############################
import glob
json_list = glob.glob(os.path.join('C://Users////Desktop//1','*.json'))
############################################### end ##################################
def main():
# warnings.warn("This script is aimed to demonstrate how to convert the\n"
# "JSON file to a single image dataset, and not to handle\n"
# "multiple JSON files to generate a real-use dataset.")
parser = argparse.ArgumentParser()
############################################### 删除的语句 ##################################
# parser.add_argument('json_file')
# json_file = args.json_file
############################################### end ##################################
parser.add_argument('-o', '--out', default=None)
args = parser.parse_args()
###############################################增加的语句##################################
for json_file in json_list:
############################################### end ##################################
if args.out is None:
out_dir = osp.basename(json_file).replace('.', '_')
out_dir = osp.join(osp.dirname(json_file), out_dir)
else:
out_dir = args.out
if not osp.exists(out_dir):
os.mkdir(out_dir)
data = json.load(open(json_file))
if data['imageData']:
imageData = data['imageData']
else:
imagePath = os.path.join(os.path.dirname(json_file), data['imagePath'])
with open(imagePath, 'rb') as f:
imageData = f.read()
imageData = base64.b64encode(imageData).decode('utf-8')
img = utils.img_b64_to_arr(imageData)
label_name_to_value = {'_background_': 0}
for shape in data['shapes']:
label_name = shape['label']
if label_name in label_name_to_value:
label_value = label_name_to_value[label_name]
else:
label_value = len(label_name_to_value)
label_name_to_value[label_name] = label_value
# lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)
#
# label_names = [None] * (max(label_name_to_value.values()) + 1)
# for name, value in label_name_to_value.items():
# label_names[value] = name
# lbl_viz = utils.draw_label(lbl, img, label_names)
# label_values must be dense
label_values, label_names = [], []
for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]):
label_values.append(lv)
label_names.append(ln)
assert label_values == list(range(len(label_values)))
lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)
captions = ['{}: {}'.format(lv, ln)
for ln, lv in label_name_to_value.items()]
lbl_viz = utils.draw_label(lbl, img, captions)
PIL.Image.fromarray(img).save(osp.join(out_dir, 'img.png'))
utils.lblsave(osp.join(out_dir, 'label.png'), lbl)
PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, 'label_viz.png'))
with open(osp.join(out_dir, 'label_names.txt'), 'w') as f:
for lbl_name in label_names:
f.write(lbl_name + '\n')
warnings.warn('info.yaml is being replaced by label_names.txt')
info = dict(label_names=label_names)
with open(osp.join(out_dir, 'info.yaml'), 'w') as f:
yaml.safe_dump(info, f, default_flow_style=False)
print('Saved to: %s' % out_dir)
if __name__ == '__main__':
main()
当然,也可以直接下载后替换即可(其中路径改为自己的json文件路径),连接如下:
链接: link.
替换后打开json_to_dataset.py文件,直接执行即可,相应文件夹会批量转换,如下图所示:
至此,Mask-Rcnn数据制作基本完成,后面只需要将转换后的文件分配到相应文件夹即可。若代码可用请点颗星星,谢谢