我们需要修改源码
将里面的代码改为下图所示:
添加了字体路径,注意:要是我们电脑里有的字体。
此外我们还需要修改一处:
在40行作用:data = json.load(open(json_file,encoding=‘utf8’))
修改encoding方式。
完毕。
修改label_colormap函数:
原始json_to_dataset.py的代码,会自动从标注产生的json文件中提取出类别,具体操作如下:
label_name_to_value = {"_background_": 0}
# 针对label进行排序
for shape in sorted(data["shapes"], key=lambda x: x["label"]):
label_name = shape["label"]
if label_name in label_name_to_value:
# label已经存在,获取该label的value
label_value = label_name_to_value[label_name]
else:
# label不存在,在label_name_to_value中添加
label_value = len(label_name_to_value)
label_name_to_value[label_name] = label_value
针对上一节中的数据,如果有一张图像中没有核桃树,那么荒地、其他树木、建筑的label值都会依次减少1。
这种问题仅出现在多类别数据集且存在某些图像没有全部类别的物体(这是很容易理解的)。
针对该问题的解决方法也很简单,我们事先在label_name_to_value中添加自己数据的label。像下面这样:
label_name_to_value = {"_background_": 0, "water":1,"tree":2}
这样也可以指定类别的value,因为labelme自动识别的label会排序,即labelme会自动填充的
label_name_to_value={"_background_": 0, "tree":1, "water":2}
因为t在w之前。