【yolo】yolo的txt标签转VOC格式的xml标签

脚本介绍:

1. 可以为原图提供自动标注的功能。

例如:需要标注10000+的数据,可以人工标注1000+,然后训练yolo模型,再用detect.py用模型对剩下来的原图进行推理,推理中保存txt格式的推理结果。然后可以采用本代码,对剩下来的原图进行自动标注,再人工调整。

2. 通过模型自动标注,可以为已有标签补充其他类别

例如:原来的数据集的xml标签文件有[a,b,c]3个类,但是实际需求还需要增加一个d类。然后我们采用另一个检测模型,可以检测[d,e,f]类。
使用yolo项目中的detect.py用模型对需要补充类别的数据集原图进行推理,推理中保存txt格式的推理结果。
然后可以采用本代码,对txt标签文件中提取出[d]类的检测框信息,然后添加到原来数据集的xml标签中。

txt转xml转换代码:

import os
import xml.etree.ElementTree as ET
from xml.dom.minidom import Document
import cv2
import xml.etree.ElementTree as ET

xml_obj = '''
            
        {}
        Unspecified
        0
        0
        
            {}
            {}
            {}
            {}
        
    
    '''

class YOLO2VOCConvert:
    def __init__(self, txts_path, out_xmls_path,org_xml_path, imgs_path, classes, jpg_type, valid_class) :
        self.txts_path = txts_path   # 标注的yolo格式标签文件路径
        self.xmls_path = out_xmls_path   # 转化为voc格式标签之后保存路径
        self.org_xmls_path = org_xml_path   # 原来自带的xml路径
        self.imgs_path = imgs_path   # 读取读片的路径各图片名字,存储到xml标签文件中
        self.classes = classes
        self.jpg_type = jpg_type
        self.valid_class = valid_class

    # 从所有的txt文件中提取出所有的类别, yolo格式的标签格式类别为数字 0,1,...
    # writer为True时,把提取的类别保存到'./Annotations/classes.txt'文件中
    def search_all_classes(self, writer=False):
        # 读取每一个txt标签文件,取出每个目标的标注信息
        all_names = set()
        txts = os.listdir(self.txts_path)
        # 使用列表生成式过滤出只有后缀名为txt的标签文件
        txts = [txt for txt in txts if txt.split('.')[-1] == 'txt']
        # print(len(txts), txts)
        # 11 ['0002030.txt', '0002031.txt', ... '0002039.txt', '0002040.txt']
        for txt in txts:
            txt_file = os.path.join(self.txts_path, txt)
            with open(txt_file, 'r') as f:
                objects = f.readlines()
                for object in objects:
                    object = object.strip().split(' ')
                    print(object)  # ['2', '0.506667', '0.553333', '0.490667', '0.658667']
                    all_names.add(int(object[0]))
            # print(objects)  # ['2 0.506667 0.553333 0.490667 0.658667\n', '0 0.496000 0.285333 0.133333 0.096000\n', '8 0.501333 0.412000 0.074667 0.237333\n']

        print("所有的类别标签:", all_names, "共标注数据集:%d张" % len(txts))

        return list(all_names)

    def find_nodes(self,tree, path):
        return tree.findall(path)

    def yolo2voc(self):
        # 创建一个保存xml标签文件的文件夹
        if not os.path.exists(self.xmls_path):
            os.mkdir(self.xmls_path)

        # 把上面的两个循环改写成为一个循环:
        imgs = os.listdir(self.imgs_path)
        txts = os.listdir(self.txts_path)
        txts = [txt for txt in txts if not txt.split('.')[0] == "classes"]  # 过滤掉classes.txt文件
        print(txts)

        for root, dir, files in os.walk(self.txts_path):
            for file in files:
                if file.endswith('txt'):
                    img_name = file[:-3]+self.jpg_type
                    if not os.path.exists(os.path.join(self.imgs_path, img_name)):
                        continue
                    print("读取图片:", os.path.join(self.imgs_path, img_name))
                    img = cv2.imread(os.path.join(self.imgs_path, img_name))
                    height_img, width_img, depth_img = img.shape

                    # 获取标注文件txt中的标注信息
                    all_objects = []
                    txt_file = os.path.join(root, file)
                    print('txt_file:', txt_file)
                    with open(txt_file, 'r') as f:
                        objects = f.readlines()
                        for object in objects:
                            object = object.strip().split(' ')
                            all_objects.append(object)
                    xml_name = file[:-3]+'xml'
                    self.txt2xml(all_objects, height_img, width_img, depth_img, file)

                    # 不存在,则新建xml
                    if os.path.exists(os.path.join(self.org_xmls_path, xml_name)):
                        self.txtAddXml(xml_name)

    def add_node_by_target_classes(self, nodelist, classes, tree_root):
        print(222)
        for parent_node in nodelist:
            # print(333)
            children = parent_node.getchildren()
            # print(children[0].text)
            if (parent_node.tag == "object" and children[0].text in classes):
                # print(children[0].text.lower())
                tree_root.append(parent_node)

    def txtAddXml(self, xml_name):
        new_tree = ET.parse(os.path.join(self.org_xmls_path, xml_name))
        tree = ET.parse(os.path.join(self.xmls_path, xml_name))
        old_root = tree.getroot()
        new_root = new_tree.getroot()
        # get parent nodes
        add_parent_nodes = self.find_nodes(old_root, "./")
        self.add_node_by_target_classes(add_parent_nodes, self.valid_class, new_root)
        new_tree.write(os.path.join(self.xmls_path, xml_name), encoding="utf-8", xml_declaration=True)

    def txt2xml(self, all_objects, height_img, width_img, depth_img, txt_name):
        # 创建xml标签文件中的标签
        xmlBuilder = Document()
        # 创建annotation标签,也是根标签
        annotation = xmlBuilder.createElement("annotation")

        # 给标签annotation添加一个子标签
        xmlBuilder.appendChild(annotation)

        # 创建子标签folder
        folder = xmlBuilder.createElement("folder")
        # 给子标签folder中存入内容,folder标签中的内容是存放图片的文件夹,例如:JPEGImages
        folderContent = xmlBuilder.createTextNode(self.imgs_path.split('/')[-1])  # 标签内存
        folder.appendChild(folderContent)  # 把内容存入标签
        annotation.appendChild(folder)  # 把存好内容的folder标签放到 annotation根标签下

        # 创建子标签filename
        filename = xmlBuilder.createElement("filename")
        # 给子标签filename中存入内容,filename标签中的内容是图片的名字,例如:000250.jpg
        filenameContent = xmlBuilder.createTextNode(txt_name.split('.')[0] + '.jpg')  # 标签内容
        filename.appendChild(filenameContent)
        annotation.appendChild(filename)

        # 把图片的shape存入xml标签中
        size = xmlBuilder.createElement("size")
        # 给size标签创建子标签width
        width = xmlBuilder.createElement("width")  # size子标签width
        widthContent = xmlBuilder.createTextNode(str(width_img))
        width.appendChild(widthContent)
        size.appendChild(width)  # 把width添加为size的子标签
        # 给size标签创建子标签height
        height = xmlBuilder.createElement("height")  # size子标签height
        heightContent = xmlBuilder.createTextNode(str(height_img))  # xml标签中存入的内容都是字符串
        height.appendChild(heightContent)
        size.appendChild(height)  # 把width添加为size的子标签
        # 给size标签创建子标签depth
        depth = xmlBuilder.createElement("depth")  # size子标签width
        depthContent = xmlBuilder.createTextNode(str(depth_img))
        depth.appendChild(depthContent)
        size.appendChild(depth)  # 把width添加为size的子标签
        annotation.appendChild(size)  # 把size添加为annotation的子标签

        # 每一个object中存储的都是['2', '0.506667', '0.553333', '0.490667', '0.658667']一个标注目标
        for object_info in all_objects:
            # 开始创建标注目标的label信息的标签
            object = xmlBuilder.createElement("object")  # 创建object标签
            # 创建label类别标签
            # 创建name标签
            imgName = xmlBuilder.createElement("name")  # 创建name标签
            imgNameContent = xmlBuilder.createTextNode(self.classes[int(object_info[0])])
            imgName.appendChild(imgNameContent)
            object.appendChild(imgName)  # 把name添加为object的子标签

            # 创建pose标签
            pose = xmlBuilder.createElement("pose")
            poseContent = xmlBuilder.createTextNode("Unspecified")
            pose.appendChild(poseContent)
            object.appendChild(pose)  # 把pose添加为object的标签

            # 创建truncated标签
            truncated = xmlBuilder.createElement("truncated")
            truncatedContent = xmlBuilder.createTextNode("0")
            truncated.appendChild(truncatedContent)
            object.appendChild(truncated)

            # 创建difficult标签
            difficult = xmlBuilder.createElement("difficult")
            difficultContent = xmlBuilder.createTextNode("0")
            difficult.appendChild(difficultContent)
            object.appendChild(difficult)

            # 先转换一下坐标
            # (objx_center, objy_center, obj_width, obj_height)->(xmin,ymin, xmax,ymax)
            x_center = float(object_info[1]) * width_img + 1
            y_center = float(object_info[2]) * height_img + 1
            xminVal = int(x_center - 0.5 * float(object_info[3]) * width_img)  # object_info列表中的元素都是字符串类型
            yminVal = int(y_center - 0.5 * float(object_info[4]) * height_img)
            xmaxVal = int(x_center + 0.5 * float(object_info[3]) * width_img)
            ymaxVal = int(y_center + 0.5 * float(object_info[4]) * height_img)

            # 创建bndbox标签(三级标签)
            bndbox = xmlBuilder.createElement("bndbox")
            # 在bndbox标签下再创建四个子标签(xmin,ymin, xmax,ymax) 即标注物体的坐标和宽高信息
            # 在voc格式中,标注信息:左上角坐标(xmin, ymin) (xmax, ymax)右下角坐标
            # 1、创建xmin标签
            xmin = xmlBuilder.createElement("xmin")  # 创建xmin标签(四级标签)
            xminContent = xmlBuilder.createTextNode(str(xminVal))
            xmin.appendChild(xminContent)
            bndbox.appendChild(xmin)
            # 2、创建ymin标签
            ymin = xmlBuilder.createElement("ymin")  # 创建ymin标签(四级标签)
            yminContent = xmlBuilder.createTextNode(str(yminVal))
            ymin.appendChild(yminContent)
            bndbox.appendChild(ymin)
            # 3、创建xmax标签
            xmax = xmlBuilder.createElement("xmax")  # 创建xmax标签(四级标签)
            xmaxContent = xmlBuilder.createTextNode(str(xmaxVal))
            xmax.appendChild(xmaxContent)
            bndbox.appendChild(xmax)
            # 4、创建ymax标签
            ymax = xmlBuilder.createElement("ymax")  # 创建ymax标签(四级标签)
            ymaxContent = xmlBuilder.createTextNode(str(ymaxVal))
            ymax.appendChild(ymaxContent)
            bndbox.appendChild(ymax)

            object.appendChild(bndbox)
            annotation.appendChild(object)  # 把object添加为annotation的子标签
        f = open(os.path.join(self.xmls_path, txt_name[:-3] + 'xml'), 'w')
        print(os.path.join(self.xmls_path, txt_name[-3] + 'xml'))
        xmlBuilder.writexml(f, indent='\t', newl='\n', addindent='\t', encoding='utf-8')
        f.close()



if __name__ == '__main__':
    '''
    脚本功能:
    1. 可以为原图提供自动标注的功能。
        例如:需要标注10000+的数据,可以人工标注1000+,然后训练yolo模型,再用detect.py用模型对剩下来的原图进行推理,
            推理中保存txt格式的推理结果。然后可以采用本代码,对剩下来的原图进行自动标注,再人工调整。
        [参数]
        imgs_path1:需要自动标注的图片路径
        txts_path1:输入推理中保存txt文件
        xmls_path1:输出的xml文件路径
        其他参数可以设置为空,程序内不会进行调用

    2. 通过模型自动标注,可以为已有标签补充其他类别
        例如:原来的数据集的xml标签文件有[a,b,c]3个类,但是实际需求还需要增加一个d类。然后我们采用另一个检测模型,可以检测[d,e,f]类。
            使用yolo项目中的detect.py用模型对需要补充类别的数据集原图进行推理,推理中保存txt格式的推理结果。
            然后可以采用本代码,对txt标签文件中提取出[d]类的检测框信息,然后添加到原来数据集的xml标签中。
        [参数]
        imgs_path1: 需要自动标注的图片路径
        txts_path1: 输入推理中保存txt文件,即案例中用另一个模型推理出包含[d,e,f]3个类的txt结果文件
        xmls_path1: 输出的xml文件路径
        xmls_path2: 原始的xml标签文件,即案例中只有[a,b,c]3个类的xml标签文件
        valid_class: 在推理输出的txt文件中,提取指定类别的信息,即案例中的[d]类,而e,f两类的检测框信息会被忽略。
    '''

    # 把yolo的txt标签文件转化为voc格式的xml标签文件
    # yolo格式txt标签文件相对路径
    txts_path1 = r'D:\dataset\LabeledDataset\FieldDatasets\unusual\2.ZH(charger,cabinet)\ZH-breakage\labels'
    # 输出目录转化为voc格式xml标签文件存储的相对路径
    xmls_path1 = r'D:\dataset\LabeledDataset\FieldDatasets\unusual\2.ZH(charger,cabinet)\ZH-breakage'
    # 存放图片的相对路径
    imgs_path1 = r'D:\dataset\LabeledDataset\FieldDatasets\unusual\2.ZH(charger,cabinet)\ZH-breakage'
    # 原图片对应的xml路径(当功能1时,没有原始xml标签时,可以为空)
    xmls_path2 = r'D:\dataset\LabeledDataset\FieldDatasets\unusual\2.ZH(charger,cabinet)\ZH-breakage-158'
    # txt转xml时,每个类别的id对用的label名称
    classes = ["fire", "charger", "cabinet", "lbrblue", "dooropen", "breakage"]
    # 当用txt标签文件给已存在的xml标签进行一个检测类别补充时,可以对类别进行一个筛选。功能1时,可以设置为空。
    valid_class = ["charger", "cabinet"]
    jpg_type='jpg'

    yolo2voc_obj1 = YOLO2VOCConvert(txts_path1, xmls_path1,xmls_path2, imgs_path1,classes,jpg_type,valid_class)
    labels = yolo2voc_obj1.search_all_classes()
    print('labels: ', labels)
    yolo2voc_obj1.yolo2voc()

你可能感兴趣的:(【2.7】yolo,【9】python综合,xml,深度学习,python)