如何批量修改Pascal VOC数据集中xml标签中的标签名称

跑深度学习相关代码的时候,自己标注数据是不可避免的。但有时数据标注完发现学名不符合或者有更合适的标签名来替代,此时一个一个手动修改太麻烦,在此可以通过Python脚本直接批量修改。


  • 代码如下:
import os
import xml.etree.ElementTree as ET

#程序功能:批量修改VOC数据集中xml标签文件的标签名称
def changelabelname(inputpath):
    listdir = os.listdir(inputpath)
    for file in listdir:
        if file.endswith('xml'):
            file = os.path.join(inputpath,file)
            tree = ET.parse(file)
            root = tree.getroot()
            for object1 in root.findall('object'):
                for sku in object1.findall('name'):           #查找需要修改的名称
                    if (sku.text == 'preName'):               #‘preName’为修改前的名称
                        sku.text = 'TESTNAME'                 #‘TESTNAME’为修改后的名称
                        tree.write(file,encoding='utf-8')     #写进原始的xml文件并避免原始xml中文字符乱码
                    else:
                        pass
        else:
            pass

if __name__ == '__main__':
    inputpath = 'E:/Research/Dataset/Test/Annotations'  #此处替换为自己的路径
    changelabelname(inputpath)

你可能感兴趣的:(目标检测)