【目标检测】一文干翻xml文件的读取

前言

        在目标检测中xml文件的读取非常常见,常常要用到labelimg、labelme等标注软件, 打标时往往需要打开xml文件,但奈何一直没找到一篇完整的文章,故自己打算手写一篇。下面介绍利用python解析xml文件的方法。


【目标检测】一文搞定xml文件的读取

.xml实例

.py实战中得真知:

1、获取根节点标签中的文本。

.py

vscode.output 

2、获取标签中的子节点的属性(多个)。

.py

vscode.output

番外阅读


.xml实例

这是一个在目标检测中十分常见的.xml文件,今天我们就以它来作为例子!


	VOC2007
	000001.jpg
	
		The VOC2007 Database
		PASCAL VOC2007
		flickr
		341012865
	
	
		Fried Camels
		Jinky the Fruit Bat
	
	
		353
		500
		3
	
	0
	
		dog
		Left
		1
		0
		
			48
			240
			195
			371
		
	
	
		person
		Left
		1
		0
		
			8
			12
			352
			498
		
	

.py实战中得真知:

tree = ET.parse(xml_path) 读取xml文档
root = tree.getroot() 获取根节点

         解析:ET.parse()将xml文件读入到dom,返回一个etree对象,可以通过etree的getroot()、find()等函数对树的根节点和某个子节点进行访问。如findall("object")则返回所有的object节点,还可以通过.text访问节点的文本属性。 

1、获取根节点标签中的文本。

.py

import xml.etree.ElementTree as ET
def get_JPGImgName(xmlpath):
    dom=ET.parse(xmlpath)
    root=dom.getroot()
    #print(root.find('filename').text)
    return root.find('filename').text

if __name__ == '__main__':
    print(get_JPGImgName(r'VOC2007_Annotations\000001.xml'))

vscode.output 

【目标检测】一文干翻xml文件的读取_第1张图片

2、获取标签中的子节点的属性(多个)。

.py

import xml.etree.ElementTree as ET
from xml.etree.ElementTree import Element
'''
ET.parse()将xml文件读入到dom,返回一个etree对象,可以通过etree的getroot()、find()等函数对树的根节点和某个子节点进行访问。如findall("object")则返回所有的object节点,还可以通过.text()访问节点的文本属性。
'''
if __name__ == '__main__':
    xml_path = r'VOC2007_Annotations\000001.xml'
    dom=ET.parse(xml_path)
    root=dom.getroot()
    allobj=root.findall("object")
    for i, obj in enumerate(allobj):
        print('the obj name is:', obj.find('name').text)

vscode.output

打包好一个函数用于获取object.name。

.py

import xml.etree.ElementTree as ET
from xml.etree.ElementTree import Element

def get_objectName(xmlpath):
    dom=ET.parse(xmlpath)
    root=dom.getroot()
    allobj=root.findall("object")
    xmlNames = []
    for i, obj in enumerate(allobj):
        xmlNames.append(obj.find('name').text))
       # print('the obj-{} name is:{}'.format(i,obj.find('name').text))
    return xmlNames

番外阅读

         XML是可扩展标记语言 ,标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。其中有且只有一个根节点,如上例中根节点为annotations,<>是一个标签对,标签对内可以有该节点的子节点及其标签对;标签对的内容是可以自定义的。

       在用于标注数据的xml文件中,如一般根节点为annotations,包含size、folder、filename、object等多个子节点,object子结点中为bbox的信息。
 

完毕!

是不是超级简单呢?如果方便的话,欢迎大家点赞+关注! 

你可能感兴趣的:(目标检测,xml,java,前端)