Python处理XML之DOM解析

 

print "===========DOM方式解析XML文档======================="
'''
DOM 将XML文档定义为如下格式:
根节点
||
元素节点====属性节点
||
元素节点 OR 文本节点 OR CDATA节点
'''
from xml.dom.minidom import *
#传递文件路径或者是文件对象,如果是文件对象,调用parse之后,已经将DOM树加载到了内存
#,可以调用完之后立即关闭
domfile=parse("xmldata.xml")
#DOM以树的方式对xml解析,要求XML文档只能有一个根节点,
root=domfile.documentElement
#xml的DOM树已经加载到内存,因此文件可以关闭了
#可以用getElementsByTag来根据标签名来获取节点
children=root.childNodes
users=[]
user={}
for child in children:
	#跳过空格、回车等Text_Node=3子元素、ELEMENT_NODE=1、ATTRIBUTE_NODE=2
	if child.nodeType==root.ELEMENT_NODE:
		#通过attributes属性获取父节点的所有属性节点,通过方法getAttribute获取指定属性的值
		user.update({"name":child.getAttribute("name")})
		grands=child.childNodes
		for grand in grands:
			#元素节点本身不包含值,只能通过获取被它包含的文本节点、属性节点来读取值
			if grand.nodeType==root.ELEMENT_NODE:
				texts=grand.childNodes
				#Python 2.6以后,文本节点的值通过nodeValue属性获取,而不是text属性
				user.update({"description":texts[0].nodeValue.strip()})
		users.append(user)
		#处理完一个user之后,注意重置中间变量
		user={}
	#DOM将空格、回车等XML格式化的内容认为是文本节点,必须跳过处理
print users
for user in users:
	for item in user.items():
		key,value=item
		print key,value.encode("GBK")

 处理的数据时一样的

你可能感兴趣的:(python基础,XML处理)