DOM是一个使程序和脚本有能力动态的访问和更新文档的内容、结构以及样式的平台和语言中立的接口,主要被分为三个不同的部分:核心DOM、XML DOM和HTML DOM。http://www.w3school.com.cn/xmldom/dom_intro.asp
一、JAXP接口(Java API for XMLParsing)
a) org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
b) org.xml.sax 用于对XML进行语法分析的事件驱动的XML简单API(SAX)。
c) javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。
二、这三个包在jdk中都有
三、XML DOM的主要用途:
XML DOM(Document Object Model)即XML文档对象模型,它定义了访问和处理XML文档的标准方法,或者说XML DOM是用于获取、更改、添加或删除XML元素的标准。
主要应用于:
1) 在需要修改XML文档的内容、结构和顺序时;
2) 需要多次遍历XML文档时;
3) 归并多个XML文档时;
4) 对XML内容做复杂操作。
DOM的工作流程:
DOM解析器将整篇的XML文档加载到内存中,并以树的形式保存,含有丰富的API,所有对象在DOM中都被看作是Node/节点。
四、XML DOM解析的基本步骤:
a) 应用程序生成DOM解析器
b) 解析器加载XML
c) 解析器向应用程序返回错误信息
d) 解析器生成DOM树
e) 应用程序读写DOM树
f) 应用程序将DOM树转化为XML文档输出
五、DOM树:
a) 抽象的:
b) 真实的:
六、XML DOM常用节点
DOM规定,XML文档中的每个成分都是一个节点
a) Document——整个文档为一个文档节点documentElement,代表整个文档,只有一个元素子节点root,但可以有多个其它类型的子节点;
而DocumentFragment表示一个XML片段,用于修改DOM树、截取与合并XML片段。
b) Element——每个XML标签为一个元素节点;
c) Text——包含在XML元素中的文本是文本节点;注意文本总是存储在文本节点中,元素节点不包含文本,元素节点的文本也是存储在文本节点中的,如
d) Attr——每个XML属性是一个属性节点,注意属性节点和元素节点不存在父子关系;
e) 注释属于注释节点。
七、解析XML DOM
f) 如下面的JavaScript片段将books.xml载入了解析器:
xmlDoc=newActiveXObject("Microsoft.XMLDOM"); #创建空的微软XML文档对象
#创建Firefox或其他浏览器中的空的XML文档对象
xmlDoc.async="false";#关闭异步加载,确保在文档加载完整前解析器不会继续执行脚本
xmlDoc.load("books.xml");#加载books.xml
load()用于加载文件,而loadXML()用于加载字符串/文本。
一个跨浏览器解析XML文档的实例:
try //IE
{
xmlDoc=new ActiveXObject("Microsoft.XMLDOM");
}
catch(e)
{
try //Firefox, Mozilla, Opera, etc.
{
xmlDoc=document.implementation.createDocument("","",null);
}
catch(e) {alert(e.message)}
}
try
{
xmlDoc.async=false;
xmlDoc.load("books.xml");
document.write("xmlDoc is loaded, ready for use");
}
catch(e) {alert(e.message)}
g) 如下面的JavaScript片段把名为txt的字符串载入解析器:
parser=new DOMParser(); #创建一个空的XML文档对象
xmlDoc=parser.parseFromString(txt,"text/xml"); #告知解析器加载名为txt的字符串
IE使用loadXML()解析XML字符串,方法同上面解析XML文档的方法,需要创建xmlDoc文档对象,并且需要关闭异步加载;而其他浏览器使用DOMParser()对象。
一个跨浏览器解析XML字符串的例子:
text=""
text=text+"";
text=text+"Harry Potter ";
text=text+"J K. Rowling ";
text=text+"2005 ";
text=text+"";
text=text+"";
try //IE
{
xmlDoc=new ActiveXObject("Microsoft.XMLDOM");
xmlDoc.async="false";
xmlDoc.loadXML(text);
}
catch(e)
{
try //Firefox, Mozilla, Opera, etc.
{
parser=new DOMParser();
xmlDoc=parser.parseFromString(text,"text/xml");
}
catch(e) {alert(e.message)}
}
document.write("xmlDoc is loaded, ready for use");
八、XML DOM加载函数
为了避免编写重复的代码,将一些代码存储在函数中,并可以使用XML DOM加载。如上面的加载XML文档代码可定义为loadXMLDoc(dname)函数,存储在"loadxmldoc.js"文件中:
function loadXMLDoc(dname)
{
try //Internet Explorer
{
xmlDoc=new ActiveXObject("Microsoft.XMLDOM");
}
catch(e)
{
try //Firefox, Mozilla, Opera, etc.
{
xmlDoc=document.implementation.createDocument("","",null);
}
catch(e) {alert(e.message)}
}
try
{
xmlDoc.async=false;
xmlDoc.load(dname);
return(xmlDoc);
}
catch(e) {alert(e.message)}
return(null);
}
在使用过程中,可以直接引用该函数:
#
先创建一个指向该函数存储文件链接
xmlDoc=loadXMLDoc("books.xml"); #加载books.xml文档
document.write("xmlDoc is loaded, ready for use");
九、 XML DOM属性和方法:设x为一个节点对象
v. x.attributes:x的属性节点。
如源books.xml为:
Everyday Italian
Giada De Laurentiis
2005
30.00
Harry Potter
J K. Rowling
2005
29.99
XQuery Kick Start
James McGovern
Per Bothner
Kurt Cagle
James Linn
Vaidyanathan Nagarajan
2003
49.99
Learning XML
Erik T. Ray
2003
39.95
通过java程序testDOM.java来对books.xml进行访问:
import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
public class testDOM {
public static void main(String[] args) throws Exception {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
File f = new File("books.xml");
Document doc = builder.parse(f);
Element root = doc.getDocumentElement();
NodeList list = root.getElementsByTagName("book");
for (int i = 0; i < list.getLength(); i++) {
Element n = (Element) list.item(i);
NamedNodeMap node = n.getAttributes();
for (int x = 0; x < node.getLength(); x++) {
Node nn = node.item(x);
System.out.println(nn.getNodeName() + ": " + nn.getNodeValue());
}
System.out.println("title: " +n.getElementsByTagName("title").item(0).getFirstChild().getNodeValue());
System.out.println("author: " + n.getElementsByTagName("author").item(0).getFirstChild().getNodeValue());
System.out.println();
}
}
}
得到的结果为:
category:COOKING
title: EverydayItalian
author: Giada DeLaurentiis
category:CHILDREN
title: HarryPotter
author: J K.Rowling
category: WEB
title: XQueryKick Start
author: JamesMcGovern
category: WEB
title: LearningXML
author: Erik T.Ray
十、XML DOM访问节点的三种方式:
j) 通过x.getElementByTagName(name)指定节点标签名的方式访问,注意该访问方式为x下所有含有
k) 通过遍历节点树的方式访问,如在java中是通过getLength()获取当前NodeList的节点数,然后使用NodeList.item(i)的方式访问,其中i为从0起始的下标;
x=xmlDoc.documentElement.childNodes;
for (i=0;i {if (x[i].nodeType==1){//Process only element nodes (type 1)document.write(x[i].nodeName);document.write("
");}}
l) 通过节点关系进行访问,如
x=xmlDoc.getElementsByTagName("book")[0].childNodes;
y=xmlDoc.getElementsByTagName("book")[0].firstChild;
十一、 XML DOM获取节点信息:
a) nodeName:规定节点的名称:v. 文档节点的nodeName即#document。
c) nodeType:规定节点的类型,只读。
元素类型 |
节点类型 |
元素 |
1 |
属性 |
2 |
文本 |
3 |
注释 |
8 |
文档 |
9 |
十二、 Node List节点列表
a) Node List对象会保持更新,每当添加或删除元素后,列表信息都会被更新;十三、 DOM中的空白与换行
XML 经常在节点之间含有换行或空白字符,Firefox以及其他一些浏览器,会把空白或换行作为文本节点来处理,而 Internet Explorer则不会。
如果需要忽略元素节点之间的空文本节点,则需要进行节点类型检查,只对于nodeType为1的节点进行处理。
functionget_nextSibling(n)
{
y=n.nextSibling;
while (y.nodeType!=1)
{
y=y.nextSibling;
}
return y;
}
十四、 XML DOM节点值操作:
a) 元素节点操作:如:
xmlDoc=loadXMLDoc("books.xml");
x=xmlDoc.getElementsByTagName("title")[0];
y=x.childNodes[0];#y为第一个title的文本节点
txt=x.nodeValue; #txt为文本元素
x.removeChild(y);
b) 属性节点操作:
如:
xmlDoc=loadXMLDoc("books.xml");
x=xmlDoc.getElementsByTagName("title")[0].getAttributeNode("lang");
txt=x.nodeValue;
c) 文本节点操作:
vi. 创建:xmlDoc.createTextNode(textValue),创建一个值为textValue的文本节点。
vii. 替换:x.replaceData(offset, length, string),x为文本节点,其中offset表示从何处开始替换,以0开始;length表示被替换的字符个数;string表示新的要插入的字符串。当然,通过nodeValue也可以完成替换操作。
viii. 添加:x.insertData(offset, string),x为文本节点,其中offset表示从何处添加,以0开始;string表示新的要插入的字符串。
d) CDATA Section节点操作:
ix. 创建:xmlDoc.createCDATASection(CDATAValue),创建一个值为CDATAValue的CDATA Section节点。
e) 注释节点操作:
x. 创建:xmlDoc.createComment(commentValue),创建一个值为commentValue的注释节点。
十五、 XML DOM解析器的生成(四步):
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();#生成实例,工厂模式类似于new,但比new灵活,见http://blog.csdn.net/cristianojason/article/details/51510093
Factory.setValidating(false);#设定解析选项
DocumentBuilder builder = factory.newDocumentBuilder();#从factory中生成builder
Document doc = builder.parse(xmlFileURL);#解析文档
XMLDOM遍历解析树:
Element root = doc.getDocumentElement();#获得root实例
NodeList children = root.getChildNodes();#获得所有节点
十六、 构造新的DOM树(五步):
Document newDoc = DocumentBuilder.newDocument();#定义新的Document
Element newRoot = newDoc.createElement(“rootName”);#建立新的根节点newRoot
#第三步自顶向下的构建分支
#第四步插入分支
newDoc.appendChild(newRoot)#第五步将newRoot插入到newDoc
十七、 XML DOM进行文档归并:
a) 解析两个文档;
b) import被归并文档;
c) 将被归并文档的节点插入目标文档的适当位置;
如:
Document doc1 = builder.parse(xmlFileURL1);
Document doc2 = builder.parse(xmlFileURL2);
Element root1 = doc1.getDocumentElement();
Element root2 = doc2.getDocumentElement();
NodeList children = root1.getChildNodes();
for(int i = 0; i < children.getLength(); i++) {
Element newChild = (Element)children.item(i);
Node newImportedChild = doc1.importNode(newChild, true);
root1.appendChild(newImportedChild);
}
十八、 DOM应用程序:
a) 生成解析器(四步)
i. 定义factory
ii. 配置解析器
iii.生成解析器
iv. 解析文档
b) 处理错误和异常
c) 遍历DOM树
d) 处理文档
i. 修改内容
ii. 修改结构
iii. 移动节点