DOM基础&实例
作者:yi5 转贴自:yi5_yuyu 点击数:12 文章录入: yuyu3007
在先前的一章介绍了SAX的基本方法,对于SAX来说他本身就具有串行的特点,所以读写起来比较方便但是,接下来要讲述的DOM(Document Object Model),虽然也是处理XML的一种方法,但是他的使用方法与SAX却完全不同,他的处理方法有点类似于数据结构中的树,在处理上也和树比较相似。他在处理XML的时候,是把整个XML文件读入到内存中,然后建立像我们在浏览中看到的树一样的一棵树,通过对树的操作我们可以完成删除添加等。提到了树的操作,要先介绍几个用到的对象,通过这些对象能够更好的完成DOM对XML的操作。在介绍这些数据类型之前首先给出DOM在内存中的树的一个基本结构。
Document-----------Document Type
|_______Element-----------Element
|____Attr
|____Text
上面只是一个简单的图,在这个图中,Element是可以嵌套的,另外树种还要包含实体注释等内容。在DOM的处理过程中,类似于上面树中的每一个节点,都是一个Node对象。这个Node对象可以看成是我们学习数据结构时树的节点,通过他可以获得它的孩子节点,父节点。由于XML还拥有属性,同时XML拥有的属性和子节点都可以使多个,所以DOM还提供了两个类NodeList,NamedNodeMap这两个类可以很方便的处理多个节点。通过Node的getChilds()可以得到一个NodeList这个NodeList中包含了Node的所有子节点,通过Node的getAttributes()方法可以获得该节点的所有属性,这个方法的返回值是NamedNodeMap通过对这个返回值的遍历可以获得所有的属性值。
通过这些获得了DOM树的节点但是如何处理哪?怎样才能知道他是什么类型,元素还是实体,或者是其他类型哪?这正是接下来要处理的问题。从DOM数中取出的每一个节点都有对应的一个类型,可以通过Node中的getNodeType()方法来获得,同时在Node接口中有XML中所有元素的类型,只要是用你得到的节点的NodeType与已知的类型进行比较就能知道他是什么类型,不同的类型作不同的处理。一般来说都是用一个switch()…case语句对DOM树中的所有节点进行处理。
如果要完成对DOM树的添加删除修改等操作,那就需要具备一定的数据结构知识,这里就不详细介绍了,处理方法和树一样,这不过是树,而不是二叉树。如果是数据的修改比较容易,可是结构的修改就比较麻烦了。完成了对DOM树修改之后如何才能把它写回到文件中去哪,要知道树并不是串行的,但是写入的文件却是串行的。所以这就需要用到一种遍历的方法。但是这种遍历的方法和树结构的建立有关,因为建立时不管怎样都是Document在根部的,所以遍历的方法用到的也是处理树传统方式递归。处理流程是这样的:
1、 处理Document节点。
2、 用相同的方法处理他的孩子节点。
3、 对每种节点都用相同的方法处理他们的孩子节点,形成递归。知道遍历完整棵树。
下面是一个具体的例子,只不过这个例子中,我无论如何也不能写入数据或者读出数据还忘高手能够指教,先行谢过了。
import org.w3c.dom.*;
import org.w3c.dom.Document;
import org.apache.xerces.impl.xs.dom.DOMParser;
import java.io.*;
import org.xml.sax.*;
public class DomOutput {
private DOMParser parser = new DOMParser();
private Document doc;
public DomOutput() {
}
private void init()
{
try {
parser.parse("first1.xml");
doc = parser.getDocument();
FileWriter fw = new FileWriter("second.xml");
serialize(doc,fw);
fw.close();
}
catch (IOException ex) {
ex.printStackTrace();
}
catch (SAXException ex) {
ex.printStackTrace();
}
}
public void serialize(Document docu,Writer writer)
{
serialize(docu,writer,"");
try {
writer.flush();
}
catch (IOException ex) {
ex.printStackTrace();
}
}
private void serialize(Node node,Writer writer,String indentLevel)
{
try
{
switch (node.getNodeType()) {
case Node.DOCUMENT_NODE:
writer.write("<?xml version = \"1.0\"?>\n");
Document doc1 = (Document) node;
serialize(doc1.getDocumentElement(),writer,"");
break;
case Node.ELEMENT_NODE:
String name = node.getNodeName();
String names = name;
String value = "";
NamedNodeMap nnm = node.getAttributes();
for(int i = 0 ; i < nnm.getLength(); i++)
{
name+=" "+nnm.item(i).getNodeName()+"=\""+nnm.item(i).getNodeValue()+"\"";
}
writer.write("<"+name+">");
NodeList childs = node.getChildNodes();
if(childs != null && childs.getLength()>0 && childs.item(0).getNodeType() == Node.ELEMENT_NODE)
{
for(int i = 0 ; i < childs.getLength(); i++)
serialize(childs.item(i),writer,"");
}
else
{
value = node.getNodeValue();
if(value == null)
value = "";
}
writer.write(value+"</"+names+">\n");
break;
case Node.TEXT_NODE:
writer.write(node.getNodeValue());
System.out.println(node.getNodeValue());
break;
default:
break;
}
}catch(IOException ex){
ex.printStackTrace();
}
}
public static void main(String[] args) {
DomOutput domOutput = new DomOutput();
domOutput.init();
}
}
在上面这个例子中使用的XML文件和SAX中用的相同这里就不再贴出了,对于用DOM来建立心数主要是利用了Element类的appendChild()方法来添加新的节点。下面也给出一个简单的例子,不过这个例子要用到上面例子中的船行化的方法,所以最好把他们放在相同的目录下。
package TestDom;
import org.w3c.dom.DOMImplementation;
import org.apache.xerces.dom.DOMImplementationImpl;
import org.w3c.dom.Document;
import org.w3c.dom.*;
import java.io.FileWriter;
import java.io.*;
public class CreateDom {
public CreateDom() {
}
private void Init()
{
DOMImplementation domImpl = new DOMImplementationImpl();
Document doc = domImpl.createDocument(null,"item",null);
Element ele = doc.getDocumentElement();
Element item1 = doc.createElement("name");
item1.setAttribute("id","001");
Text item1text = doc.createTextNode("This is a test");
item1.appendChild(item1text);
ele.appendChild(item1);
Element item2 = doc.createElement("name");
item2.setAttribute("id","002");
item2.setNodeValue("Pencil");
Text item2text = doc.createTextNode("Test2");
item2.appendChild(item2text);
ele.appendChild(item2);
DomOutput out = new DomOutput();
try {
out.serialize(doc, new FileWriter("third.xml"));
}
catch (IOException ex) {
ex.printStackTrace();
}
}
public static void main(String[] args) {
CreateDom dom = new CreateDom();
dom.Init();
}
}
在创建过程中我遇到了相同的问题就是无法写入数据,如果哪位朋友能帮我搞定这个问题小弟不胜感激,刚刚学习XML就出来献丑,实在惭愧,不过这也算是学习过程中的一点心得,写出来希望能够对别人有所帮助,同时也为了使自己能够加深理解。DOM在这里只是介绍了他的比较简单的使用方法,算是入门吧,后续章节中讲给出DOM的一些高级知识。