DOM编程详解

DOM编程详解
以Sun公司的JAXP为例来看看其中和DOM相关的包:

DOM包结构

   org.w3c.com:定义了DOM的接口。这是w3c所指制定的DOM规范,因为DOM规范是与语言无关的,因而其中只是定义了接口,而没有实现任何地类。任何具体的DOM实现需要有其它的类库给出。

   javax.xml.parser:定义了DocumentBuilderFactory类DocumentBuilder类。编程时用DocumentBuilderFactory来生成一个具体的和具体的类库相联系的DocumentBuilder类的实例,然后再由这个DocumentBuilder对象来生成一个Document实例。Document对象中就包含了DOM的树模型结构,是DOM模型的根。同SAXParserFactory一样,具体的DocumentBuilder对象的建立,取决于一个环境变量javax.xml.parsers.DocumentBuilderFactory的值,同样的,也可以直接把类名传递给DocumentBuilderFactory来建立一个DocumentBuilder。

   com.sun.xml.tree:Sun的Java XML的DOM实现,他对标准的DOM提供了一些扩展,其中大部分的东西并不是DOM标准。包括了XMLDocument,ElementNode, XMLDocumentBuilder和TreeWalker等类。XMLDocument类实现了DOM的Document界面,它同样也提供了静态的工厂方法来建立一个Document对象。ElementNode类代表了在一个DOM树中的每一个节点元素,并且它经常被继承,来实现一些自定的功能。 而XMLDocumentBuilder实际上是一个DocumentHandler类型的类,也就是说,它接受一个SAX解析器传递过来的事件,然后根据这些事件来在内存中建立一个DOM模型。

DOM处理过程

   DOM的处理过程相对SAX而言要简单些,先用DocumentBuilderFactory的静态方法newInstance()建立一个DocumentBuilderFactory的实例,然后用它的newDocumentBuilder()方法建立一个DocumentBuilder。然后可以用DocumentBuilder的parser()方法来解析一个XML文档并建立DOM模型。在JAXP中还提供了更为方便的功能扩展,就是使用XMLDocument。你可以为一个SAX解析器注册一个事件处理器XMLDocumentBuilder,在解析过后,可以调用XMLDocumentBuilder的getDocument()方法就可以把一个外在地XML文档转换成一个内存中的DOM树了,并生成一个Document(XMLDocument)对象,后面的工作,就是调用XMLDocument对象和ElementNode对象的各个方法来对DOM树进行操作了。最后,还可以调用XMLDocument的wirte()方法来把DOM树输出为XML文件。因为在标准的DOM模型中并没有提供与write()相类似的方法,所以要处理输出的话,用XMLDocument会更方便些。

实例DOM

   下面我们可以来看看例子了。

首先当然是import语句:


import javax.xml.parsers.DocumentBuilderFactory; 

import javax.xml.parsers.FactoryConfigurationError; 

import javax.xml.parsers.ParserConfigurationException;

import javax.xml.parsers.DocumentBuilder;
   为了能给你更多的印象,我详细内出了所有的类,实际上你只需要一句就可以了:

import javax.xml.parsers.*;

你还需要的是W3C对DOM和DOM例外的定义:

import org.w3c.dom.Document; import org.w3c.dom.DOMException;
还有一些其他的用来进行例外和I/O处理的类:


import org.xml.sax.SAXException; 

import org.xml.sax.SAXParseException;

import java.io.File;

import java.io.IOException;



因为要输出XML文档,所以还要引入XMLDocument:



import com.sun.xml.tree.XmlDocument; 

public class DomEcho{



在程序逻辑中,因为要处理DOM模型,所以当然首先应该申明一个Document对象:



static Document document;

public static void main (String argv [])

{

if (argv.length != 1) {

            System.err.println ("Usage: java DomEcho filename";

            System.exit (1);

        }
   用DocumentBuilderFactory类的静态方法newInstance()来创建一个工厂实例,之所以称为工厂,是由于再这儿应用到了设计模式(Design Pattern)中的工厂模式,实际上在Java类库中设计模式的范例随处可见,如果能够对设计模式有一些了解,就会很容易为Java庞杂的类库理出一条条脉络分明的经线。
        DocumentBuilderFactory factory =

           DocumentBuilderFactory.newInstance();

        try {

           DocumentBuilder builder = factory.newDocumentBuilder();

           document = builder.parse( new File(argv[0]) );
   前面说过,DOM标准模型中并没有定义输出的接口,因而如果需要进行文档输出的话,就需要用到JAXP的扩展,使用到XmlDocument。这儿有一个较为简便的方法,就是用强制类型转换,把一个Document类转换成XmlDocument,然后,就可以使用XmlDocument的write()方法了:
           XmlDocument xdoc = (XmlDocument) document;

           xdoc.write (System.out);
   在后面的都是例外的处理了,在DOM中虽然有定义了DOMException,但是DOMException只是用在遍历和操作DOM树时引发的例外。在解析文档和初始化解析器时所引发的例外,还是借助于SAX中的例外处理方法,以使程序上具有一致性:

        } catch (SAXParseException spe) {

             // 处理解析过程中生成的例外

           System.out.println ("\n** Parsing error"

              + ", line " + spe.getLineNumber ()

              + ", uri " + spe.getSystemId ());

           System.out.println("   " + spe.getMessage() );

           Exception  x = spe;

           if (spe.getException() != null)

               x = spe.getException();

           x.printStackTrace();

        } catch (SAXException sxe) {

           // 处理一般的程序例外或者解析器初始化时引发的例外

           Exception  x = sxe;

           if (sxe.getException() != null)

               x = sxe.getException();

           x.printStackTrace();

        } catch (IOException ioe) {

           // IO例外

           ioe.printStackTrace();

        }

    }

   这而对DOM讲的比较简略,但是基本的程序结构我们已经可以从中看出来了。

你可能感兴趣的:(DOM编程详解)