DOM详解

 

DOM

一、XML解析技术概述

 1.XML解析方式分为两种:dom和sax

  (1)dom:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。

  (2) sax:(Simple API for XML) 不是官方标准,但它是 XML 社区事实上的标准,几乎所有的 XML 解析器都支持它。

 2. XML解析器

    Crimson、Xerces 、Aelfred2

    XML解析开发包

Jaxp、Jdom、dom4j

   (1)JAXP

        JAXP 开发包是J2SE的一部分,它由javax.xml、org.w3c.dom 、org.xml.sax 包 及其子包组成

在 javax.xml.parsers 包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。

   (2)使用JAXP进行DOM解析

javax.xml.parsers 包中的DocumentBuilderFactory用于创建DOM模式的解析器对象 , DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。

   (3)获得JAXP中的DOM解析器

调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。

调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。

调用 DOM 解析器对象的 parse() 方法解析 XML 文档,得到代表整个文档的 Document 对象,进行可以利用DOM特性对整个XML文档进行操作了。

   (4)DOM编程

DOM模型(document object model)

DOM解析器在解析XML文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)。

在dom中,节点之间关系如下:

位于一个节点之上的节点是该节点的父节点(parent)

一个节点之下的节点是该节点的子节点(children)

同一层次,具有相同父节点的节点是兄弟节点(sibling)

一个节点的下一个层次的节点集合是节点后代(descendant)

父、祖父节点及所有位于节点上面的,都是节点的祖先(ancestor)

节点类型(下页ppt)

   (5)Node对象

Node对象提供了一系列常量来代表结点的类型,当开发人员获得某个Node类型后,就可以把Node节点转换成相应的节点对象(Node的子类对象),以便于调用其特有的方法。(查看API文档)

Node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个XML文档的内容、或添加、修改、删除XML文档的内容了

二、DOM方式解析XML文件

   1.更新XML文档

       javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象 转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用   这个对象,当然也可以把Document对象又重新写入到一个XML文件中。

Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。 我们可以通过:

javax.xml.transform.dom.DOMSource类来关联要转换的document对象,

用javax.xml.transform.stream.StreamResult 对象来表示数据的目的地。

Transformer对象通过TransformerFactory获得。

  2.实例

(1)

public class Demo02 {

    public static void main(String[] args) throws                           ParserConfigurationException, SAXException, IOException {

        //获取dom解析的工厂

        DocumentBuilderFactory factory =                                        DocumentBuilderFactory.newInstance();

        //是否删除空格  false true

        factory.setIgnoringElementContentWhitespace(true);

        //获取解析器

        DocumentBuilder builder = factory.newDocumentBuilder();

        //把xml文档输入到解析器中,并获取xml文档对应的document对象

        //Document document = builder.parse(new                                 //File("D:\\workspace\\20110309\\src\\book.xml"));

        //Document document = builder.parse(new File("src\\book.xml"));

        Document document = builder.parse(new                                   File("src\\cn\\csdn\\dom\\book.xml"));

        System.out.println(document.getDocumentURI());

        findNode(document);

    }

    //查询book元素中name元素第一个值

    private static void findNode(Document document) {

        NodeList nodeList = document.getElementsByTagName("name");

        System.out.println(nodeList.getLength());

        Node node = nodeList.item(0);  

        System.out.println(node.getTextContent());

    }

}

(2)

public class Demo03 {

    public void ready() {

    }

    // 遍历所有的xml文档中的内容

    @Test

    public void test1() throws Exception {

        // 第一步:获取DocumentBuilderFactory工厂

        DocumentBuilderFactory factory =                                        DocumentBuilderFactory.newInstance();

        // 设置去掉空格的方法

        factory.setIgnoringElementContentWhitespace(true);

        // 获取解析器

        DocumentBuilder builder = factory.newDocumentBuilder();

        // 解析xml文档

        Document document = builder.parse(new File("src\\dom.xml"));

        //获取根节点对象

        Element root = document.getDocumentElement();

        /*//获取根节点元素名称

        String tagname = root.getTagName();

        System.out.println("根节点的名称是:"+root.getTagName());*/

        //调用Node中的getChildNodes()获取根节点的子节点

        NodeList Nlist = root.getChildNodes();

        //遍历该子节点

        display(Nlist);

    }

    //使用递归遍历个子节点中的子节点

    public void display(NodeList Nlist){

        for (int i = 0; i <Nlist.getLength(); i++) {

            Node node = Nlist.item(i);

            System.out.println(node.getNodeName());

            if(node.hasChildNodes()){//判断该节点是否还有子节点

                NodeList list = node.getChildNodes();

                display(list);  //调用方法本身

            }else{

                if(node.getNodeType()==Node.TEXT_NODE){ //判断节点类型

                System.out.println("         "+node.getTextContent());

                }      

                //当没有子节点时跳出

                break;

            }

        }

    }

}

     (3)

public class Demo04 {

    @Test

    /**解析商丘的人口这个这个属性*/

    public void test1()throws Exception{

        DocumentBuilderFactory factory =                                        DocumentBuilderFactory.newInstance();      

        DocumentBuilder builder  = factory.newDocumentBuilder();

        Document document = builder.parse(new File("src\\dom.xml"));

        NodeList list = document.getElementsByTagName("商丘");     

        Node node = list.item(0);

        if(node.getNodeType()== Node.ELEMENT_NODE){

            Element element = (Element)node;

            String value = element.getAttribute("人口");

           System.out.println("属性的值是:"+value);

        }      

    }  

    @Test

    public void test2()throws Exception{

DocumentBuilderFactory factory =    DocumentBuilderFactory.newInstance();      

        DocumentBuilder builder  = factory.newDocumentBuilder();   

        Document document = builder.parse(new File("src\\dom.xml"));

        Element element =  document.getElementById("attr");    

        String value = element.getAttribute("id");

        String value1 = element.getAttribute("人口");

           System.out.println("属性的值是:"+value+"   "+value1);

    }

}

(4)

public class Demo05 {  

    @Test

    public void test2()throws Exception{

        DocumentBuilderFactory factory =                                        DocumentBuilderFactory.newInstance();

//      factory.setIgnoringElementContentWhitespace(true);

        DocumentBuilder builder  = factory.newDocumentBuilder();

        Document doc = builder.newDocument();      

        doc.setXmlVersion("1.0");      

        Comment comment = doc.createComment("创建xml文件");       

        doc.appendChild(comment);      

        Element root = doc.createElement("学生");      

        Element name = doc.createElement("姓名");

        name.appendChild(doc.createTextNode("rrrr"));

        Element sex = doc.createElement("性别");       

        sex.setAttribute("name", "男");    

        root.appendChild(name);

        root.appendChild(sex);

       

        doc.appendChild(root);     

        TransformerFactory factory1 = TransformerFactory.newInstance();

        Transformer tformer = factory1.newTransformer();

        tformer.transform(new DOMSource(doc), new                               StreamResult("src\\ds.xml"));      

    }

}

  (5)

public class Demo06 {

    @Test

    public void test()throws Exception{

            DocumentBuilderFactory factory =                                            DocumentBuilderFactory.newInstance();

//          factory.setIgnoringElementContentWhitespace(true);

            DocumentBuilder builder  = factory.newDocumentBuilder();

            Document doc = builder.parse(new File("src\\dom.xml"));

            Element element = doc.createElement("东北旺"); 

            element.appendChild(doc.createTextNode("家"));

            Node node = doc.getElementsByTagName("海淀").item(0);

            node.appendChild(element);

            TransformerFactory factory1 = TransformerFactory.newInstance();

            Transformer tformer = factory1.newTransformer();

            tformer.transform(new DOMSource(doc), new                                   StreamResult("src\\dom.xml"));

    }

    @Test

    public void test1()throws Exception{

        DocumentBuilderFactory factory =                                            DocumentBuilderFactory.newInstance();

//          factory.setIgnoringElementContentWhitespace(true);

        DocumentBuilder builder  = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("src\\dom.xml"));

        Node node = doc.getElementsByTagName("海淀").item(0);

        node.removeChild(doc.getElementsByTagName("东北旺").item(2));

        TransformerFactory factory1 = TransformerFactory.newInstance();

        Transformer tformer = factory1.newTransformer();

        tformer.transform(new DOMSource(doc), new                                   StreamResult("src\\dom.xml"));

    }

    @Test

    public void test2()throws Exception{

        DocumentBuilderFactory factory =                                            DocumentBuilderFactory.newInstance();

//          factory.setIgnoringElementContentWhitespace(true);

        DocumentBuilder builder  = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("src\\dom.xml"));

        Node node1 = doc.getElementsByTagName("东北旺").item(0);

        node1.setTextContent("杀人");      

        TransformerFactory factory1 = TransformerFactory.newInstance();

        Transformer tformer = factory1.newTransformer();

        tformer.transform(new DOMSource(doc), new                                   StreamResult("src\\dom.xml"));

    }

}

(6)book.xml

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE books[

   <!ELEMENT books (book*)>

   <!ELEMENT book (name,author,price)>

   <!ELEMENT name (#PCDATA)>

   <!ELEMENT author (#PCDATA)>

   <!ELEMENT price (#PCDATA)> 

   <!ATTLIST name length CDATA #IMPLIED> 

]>

<books>

  <book>

     <name length="123">XML介绍</name>

     <author>rrrr</author>

     <price>100000</price>

  </book>

   <book>

     <name>XML介绍1</name>

     <author>rrrrr</author>

     <price>100000</price>

  </book>

</books>

作者:Java958199586 发表于2012-2-21 7:34:16 原文链接
阅读:57 评论:0 查看评论

你可能感兴趣的:(dom)