Java解析XML文档——dom解析xml

一、前言
  
  用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。
  
  JAXP接口包含了三个包:
  
  (1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
  
  (2)org.xml.sax  用于对XML进行语法分析的事件驱动的XML简单API(SAX)
  
  (3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。
  
  二、前提
  
  DOM编程不要其它的依赖包,因为JDK里自带的JDK里含有的上面提到的org.w3c.dom、org.xml.sax 和javax.xml.parsers包就可以满意条件了。
  
  三、使用DOM解析XML文档
  

  我们现在来看看DOM是如何解析XML的吧!下面是一个简单的XML文件:


F:\book.xml

 

<?xml version="1.0" encoding="gb2312"?>

<books>

 <book author="kok">

  <name>java编程思想</name>

  <price>108</price>

 </book>

</books>

 


基本的根元素、属性、子节点都有,下面用JAVA解析这个XML

package com.donen.test;



import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;



import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;



public class ReadXml {

    

    public static void main(String[] args) throws Exception

    {

        //得到DOM解析器的工厂实例

        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

        //从DOM工厂获得DOM解析器

        DocumentBuilder db = dbf.newDocumentBuilder();

        /*

         * 解析XML文档的输入流,得到一个Document。有三个常用的重载方法

         * db.parse(File f) 文件

         * db.parse(InputStream is) 流

         * db.parse(String uri) 直接填写网页url 或者 本地文件路径  F:\\book.xml

         */

        Document d = db.parse("F:\\test.xml");

        //得到XML文档的根节点

        Element root = d.getDocumentElement();

        //得到节点

        NodeList nl = root.getChildNodes();

        //得到节点的子节点

        for (int i = 0; i < nl.getLength(); i++) {

            Node book = nl.item(i);

            //轮循子节点

            for (Node node = book.getFirstChild(); node != null; node = node.getNextSibling()) {

                //节点的属性都是为Node.ELEMENT_NODE

                if(node.getNodeType() == Node.ELEMENT_NODE)

                    //DOM把<name>java编程思想</name>也当作是两层结构的节点,其父节点是<name>,子节点java编程思想才是我们真正想得到的。所以去的值使用:book.getFirstChild().getNodeValue()

                    System.out.println(node.getNodeName() + "---" + node.getFirstChild().getNodeValue());

            }

        }

    }

}

 

你可能感兴趣的:(dom解析xml)