因为最近做一个考试系统项目的需要,开始学习XML.
XML在java中的使用越来越广泛,掌握几种常用的XML解析器十分有必要。目前XML主要的解器有DOM,SAX和JDOM.
DOM是一套为合法的Well-Formed文件设计的API应用程序接口,它同时定义了这些文件的逻辑结构,访问和操作方法.由W3C制定,目标是提供一个可以通用于各种程序语言,操作系统和应用程序的API,所以DOM具有极高的兼容性.
SAX(Simple Application interface for XML)是一个为基于事件XML解析器定义的,可以免费获得的,与平台语言无关的API,它允许程序和脚本动态的访问和更新文档的内容,结构和风格.
JDOM是两位著名的 Java 开发人员兼作者,Brett Mclaughlin 和 Jason Hunter 的创作成果,它是一个开源项目,它基于树型结构,利用纯Java的技术对XML文件实现解析,生成,序列化以及其他许多操作.JDOM直接为Java编程服务,它利用强有力的Java语言的诸多特性,把SAX和DOM的功能有效地结合起来,在使用设计上尽可能地隐藏原来使用过程中的复杂性.
对于DOM和SAX在API中能直接找到,其中包含了三个软件包:
·org.w3c.dom ,W3C 推荐的用于 XML 标准规划文档对象模型的 Java 工具
·org.xml.sax ,用于对 XML 进行语法分析的事件驱动的简单 API
·javax.xml.parsers ,工厂化工具,允许应用程序开发人员获得并配置特殊的语法分析器工具 JDOM 能够替换
JDOM是一个开源项目,使用时需要导入jdom.jar到库中。相对于直接使用API中的解析器,JDOM使用起来要更简单得多。JDOM 在2000年的春天被Brett McLaughlin和Jason Hunter开发出来,以弥补DOM及SAX在实际应用当中的不足之处。下面我们通过一个实际的例子,分别使用两种方式实现解析xml的试题文件来比较两者的不同。
本次需要解析的XML文件Item.xml
<?xml version="1.0" encoding="UTF-8"?>
<list>
<item id="1">
<answer>C</answer>
<level>1</level>
<question>在下列存储器中,访问速度最快的是:_______
A) 硬盘存储器
B) 软盘存储器
C) 半导体RAM(内存储器)
D) 磁带存储器</question>
<questionType>基础题</questionType>
</item>
<item id="2">
<answer>D</answer>
<level>1</level>
<question>下面是关于微型计算机操作的四条叙述,其中正确的一条是:_______
A)系统不会用输入日期做任何事,可以随便输入过去一个日期作当天日期
B) 用户每键入一个字符时,DOS就立即将其读取并识别之
C) 启动DOS系统时,如不想输入新时间,用户只按下任意键就行
D)软盘可以在切断电源之前取出来,也可以在切断电源之后取出来</question>
<questionType>基础题</questionType>
</item>
</list>
同过使用DOM和SAX对Item.xml进行解析DomExample.java
package action; /** * * @author weiqishaonian */ import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.util.logging.Level; import java.util.logging.Logger; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; //下面主要是org.xml.sax包的类 import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; public class DomExample { private Document doc; private InputStream is = null; public DomExample(String xmlFilePath) { try { DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();//(1)得到DOM解析器的工厂实例 DocumentBuilder db = dbf.newDocumentBuilder();//(2)从DOM工厂获得DOM解析器 is = new FileInputStream(xmlFilePath);//(3)把要解析的XML文档转化为输入流,以便DOM解析器解析它 doc = db.parse(is);//(4)解析XML文档的输入流,得到一个Document Element emt = doc.getDocumentElement();//(5)得到XML文档的根节点 NodeList list = emt.getChildNodes();//(6)得到节点的子节点 if (list != null) { for (int i = 0; i < list.getLength(); i++) { Node item = list.item(i); if (item.getNodeType() == Node.ELEMENT_NODE) { //(7)取得节点的属性值 String id = item.getAttributes().getNamedItem("id").getNodeValue(); System.out.println(id); //(8)轮循子节点 for (Node node = item.getFirstChild(); node != null; node = node.getNextSibling()) { if (node.getNodeType() == Node.ELEMENT_NODE) { if (node.getNodeName().equals("answer")) { String answer = node.getFirstChild().getNodeValue();//得到试题答案 System.out.println(answer); } if (node.getNodeName().equals("level")) { String level = node.getFirstChild().getNodeValue();//得到试题等级 System.out.println(level); } if (node.getNodeName().equals("question")) { String question = node.getFirstChild().getNodeValue();//得到试题 System.out.println(question); } if (node.getNodeName().equals("questionType")) { String questionType = node.getFirstChild().getNodeValue();//得到试题类型 System.out.println(questionType); } } } } } } is.close(); } catch (SAXException ex) { Logger.getLogger(ItemXMLParser.class.getName()).log(Level.SEVERE, null, ex); } catch (IOException ex) { Logger.getLogger(ItemXMLParser.class.getName()).log(Level.SEVERE, null, ex); } catch (ParserConfigurationException ex) { Logger.getLogger(ItemXMLParser.class.getName()).log(Level.SEVERE, null, ex); } } public static void main(String[] args) { System.out.println("==========================================="); new DomExample("D:/item.xml"); System.out.println("==========================================="); } }
运行结果:
run-single:
===========================================
1
C
1
在下列存储器中,访问速度最快的是:_______
A) 硬盘存储器
B) 软盘存储器
C) 半导体RAM(内存储器)
D) 磁带存储器
基础题
2
D
1
下面是关于微型计算机操作的四条叙述,其中正确的一条是:_______
A)系统不会用输入日期做任何事,可以随便输入过去一个日期作当天日期
B) 用户每键入一个字符时,DOS就立即将其读取并识别之
C) 启动DOS系统时,如不想输入新时间,用户只按下任意键就行
D)软盘可以在切断电源之前取出来,也可以在切断电源之后取出来
基础题
===========================================
BUILD SUCCESSFUL (total time: 0 seconds)
同过使用JDOM对Item.xml进行解析JDomExample.java
package action; /** * * @author weiqishaonian */ import java.io.FileInputStream; import java.io.IOException; import java.util.List; import java.util.logging.Level; import java.util.logging.Logger; import org.jdom.Document; import org.jdom.Element; import org.jdom.JDOMException; import org.jdom.input.SAXBuilder; public class JDomExample { public JDomExample(String xmlFilePath) { try { SAXBuilder sb = new SAXBuilder();// Document doc = sb.build(new FileInputStream(xmlFilePath)); Element root = doc.getRootElement(); //得到根元素 List items = root.getChildren(); //得到根元素所有子元素的集合 for (int i = 0; i < items.size(); i++) { Element item = (Element) items.get(i); //得到第i个item元素 System.out.println(item.getAttribute("id").toString()); Element answer = item.getChild("answer"); //得到试题答案 System.out.println(answer.getText()); Element level = item.getChild("level"); //得到试题等级 System.out.println(level.getText()); Element question = item.getChild("question"); //得到试题 System.out.println(question.getText()); Element questionType = item.getChild("questionType"); //得到试题类型 System.out.println(questionType.getText()); } } catch (JDOMException ex) { Logger.getLogger(JDomExample.class.getName()).log(Level.SEVERE, null, ex); } catch (IOException ex) { Logger.getLogger(JDomExample.class.getName()).log(Level.SEVERE, null, ex); } } public static void main(String[] args) { System.out.println("==========================================="); new JDomExample("D:/item.xml"); System.out.println("==========================================="); } }
运行结果:
run-single:
===========================================
[Attribute: id="1"]
C
1
在下列存储器中,访问速度最快的是:_______
A) 硬盘存储器
B) 软盘存储器
C) 半导体RAM(内存储器)
D) 磁带存储器
基础题
[Attribute: id="2"]
D
1
下面是关于微型计算机操作的四条叙述,其中正确的一条是:_______
A)系统不会用输入日期做任何事,可以随便输入过去一个日期作当天日期
B) 用户每键入一个字符时,DOS就立即将其读取并识别之
C) 启动DOS系统时,如不想输入新时间,用户只按下任意键就行
D)软盘可以在切断电源之前取出来,也可以在切断电源之后取出来
基础题
===========================================
BUILD SUCCESSFUL (total time: 0 seconds)
通过上面两个文件比较,我们可以明显的看出区别。JDOM解析要比使用DOM和SAX进行解析使用起来更简单,完成同样的功能用JDOM比使用DOM和SAX要少很多代码(请看DomExample.java和JDomExample.java文件),而且使用JDOM的代码看起来更为清晰。JDOM 直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念以及映射),把SAX和DOM的功能有效地结合起来。 Jdom是用Java语言读、写、操作XML的新API函数。Jason Hunter 和 Brett McLaughlin公开发布了它的1.0版本。在直觉、简单和高效的前提下,这些API函数被最大限度的优化。在接下来的篇幅里将介绍怎么用Jdom去读写一个已经存在的XML文档。在使用设计上尽可能地隐藏原来使用XML过程中的复杂性。利用JDOM处理XML文档将是一件轻松、简单的事。