xml的Jdom解析过程详解

JDOM与DOM类似,也是一组用于解析XML的API,它本身不是一个解析器,默认的它内置了Apache的Xerces解析器;JDOM与DOM不同的是,DOM是跨语言的一套API,Java世界中有很多DOM的解析器,同样的.Net中也一样内置了DOM的实现,但是JDOM是专门为Java打造的一批API,JDOM采用了Java中的Collection架构来封装集合,是Java爱好者更加熟悉的模式。
 
JDOM的核心类
JDOMException
Document <- DocType
         <- Comment
         <- ProcessingInstruction
         <- Element <- Attribute
                    <- Comment
                    <- ProcessingInstruction
                    <- CDATA
                    <- Text
                    <- EntityRef
 
JDOM对外都是具体类,无需工厂
Element、Attribute、ProcessingInstruction、Comment和其他类都可以直接通过new来声明实例,不需要工厂了,具有使用方便的一面,但同时也限制了扩展,这些暂且不做讨论,我们关心的如何使用,而不是如何优化它的设计。
    Eement rootElem = new Element("root");
    Document doc = new Document(rootElem);
就这么简单,一个JDOM的Document对象产生了。
 
JDOM的输入
JDOM的输入允许各种类型,如SAX事件、DOM文档、JDBC的ResultSet、文件、Stream、远程URI等等,这里先研究最简单也是最常用的两种(SAXBuilder,DOMBuilder)。
//SAXBuilder构建一个JDOM的Document
SAXBuilder builder = new SAXBuilder();
Document doc = builder.build(new FileInputStream("text.xml"));
//DOMBuilder构建一个JDOM的Document
DOMBuilder builder = new DOMBuilder();
Document doc = builder.build(aDOMDocument);
记住:只有当输入是一个DOM的Document的时候,才采用DOMBuilder,否则SAXBuilder是首选。原因不是DOMBuilder不能接受其他参数,而是性能问题。在实现中与SAXBuilder比起来,DOMBuilder绕了一个圈子,所以理论上说性能必有影响。
 
JDOM的输出
JDOM有专门的输入类XMLOutputer,SAXOutputer,DOMOutputer。与允许各种输入一样,JDOM通过这些类允许各种输出。如输出一个DOM的Document,输出XML文件,输入Stream等等,方法很简单,都是通过output()的重载方法来实现,具体产看JavaDoc即可。一个简单的例子:
XMLOutputer outputer = new XMLOutputer("  ",true,"UTF-8");
outputer.output(jdomDocument, new FileOutputStream("result.xml"));
这里的XMLOutputer的构造有几种:
    public XMLOutputer();
    public XMLOutputer(String indent);
    public XMLOutputer(String indent, boolean newLines);
    public XMLOutputer(String indent, boolean newLines,
                       String encoding);
其中indent为每行的缩进字符;newLines自动换行,如果为false则所有的输出都在一行,可读性很差;encoding为编码,即中的UTF-8。
 
JDOM的常用API
1. Document
doc.getContent()与doc.setContent(child)可以为Document添加任何类型的节点,其实不止是Document可以,其他可以有子节点的节点都可以,如Element。
2. Element
与DOM不同,Element下无需获得Text就可以直接获取元素文本,尽管JDOM的内部实现依然是存在Text节点的,但是从使用这个角度来说elem.getText()与elem.setText("val")这样的方式还是方便了很多。
与DOM一样,Element中可以不通过Attribute节点直接操作属性,elem.getAttribute("key")和elem.setAttribte("key","value")
3. 其他
其他的参照JavaDoc即可了,没有什么特别的。
 
----- 值得注意的地方-----
1.关于添加节点的顺序
通过如下代码为根元素添加一个注释:
Element rootElem = new Element("Root");
Document doc = new Document(rootElem);
Comment comm = new Comment("This is a comment Test");
doc.addContent(comm);
表面看上去没什么问题,但是结果会是如下状况:
   
   
        ...
    
   
问题应该可以看出来了,原因是doc.addContent(comm),comm在doc之后。但是没有doc又无法添加comm,这似乎有些矛盾,怎么办呢?我们可以采用如下办法:
doc.getContent.add(0,comment);
这与List的insert()有异曲同工之效,即指定了comment的位置是0,即最前面。 
===================================================================================

使用JDOM解析XML(转载,简单又详细)

一、前言
     JDOM是Breet Mclaughlin和Jason Hunter两大Java高手的创作成果,2000年初,JDOM作为一个开放源代码项目正式开始研发。JDOM是一种解析XML的Java工具包。

     DOM适合于当今流行的各种语言,包括Java,JavaScripte,VB,VBScript,Perl,C,C++等。它了为HTML和XML文档提供了一个可应用于不同平台的编程接口。W3C DOM的最新信息可从http://www.w3.org/TR2001/WD-DOM-Lever-3-Core-20010913查阅。微软在http://msdn.microsoft.com/library/default.asp?url=/library/en-us/xmlsdk30/htm/xmconxmldomuserguide.asp上也有DOM的详细技术信息。

    DOM的设计为了适用于不同的语言,它保留了不同语言中非常相似的API。但是它并不适合于Java编程者的习惯。而JDOM作为一种轻量级API被制定,它最核心的要求是以Java为中心,只适合于Java语言,它遵循DOM的接口主要规则,除去了DOM中为了兼容各语言而与Java习惯的不同。

二、使用JDOM的前提条件
    须要有SAX、DOM解析器的类文件,JDOM只是一种适合Java程序员来使用的Java XML解析器,目前流行的Java XML解析器还有:Apache Xerces Java、JAXP。
Xerces Java解析器是完全用Java编写的XML解析器,最新版本是2.5,它支持以下标准和API:
(1) XML1.0规范(第二版本)
(2) XML命名空间规范
(3) DOM2核心标准规范
(4) SAX2核心扩展
(5) JAXP1.2 :是Sun提供的使用Java处理XML的接口API。
(6) XML Schema结构和数据类型标准

       还有最好的是它开放源代码,我们可以在http://xml.apache.org/dist/xerces-j/ 处去下载。下载文件Xerces-J-bin.2.5.0.zip。
解压下载文件,得到四个压缩包加到项目的路径中(其实不要全加,但不熟的情况下考虑这么做)。
JDOM的二进制版本下载:http://www.jdom.org/downloads/index.html
把解压后的jdom.jar文件加到项目的类路径中,另外便于调试,还要下载它的源代码。

三、使用JDOM解析XML
      好了,现在该是正题了。下面通过一个简单的例子说明一下怎么用JDOM这一适合Java程序员习惯的工具包来解析XML文档。
为了简单,我用了如下XML作为要解析的XML文件:


   
      rjzjh
      60.0
  


够简单的吧,但它对于我们关心的东西都有了,子节点,属性。
下面是用于解析这个XML文件的Java文件:

1 public class JDomParse {
2 public JDomParse(){
3  String xmlpath="library.xml";
4  SAXBuilder builder=new SAXBuilder(false);
5  try {
6   Document doc=builder.build(xmlpath);
7   Element books=doc.getRootElement();
8   List booklist=books.getChildren("book");
9   for (Iterator iter = booklist.iterator(); iter.hasNext();) {
10    Element book = (Element) iter.next();
11    String email=book.getAttributeValue("email");
12    System.out.println(email);
13    String name=book.getChildTextTrim("name");
14    System.out.println(name);
15    book.getChild("name").setText("alterrjzjh");
16    
17   }
18   
19   XMLOutputter outputter=new XMLOutputter();
20   outputter.output(doc,new FileOutputStream(xmlpath));
21   
22  } catch (JDOMException e) {
23   e.printStackTrace();
24  } catch (IOException e) {
25   e.printStackTrace();
26  }
27 }
28 public static void main(String[] args) {
29  new JDomParse();
30 }
31}
不到30行代码,现在我对代码解释一下:
四、解释代码
引用的类:
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.Iterator;
import java.util.List;
//下面是引用到JDOM中的类
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;
import org.jdom.output.XMLOutputter;
(1)使用JDOM首先要指定使用什么解析器。如:
         SAXBuilder builder=new SAXBuilder(false); 这表示使用的是默认的解析器
(2)得到Document,我们以后要进行的所有操作都是对这个Document操作的:
         Document doc=builder.build(xmlpath);
(3)得到根元素:
         Element books=doc.getRootElement();
在JDOM中所有的节点(DOM中的概念)都是一个org.jdom.Element类,当然他的子节点也是一个org.jdom.Element类。
(4)得到元素(节点)的集合:
       List booklist=books.getChildren("book");
这表示得到“books”元素的所在名称为“book”的元素,并把这些元素都放到一个List集合中
(5)轮循List集合
      for (Iterator iter = booklist.iterator(); iter.hasNext();) {
        Element book = (Element) iter.next();
     }
还有一种轮循方法是:
     for(int i=0;I       Element book=(Element)booklist.get(i);
     }
(6)取得元素的属性:
     String email=book.getAttributeValue("email");
    取得元素book的属性名为“email”的属性值。
(7)取得元素的子元素(为最低层元素)的值:
     String name=book.getChildTextTrim("name");
     注意的是,必须确定book元素的名为“name”的子元素只有一个。
(8)改变元素(为最低层元素)的值:
     book.getChild("name").setText("alterrjzjh");
     这只是对Document的修改,并没有在实际的XML文档中进行修改
(9)保存Document的修改到XML文件中:
    XMLOutputter outputter=new XMLOutputter();
     outputter.output(doc,new FileOutputStream(xmlpath));

我们先要有一个XMLOutputter类,再把已经修改了的Document保存进XML文档中。
到此。用JDOM解析和处理XML文档讲解完了,麻雀虽小,五脏俱全。现在已对JDOM有个整体上的概念了吧

你可能感兴趣的:(XML学习&实践篇)