Java程序员从笨鸟到菜鸟之(二十七)XML之Jdom和DOM4J解析 .

jdom解析

JDOM是一种使用XML的独特Java工具包,用于快速开发XML应用程序。它的设计包含Java语言的语法乃至语义。JDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。(http://jdom.org)

JDOM直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念等),把SAX和DOM的功能有效地结合起来。DOM是用Java语言读、写、操作XML的新API函数。在直接、简单和高效的前提下,这些API函数被最大限度的优化。在使用设计上尽可能地隐藏原来使用XML过程中的复杂性。利用JDOM处理XML文档将是一件轻松、简单的事。JDOM主要用来弥补DOM及SAX在实际应用当中的不足之处。这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能,而对于DOM来说,JAVA程序员在使用时来用起来总觉得不太方便。DOM的缺点主要是由于DOM是一个接口定义语言(IDL),它的任务是在不同语言实现中的一个最低的通用标准,并不是为JAVA特别设计的在JDOM中,XML元素就是Element的实例,XML属性就是Attribute的实例,XML文档本身就是Document的实例.JDOM是作为一种轻量级API被制定的,最主要的是它是Java为中心的。它在遵循DOM主要规则的基础上除去了dom本身的缺点。

因为JDOM对象就是像Document、Element和Attribute这些类的直接实例,因此创建一个新JDOM对象就如在Java语言中使用new操作符一样容易。JDOM的使用是直截了当的。JDOM使用标准的Java编码模式。只要有可能,它使用Javanew操作符而不使用复杂的工厂模式,使对象操作即便对于初学用户也很方便。

JDOM是由以下几个包组成的

–org.jdom包含了所有的xml文档要素的java类

–org.jdom.adapters包含了与dom适配的java类

–org.jdom.filter包含了xml文档的过滤器类

–org.jdom.input包含了读取xml文档的类

–org.jdom.output包含了写入xml文档的类

–org.jdom.transform包含了将jdomxml文档接口转换为其他xml文档接口

–org.jdom.xpath包含了对xml文档xpath操作的类

org.jdom这个包里的类是你解析xml文件后所要用到的所有数据类型。–Attribute–CDATA–Coment–DocType–Document–Element–EntityRef–Namespace–ProscessingInstruction

–Text

Jdom主要使用方法:

1.Document类

Document的操作方法:

Elementroot=newElement("GREETING");

Documentdoc=newDocument(root);

root.setText("HelloJDOM!");

或者简单的使用

Document doc=new Document(newElement("GREETING").setText("HelloJDOM!t"));

2.这点和DOM不同。Dom则需要更为复杂的代码,如下:

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 

DocumentBuilder builder =factory.newDocumentBuilder(); 

Document doc = builder.newDocument(); 

Element root =doc.createElement("root"); 

Text text = doc.createText("This is the root"); 

root.appendChild(text); 

doc.appendChild(root); 


3.可以使用SAXBuilder的build方法来解析一个流从而得到一个Document对象

–Document build(java.io.File file) 

–Document build(org.xml.sax.InputSource in) 

–Document build(java.io.InputStream in) 

–Document build(java.net.URL url) 


4.DOM的Document和JDOM的Document之间的相互转换使用方法

DOMBuilder builder = new DOMBuilder(); 

org.jdom.Document jdomDocument = builder.build(domDocument); 

–DOMOutputter converter = new DOMOutputter();// work with the JDOM document… 

–org.w3c.dom.Document domDocument = converter.output(jdomDocument); 

–// work with the DOM document… 


5.XMLOutPutter类:

JDOM的输出非常灵活,支持很多种io格式以及风格的输出

Document doc = new Document(...); 

XMLOutputter outp = new XMLOutputter(); 

outp.output(doc, fileOutputStream); // Raw output 

outp.setTextTrim(true); // Compressed output 

outp.output(doc, socket.getOutputStream()); 

outp.setIndent(" ");// Pretty output 

outp.setNewlines(true); 

outp.output(doc, System.out); 


DOM4J解析

DOM4J是dom4j.org出品的一个开源XML解析包,它是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。DOM4J使用起来非常简单。只要你了解基本的XML-DOM模型,就能使用。

它的主要接口都在org.dom4j这个包里定义:

Java程序员从笨鸟到菜鸟之(二十七)XML之Jdom和DOM4J解析 .

Java程序员从笨鸟到菜鸟之(二十七)XML之Jdom和DOM4J解析 .

看名字大致就知道它们的涵义如何了。下面咱一一看一下:

.Document对象,三种创建方法

1.读取XML文件,获得document对象.
SAXReaderreader=newSAXReader();
Documentdocument=reader.read(newFile("input.xml"));

2.解析XML格式的字符串,获得document对象.
Stringtext="<members></members>";
Documentdocument=DocumentHelper.parseText(text);
3.创建document空对象.
Documentdocument=DocumentHelper.createDocument();
Elementroot=document.addElement("members");//创建根节点,只有空DOCUMENT对象才能创建ROOT结点


.节点控制

1.获取文档的根节点.
Elementroot=document.getRootElement();
2.取得节点的文本
Stringtext=memberElm.getText();
也可以用:
Stringtext=root.elementText("name");//这个是取得根节点下的name字节点的文字;可以类推任何节点下的文本
3.设置节点文字.
ageElm.setText("29");
4.父节点下获得单个子节点对象.
ElementmemberElm=root.element("member");//"member"是节点名

5.取得父节点下遍历名为"member"的所有子节点.
Listnodes=rootElm.elements("member");
for(Iteratorit=nodes.iterator();it.hasNext();){
Elementelm=(Element)it.next();
//dosomething
}
6.父节点下的遍历所有子节点进行.
for(Iteratorit=root.elementIterator();it.hasNext();){
Elementelement=(Element)it.next();
//dosomething
}
7.父节点下添加子节点.
ElementageElm=newMemberElm.addElement("age");

8.父节点下删除子节点.
parentElm.remove(childElm);//childElm是待删除的节点,parentElm是其父节点

.属性相关.
1.取得某节点下的某属性
Elementroot=document.getRootElement();
Attributeattribute=root.attribute("size");//属性名name
2.取得属性的文字
Stringtext=attribute.getText();
也可以用:
Stringtext2=root.element("name").attributeValue("firstname");这个是取得根节点下name字节点的属性firstname的值.

3.遍历某节点的所有属性
Elementroot=document.getRootElement();
for(Iteratorit=root.attributeIterator();it.hasNext();){
Attributeattribute=(Attribute)it.next();
Stringtext=attribute.getText();
System.out.println(text);
}
4.设置某节点的属性和文字.
newMemberElm.addAttribute("name","sitinspring");
5.设置属性的文字
Attributeattribute=root.attribute("name");
attribute.setText("sitinspring");
6.删除某属性
Attributeattribute=root.attribute("size");//属性名name
root.remove(attribute);
.将文档写入XML文件.
1.文档中全为英文,不设置编码,直接写入的形式.
XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"));
writer.write(document);
writer.close();
2.文档中含有中文,设置编码格式写入的形式.
OutputFormatformat=OutputFormat.createPrettyPrint();
format.setEncoding("GBK");//指定XML编码
XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"),format);
writer.write(document);
writer.close();
.字符串与XML的转换
1.将字符串转化为XML
Stringtext="<members><member>sitinspring</member></members>";
Documentdocument=DocumentHelper.parseText(text);
2.将文档或节点的XML转化为字符串.
SAXReaderreader=newSAXReader();
Documentdocument=reader.read(newFile("input.xml"));
Elementroot=document.getRootElement();
StringdocXmlText=document.asXML();
StringrootXmlText=root.asXML();
ElementmemberElm=root.element("member");
StringmemberXmlText=memberElm.asXML();
.使用XPath快速找到节点.
读取的XML文档示例

<?xml version="1.0" encoding="UTF-8"?>
<projectDescription>
  <name>MemberManagement</name>
  <comment></comment>
  <projects>
    <project>PRJ1</project>
    <project>PRJ2</project>
    <project>PRJ3</project>
    <project>PRJ4</project>
  </projects>
  <buildSpec>
    <buildCommand>
      <name>org.eclipse.jdt.core.javabuilder</name>
      <arguments>
      </arguments>
    </buildCommand>
  </buildSpec>
  <natures>
    <nature>org.eclipse.jdt.core.javanature</nature>
  </natures>
</projectDescription>



使用XPath快速找到节点project.

public static void main(String[] args){
    SAXReader reader = new SAXReader();
    try{
      Document  doc = reader.read(new File("sample.xml")); 
      List projects=doc.selectNodes("/projectDescription/projects/project");
     //Element nodes0=xmlDoc.selectSingleNode("/bookstore"); //采用相对路径,即当前结点(包括当前结点)开始查找,与下列结果相同.
     //Element nodes=nodes0.selectNodes("book");      ////采用绝对路径,即当前结点(包括当前结点)开始查找,
     //XPATH语法详见: http://www.w3school.com.cn/xpath/xpath_syntax.asp
      Iterator it=projects.iterator(); 
      while(it.hasNext()){
        Element elm=(Element)it.next();      
        System.out.println(elm.getText());
      }
    }
    catch(Exception ex){
       ex.printStackTrace();
    }
  }


推荐阅读:

Java程序员从笨鸟到菜鸟之(二十九)javascript对象的创建和继承实现

Java程序员从笨鸟到菜鸟之(二十八)Javascript总结之语言基础

你可能感兴趣的:(dom4j)