Dom4j解释和生成XML文件

一、生成XML文件

public static String authcode(Document doc, BusinessServer businessServer)
  {
    if (doc == null) {
      doc = DocumentHelper.createDocument();
    }
    doc.setXMLEncoding("gbk");
    Element imccElement = doc.addElement("imcc");
    
    Element commandElement = addElement(imccElement, "command");
    
    Element codeElement = addElement(commandElement, "code");
    codeElement.setText(businessServer.getHeader().getCommand());
    
    Element requestElement = addElement(imccElement, "request");
    
    Element imtypeElement = addElement(requestElement, "im-type");
    imtypeElement.setText(businessServer.getHeader().getImtype()+"");
    
    Element hosttelElement = addElement(requestElement, "host-tel");
    hosttelElement.setText(businessServer.getHeader().getHosttel());
    
    Element msgflagElement = addElement(requestElement, "msg-flag");
    msgflagElement.setText(businessServer.getHeader().getMsgflag()+"");
    
    return doc.asXML();
  }
生成的代码示例

<imcc>
<span style="white-space:pre">	</span><command>
<span style="white-space:pre">		</span><code>getauthcode</code>
<span style="white-space:pre">	</span></command>
<span style="white-space:pre">	</span><request>
<span style="white-space:pre">		</span><im-type>4</im-type>
<span style="white-space:pre">		</span><host-tel>10004</host-tel>
<span style="white-space:pre">		</span><msg-flag>162</msg-flag>
    <span style="white-space:pre">	</span></request>
</imcc>
解释测试代码

import java.io.ByteArrayInputStream;
import java.io.UnsupportedEncodingException;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;


public class domparse {
	private static SAXReader reader = new SAXReader();
      public static void main(String str[]){
    	  String xml ="<?xml version=\"1.0\" encoding=\"gbk\"?>"
      +"<imcc><result><code>0</code><reason></reason></result><response>"
    			  +"<authorization-code>0652b8865e5a10ed289f3f458d92c56e4dfb8cb6389aecdd962c25c6e831ae78</authorization-code></response></imcc>";
    	  System.out.println("xml is: "+xml);
    	  Document doc = DocumentHelper.createDocument();
    	  String tag="authorization-code";
    	  String result=null;
    	  try {
			result=analyzeModel(doc,xml,tag);
		} catch (UnsupportedEncodingException | DocumentException e) {
			
			e.printStackTrace();
		}
    	  System.out.println("result: "+result);
      }
      public static  String analyzeModel(Document doc, String str, String tag)
    		    throws UnsupportedEncodingException, DocumentException
    		  {
    		    String xspmc = null;
    		    
    		    reader.setEncoding("gbk");
    		    doc = reader.read(new ByteArrayInputStream(str.getBytes("gbk")));
    		    List<Node> allNodeList = doc.selectNodes("//*");
    		    for (Node xmlTitleName : allNodeList) {
    		      if (xmlTitleName.getName().equals(tag)) {
    		        xspmc = xmlTitleName.getStringValue();
    		      }
    		    }
    		    return xspmc;
    		  }
}
xml is: <?xml version="1.0" encoding="gbk"?><imcc><result><code>0</code><reason></reason></result><response><authorization-code>0652b8865e5a10ed289f3f458d92c56e4dfb8cb6389aecdd962c25c6e831ae78</authorization-code></response></imcc>
result: 0652b8865e5a10ed289f3f458d92c56e4dfb8cb6389aecdd962c25c6e831ae78


二、注意一定要导入两个包 

dom4j-1.6.1.jar-306 KB

jaxen-1.1-beta-6.jar-238 KB

使用dom4j解析XML时,要快速获取某个节点的数据,使用XPath是个不错的方法,dom4j的快速手册里也建议使用这种方式,标题都写的这么阔气:Powerful Navigation with XPath。

方法是使用Document的selectNodes(String XPath)方法,代码写法:

List l = doc.selectNodes("//COLS/COL1");

List<Node> allNodeList = doc.selectNodes("//*");

执行时却抛出以下异常:

Exception in thread "main" java.lang.NoClassDefFoundError: org/jaxen/JaxenException
at org.dom4j.DocumentFactory.createXPath(DocumentFactory.java:230)
at org.dom4j.tree.AbstractNode.createXPath(AbstractNode.java:207)
at org.dom4j.tree.AbstractNode.selectNodes(AbstractNode.java:164)

这么好用的方法怎么能抛异常呢,一路跟踪过去看,竟然是“List l = doc.selectNodes("//COLS/COL1");”这句报错,查了一下才知道,不光要有dom4j这个包,还要有jaxen 包:<jaxen-1.1-beta-6.jar>-238 KB,这应该是dom4j的基础包,在dom4j的zip包的lib目录里可以找到。即使用这个方法需要以下两个包:

dom4j-1.6.1.jar-306 KB

jaxen-1.1-beta-6.jar-238 KB

三、解释时selectNodes()语法特性

XPath 是 XML 的内容,这里 SelectNodes 是 C# 中 XmlDocument 或 XmlNode 的一个方法。SelectNodes 使用 XPath 来选取节点。

重要语法

SelectNodes("item")

当前节点儿子节点中选择名称为 item 的节点。

SelectNodes("/item")

根节点儿子节点中选择名称为 item 的节点。

SelectNodes("//item")

任意位置的节点上选择名称为 item 的节点。要重点突出这个任意位置,它不受当前节点的影响,也就是说假如当前节点是在第 100 层(有点夸张),也可以选择第一层的名称为 item 的节点。

SelectNodes(".")

选择当前节点。

SelectNodes("..")

选择当前节点的父节点。

SelectNodes("//item[@name]")

在 SelectNodes("//item") 的基础上,增加了一个限制,就是要求拥有 name 属性。

SelectNodes("//item[@name='111']")

在 SelectNodes("//item[@name]") 的基础上,增加了一个限制,就是要求 name 属性值为 111。注意语法中有引号;如果没有引号,则表示是数字类型,对于数字类型可以使用大于号、小于号等,比如:SelectNodes("//item[@v>333]")。

SelectNodes("//item[1]")

选择第一个 item,注意是第一个,不是第二个。

还有这里是指亲兄弟间的第一个 item,也就是说:父级若有三个 item,则选择第一个;若父级第二个 item 的有两个名称同样为 item 的儿子,则第一个儿子会被选择出来;若父级第三个 item 的也有两个名称同样为 item 的儿子,则第一个儿子也会被选择出来……

SelectNodes("//item[last()-1]")

倒数第二个节点,同样是指亲兄弟间的倒数第二个。

SelectNodes("//item[position()<=2]")

位置为第一和第二的节点(第一个节点的 position() 为 1),同样是指亲兄弟间的位置。

SelectNodes("//@name")

SelectNodes("/root/item/@name") 取 item 的 name 属性

选择 name 属性,注意这下选择的是属性,而不是节点了。用 Value 属性获取属性集合的属性值。

SelectNodes("/root/item")

根节点 root 下的 item 儿子节点。

SelectNodes("/root//item")

根节点 root 下的不管是儿子、孙子、重孙子……,只要是名称为 item 的统统选取出来。

通配符

  • 可用 * 表示任意节点名称,比如 SelectNodes("/channel/*/item");
  • 用 @* 表示任意属性;
  • 用 node() 表示任意类型的节点;
  • 用 text() 表示文本类型的节点,实际上也就是表示取文本节点(元素节点下面是文本节点,文本节点下面才是文字)。

运算符

| 表示或。SelectNodes("//item|//channel"),选择 item 或 channel 节点。


你可能感兴趣的:(xml,dom4j,document,SAXReader)