上次说到如果XML文件的层次比较多,直接通过 getChild() 方法获得元素将会是一件很痛苦的事情,用XPATH来处理就方便多了。JDOM从V1.0bata10版中,已经加入了对XPATH
的支持。(拖了好久,今天总算是补上了。)
XPATH基础
XPATH遵循文档对象模型(DOM)的路径格式,基本语法由表达式构成。在计算表达式的值之后产生一个对象,这种对象有以下四种基本类型:节点集合、布尔型、数字型和字符
串型。XPATH基本上和在文件系统中寻找文件类似,如果路径是以"/"开头的,就表明该路径表示的是一个绝对路径,这和在UNIX系统中关于文件路径的定义是一致的。以"//"开头
则表示在文档中的任意位置查找。
以样例XML文档(friends.xml)为例来了解XPATH:
<?xml version="1.0" encoding="UTF-8"?>
<friends comment="Friends List">
<friend number="1">
<name>zoof</name>
<sex value="male" />
<phone>87654321</phone>
</friend>
<friend number="2">
<name>joe</name>
<sex value="male" />
<phone>87654322</phone>
</friend>
<friend number="3">
<name>joe</name>
<sex value="female" />
<phone>87654323</phone>
</friend>
</friends>
在XML文档中使用位置路径表达式来查找信息,这些表达式有很多种组成方式。一般我们用得最多的恐怕是 节点元素 查找。XPATH中用正斜杠(/)来分隔子结点,返回所有与
模式相匹配的元素。下面以几个 表达式 的例子来说明一下返回结果:
表达式:/friends/friend
返回:根元素friends下所有的 friend 元素(或节点)。(当然本例只有一个啦!)
表达式:/friends/*
返回:根元素friends下所有的元素(或节点)。(“*”相当于通配符,表示“所有”的)
表达式://friend
返回:任意元素(或节点)下的所有 friend 元素(或节点)。(注意:不仅仅是1中 根元素friends下面的friend元素,如果存在的话)
表达式:/friends/friend[@number='1']
返回:根元素下元素名称为 friend,number属性为'1'的全部元素(或节点)。(对于元素或节点的附加元素,比如属性,函数等都要用方括号"[]"扩起来,属性前面要加
上"@"号)
表达式:/friends/friend/phone[text()='87654321']
返回:元素friends/friend下电话号码为 87654321 的全部元素。(text()是XPATH的函数,功能是取出当前节点的文本内容,即content。)
表达式://name/parent::*
返回:name元素的所有父元素(或节点)。(parent::* 表示这个元素的所有的父节点的集合)
上面的介绍对于我们一般的应用基本上够用了,如果你需要进一步的深入,请查看W3C发布的关于XAPH的官方资料。
JDOM+XPATH应用
现在我们开始使用XPATH结合JDOM来操作XML文件了。JDOM的关于XPATH的api只有一个类:Xpath.java,在org.jdom.xpath这个包中。这个类中的核心方法主要是两个静态方法
selectNodes()和selectSingleNode()。前者根据一个xpath语句返回一组节点:List;后者根据一个xpath语句返回符合条件的第一个节点:Object。
public static List selectNodes(Object arg1,String arg2) throws org.jdom.JDOMException;
public static Object selectSingleNode(Object arg1,String arg2) throws org.jdom.JDOMException;
在使用XPATH之前,请先确定你的classpath路径里面有如下几个JAR包,如果没有,请从JDOM的发行包中lib目录下copy:
saxpath.jar
jaxen-core.jar
jaxen-jdom.jar
样列JAVA代码:
/*
* Created on 2004-11-17
*
* TODO To change the template for this generated file go to
* Window - Preferences - Java - Code Style - Code Templates
*/
package cyberobject.com.xpath;
import java.io.IOException;
import java.util.List;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.Text;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;
import org.jdom.xpath.XPath;
/**
* @author wanghua
*
* TODO To change the template for this generated type comment go to
* Window - Preferences - Java - Code Style - Code Templates
*/
public class XpathSample {
public static void main(String[] args) throws JDOMException, IOException{
SAXBuilder sb = new SAXBuilder();
Document doc = sb.build("friends.xml");
Element root = doc.getRootElement();
List list = XPath.selectNodes(root,"/friends/friend");
System.out.println("[info] Friends List:");
for(int ii = 0; ii < list.size(); ii++){
Element element = (Element)list.get(ii);
String number = element.getAttributeValue("number");
//String name = element.getChildText("name");
String name = ( (Text) XPath.selectSingleNode(element,"//friend[@number='" + number + "']/name/text()")).getTextNormalize();
//String sex = element.getChild("sex").getAttributeValue("value");
String sex = ((Element)XPath.selectSingleNode(element,"//friend[@number='" + number + "']/sex")).getAttributeValue("value");
//String phone = element.getChildText("phone");
String phone = ( (Text) XPath.selectSingleNode(element,"//friend[@number='" + number + "']/phone/text()")).getText();
System.out.println("No."+number);
System.out.println(" Name:[" + name + "]");
System.out.println(" Sex:[" + sex + "]");
System.out.println(" Phone:[" + phone + "]");
System.out.println();
}
System.out.println("[info] End of Friends List.");
}
}
输出结果:
[info] Friends List:
No.1
Name:[zoof]
Sex:[male]
Phone:[87654321]
No.2
Name:[joe]
Sex:[male]
Phone:[87654322]
No.3
Name:[joe]
Sex:[female]
Phone:[87654323]
[info] End of Friends List.