dom4j中使用Xpath 方法

在使用Dom4j解析xml文档时,我们很希望有一种类似正则表达式的东西来规范查询条件,而xpath正是这样一种很便利的规则吧.
以下是本人用写的一个类,摘取部分代码;

Java代码 复制代码
  1. String xmlName = path + "/" + userName + ".xml";  
  2.         // 定义需要返回的第一级菜单的名字集合  
  3.         List firstNames = new ArrayList();  
  4.         // Attribute的属性集合  
  5.         List attrs = new ArrayList();  
  6.         // 声明SAXReader  
  7.         SAXReader saxReader = new SAXReader();  
  8.         try {  
  9.             Document doc = saxReader.read(xmlName);  
  10.             // 获得所有grade=1的Element的text的值  
  11.             String xpath = "/tree/item";  
  12.             List list = doc.selectNodes(xpath);  
  13.             Iterator it = list.iterator();  
  14.             while (it.hasNext()) {  
  15.                 Element elt = (Element) it.next();  
  16.                 Attribute attr = elt.attribute("grade");  
  17.                 System.out.println(attr.getValue());  
  18.                 if (new Integer(attr.getValue()).intValue() == 1) {  
  19.                     attr = elt.attribute("text");  
  20.                     attrs.add(attr.getValue());  
  21.                     System.out.println(attr.getValue());  
  22.                 }  
  23.             }  
  24.   
  25.         } catch (DocumentException e) {  
  26.             e.printStackTrace();  
  27.         }  
  28.         return attrs;  



还有一个是获取某个节点下面里的所有第一级子节点,而不是所有的节点(包括子节点和孙节点).

Java代码 复制代码
  1. public static List getSecondMenuNames(String textName, String path,  
  2.             String userName) {  
  3.         String xmlName = path + "/" + userName + ".xml";  
  4.         String name = textName;  
  5.         // 定义需要返回的第二级菜单的名字集合  
  6.         List firstNames = new ArrayList();  
  7.         // Attribute的属性集合  
  8.         List attrs = new ArrayList();  
  9.         // 声明SAXReader  
  10.         SAXReader saxReader = new SAXReader();  
  11.         try {  
  12.             Document doc = saxReader.read(xmlName);  
  13.             // 这个xpath的意思是,获取text='系统管理'的一个Item下的所有Item的节点  
  14.             String xpath = "//item[@text='" + name + "']/child::*";  
  15.   
  16.             List list = doc.selectNodes(xpath);  
  17.             Iterator it = list.iterator();  
  18.             while (it.hasNext()) {  
  19.                 Element elt = (Element) it.next();  
  20.   
  21.                 Attribute attr = elt.attribute("grade");  
  22.                 System.out.println(attr.getValue());  
  23.   
  24.                 attr = elt.attribute("text");  
  25.                 System.out.println(attr.getValue());  
  26.                 attrs.add(attr.getValue());  
  27.             }  
  28.         } catch (Exception e) {  
  29.             e.printStackTrace();  
  30.         }  
  31.         return attrs;  
  32.     }  



注意看其中的xpath的写法,正是因为有了xpath,我们才能如此简单灵活的对xml进行操作.
刚刚使用xpath的时候可能会报一个错误:Exception in thread "main" java.lang.NoClassDefFoundError: org/jaxen/JaxenException
这时我们应该往CLASSPATH导入一个jar包,叫jaxen-1.1.1.jar,可从网上下载.

以下附上xpath的部分语法,具体可查看我的BOLG的链接,有一个叫xpath的.呵呵!

<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>
<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>
表达式 描述
节点名 选择所有该名称的节点集
/ 选择根节点
// 选择当前节点下的所有节点
. 选择当前节点
.. 选择父节点
@ 选择属性
示例
表达式 描述
bookstore 选择所有bookstore子节点
/bookstore 选择根节点bookstore
bookstore/book 在bookstore的子节点中选择所有名为book的节点
//book 选择xml文档中所有名为book的节点
bookstore//book 选择节点bookstore下的所有名为book为节点
//@lang 选择所有名为lang的属性
断言
在方括号中[],用来更进一步定位选择的元素
表达式 描述
/bookstore/book[1] 选择根元素bookstore的book子元素中的第一个
注意: IE5以上浏览器中第一个元素是0
/bookstore/book[last()] 选择根元素bookstore的book子元素中的最后一个
/bookstore/book[last()-1] 选择根元素bookstore的book子元素中的最后第二个
/bookstore/book[position()<3] 选择根元素bookstore的book子元素中的前两个
//title[@lang] 选择所有拥有属性lang的titile元素
//title[@lang='eng'] 选择所有属性值lang为eng的title元素
/bookstore/book[price>35.00] 选择根元素bookstore的book子元素中那些拥有price子元素且值大于35的
/bookstore/book[price>35.00]/title 选择根元素bookstore的book子元素中那些拥有price子元素且值大于35的title子元素
选择位置的节点
通配符 描述
* 匹配所有元素
@* 匹配所有属性节点
node() 匹配任何类型的节点
示例
表达式 描述
/bookstore/* 选择根元素bookstore的下的所有子元素
//* 选择文档中所有元素
//title[@*] 选择所有拥有属性的title元素

使用操作符“|”组合选择符合多个path的表达式

你可能感兴趣的:(thread,xml,浏览器,正则表达式)