dom4j读取xml内容(SAX+XPATH)

做项目过程中,遇到一些数据存储在XML文件中,解析过程当然不是一帆风顺,下面介绍下,我利用dom4j解析xml文件的方式:
1、利用SAX解析XML

SAXReader reader = new SAXReader();
Document doc = reader.read(path);//这里的path可以是一个文件路径也可以是一个http路径

2、利用xpath读取节点内容
我的xml文件的格式大致是这样子:

<book xmlns="http://docbook.org/ns/docbook" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xi="http://www.w3.org/2001/XInclude" xmlns:xlink="http://www.w3.org/1999/xlink" version="5.0">
<chapter>
    <para>123para>
    <para>456para>
    <para>789para>
chapter>
book>

当我利用dom4j提供的方法

List es = doc.selectNodes("/book/chapter/para");

此时会遇到获得的节点都为空,当然这里如果不是返回空而是直接报错,错误大致是:java.lang.NoClassDefFoundError: org/jaxen/JaxenException,如果遇到这样的错误请移步Dom4j使用XPATH报错:java.lang.NoClassDefFoundError: org/jaxen/JaxenException。
为什么会为空了,我们发现对于一般的xml文件,此方法是可行的,但是对于这里的文件格式,xml中添加了命名空间,这样我们就得换种方式获取某节点上的内容,代码大致如下:

Map map = new HashMap();
String nsURI = doc.getRootElement().getNamespaceURI();
map.put("xmlns", nsURI);
XPath x = doc.createXPath("//xmlns:book/xmlns:chapter");
x.setNamespaceURIs(map);
Node a = x.selectSingleNode(doc);
System.out.println(a.asXML());
System.out.println("<><><><><><><><><><><><><><><><><><><><><><><><><><><><>");
x = doc.createXPath("//xmlns:book/xmlns:chapter/xmlns:para");
x.setNamespaceURIs(map);
List<Node> b = x.selectNodes(doc);
for(Node e : b){
    System.out.println(e.asXML());
    System.out.println(e.getStringValue());
}

你可能感兴趣的:(dom4j,xpath,sax)