dom4j是一种解析XML文档的开放源代码的XML框架。从性能上来说,这个框架已经远远的超过了W3C DOM、JDOM了。而且,dom4j支持XPath。
dom4j的API里面包含一个解析XML文档的工具,我们使用这个解析器创建一个示例XML文档,清单1.catalog.xml。然后使用同一个解析器修改catalog.xml,清单2是修改生的XML文档,catalog-modified.xml。
清单1.示例XML文档(catalog.xml)
<?xml version="1.0" encoding="UTF-8"?> <catalog> <!--An XML Catalog--> <?target instruction?> <journal title="XML Zone" publisher="IBM developerWorks"> <article level="Intermediate" date="December-2001"> <title>Java configuration with XML Schema</title> <author> <firstname>Marcello</firstname> <lastname>Vitaletti</lastname> </author> </article> </journal> </catalog>
清单2.修改后的XML文档(catalog-modified.xml)
<?xml version="1.0" encoding="UTF-8"?> <catalog> <!--An XML catalog--> <?target instruction?> <journal title="XML Zone" publisher="IBM developerWorks"> <article level="Introductory" date="October-2002"> <title>Create flexible and extensible XML schemas</title> <author> <firstname>Ayesha</firstname> <lastname>Malik</lastname> </author> </article> </journal> </catalog>
1:使用DocumentHelper类创建一个文档实例。DocumentHelper是生成XML文档节点的dom4j API 工厂类。
Document document = DocumentHelper.createDocument();
2:使用addElement()方法创建根元素catalog。addElement()用于向XML文档中啬元素。
Element catalogElement = document.addElement("catalog");
3:在catalog元素中使用addComment()方法添加注释“An XML catalog”。
catalogElement.addComment("An XML catalog");
4:在catalog元素中使用addProcessingInstruction()方法增加一个处理指令。
catalogElement.addProcessingInstruction("target","text");
5:在catalog元素中使用addElement()方法啬journal元素。
Element journalElement = catalogElement.addElement("journal");
6:使用addAttribute()方法向journal元素添加title和publisher属性。
journalElement.addAttribute("title", "XML Zone");
journalElement.addAttribute("publisher", "IBM developerWorks");
7:向journal元素中添加article元素,并添加level和date属性。
Element articleElement=journalElement.addElement("article")
.addAttribute("level", "Intermediate")
.addAttribute("date", "December-2001");
8:向article元素中添加title元素,author元素。
Element titleElement=articleElement.addElement("title"); titleElement.setText("Java configuration with XML Schema"); Element authorElement=articleElement.addElement("author"); Element firstNameElement=authorElement.addElement("firstname"); firstNameElement.setText("Marcello"); Element lastNameElement=authorElement.addElement("lastname"); lastNameElement.setText("Vitaletti");
9:还可以用addDocType()方法向文件加入文档类型说明
document.addDocType("catalog",null,"file://c:/Dtds/catalog.dtd");
这样就会身XML文档中添加文档类型说明:
<!DOCTYPE catalog SYSTEM “file://c:/Dtds/catalog.dtd">
如果文档 要作用文档类型定义(DTD)文档验证则必须有Doctype。
10:把Document写入文件
try { XMLWriter output = new XMLWriter(new FileWriter("e:/catalog.xml")); output.write(document); output.close(); } catch (IOException e) { System.out.println(e.getMessage()); }
经过以上10个过程,我们创建了catalog.xml文档。下面我们把catalog.xml修改一下,并生成catalog-modified.xml。
1:使用 SAXReader 解析 XML 文档 catalog.xml:
SAXReader saxReader = new SAXReader();
Document documentOld = saxReader.read(new File("e:/catalog.xml"));
2:使用XPath表达式从article元素中获得level节点列表,如果level属性值是“Intermediate”则改为“Introductory”。
List list = documentOld.selectNodes("//article/@level" ); Iterator iter=list.iterator(); while(iter.hasNext()){ Attribute attribute=(Attribute)iter.next(); if(attribute.getValue().equals("Intermediate")) attribute.setValue("Introductory"); }
3:修改title
/* * 1:遍历所有article元素 * 2:遍历article元素下的title元素 * 3:比较修改 */ list = document.selectNodes("//article"); iter = list.iterator(); while (iter.hasNext()) { Element element = (Element) iter.next(); Iterator iterator = element.elementIterator("title"); while (iterator.hasNext()) { Element titleElement1 = (Element) iterator.next(); if (titleElement1.getText().equals( "Java configuration with XML Schema")) titleElement1 .setText("Create flexible and extensible XML schema"); } }
以过多次修改,得到catalog-modified.xml的Document对象,再写入文件!
从上面的例子,我们可以看出,dom4j里最常用的几个地方是:
1:枚举(Iterator)
// 枚举所有子节点 for ( Iterator i = root.elementIterator(); i.hasNext(); ) { Element element = (Element) i.next(); // do something } // 枚举名称为foo的节点 for ( Iterator i = root.elementIterator("foo"); i.hasNext();) { Element foo = (Element) i.next(); // do something } // 枚举属性 for ( Iterator i = root.attributeIterator(); i.hasNext(); ) { Attribute attribute = (Attribute) i.next(); // do something }
2:递归
public void treeWalk(Element element) { for (int i = 0, size = element.nodeCount(); i < size; i++) { Node node = element.node(i); if (node instanceof Element) { treeWalk((Element) node); } else { // do something.... } } }
3:得到想要的节点的对象,对XPath的良好支持
public void bar(Document document) { List list = document.selectNodes("//foo/bar"); Node node = document.selectSingleNode("//foo/bar/author"); String name = node.valueOf("@name"); }
例如,如果你想查找XHTML 文档中所有的超链接,下面的代码可以实现:
public void findLinks(Document document) throws DocumentException { List list = document.selectNodes( //a/@href ); for (Iterator iter = list.iterator(); iter.hasNext(); ) { Attribute attribute = (Attribute) iter.next(); String url = attribute.getValue(); } }
4:XML----String转换
// XML 转字符串 Document document = ...; String text = document.asXML(); // 字符串转XML String text = "<person><name>James</name></person>"; Document document = DocumentHelper.parseText(text);
下面的例子,是一个运用递归,复制文件的例子:
Dom4jDemo2 dom4jDemo = new Dom4jDemo2(); // ------------源--------------- SAXReader saxReader = new SAXReader(); Document docSource = saxReader.read(new File("e:\\jcmReponse.xml")); Element rootSource = docSource.getRootElement(); // ------------目标------------- Document docTarget = DocumentHelper.createDocument(); Element rootTarget = docTarget.addElement(rootSource.getNamespacePrefix() +":"+rootSource.getName()); dom4jDemo.treeWalk(iteratorSource,return1); dom4jDemo.writeNewXml(docTarget, "e:\\b.xml"); // 写入 public void writeNewXml(Document doc, String fileName) { try { OutputFormat format = OutputFormat.createPrettyPrint(); XMLWriter writer = new XMLWriter(new FileWriter(fileName), format); writer.write(doc); writer.close(); } catch (IOException e) { e.printStackTrace(); } } // 递归 private void treeWalk(Element element, Element targetE) { for (int i = 0, size = element.nodeCount(); i < size; i++) { Node node = element.node(i); Element eTemp = null; if (node instanceof Element) { String nameSpacePrefix = ((Element) node).getNamespacePrefix(); if(nameSpacePrefix == null || "".equals(nameSpacePrefix)) eTemp = targetE.addElement(node.getName()); else eTemp = targetE.addElement(nameSpacePrefix + ":"+ node.getName()); eTemp.setText(node.getText()); for (Iterator ite = ((Element) node).attributeIterator(); ite.hasNext();) { Attribute atr = (Attribute) ite.next(); eTemp.addAttribute(atr.getNamespacePrefix() + ":" + atr.getName(), atr.getValue()); } treeWalk((Element) node, eTemp); } } }