Dom4j操作xml

操作XML的几种方式

1.DOM生成和解析XML文档
为 XML 文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)。

2.SAX生成和解析XML文档 
为解决DOM的问题,出现了SAX。SAX ,事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。优点:不用事先调入整个文档,占用资源少;SAX解析器代码比DOM解析器代码小,适于Applet,下载。缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;使用场合:Applet;只需XML文档的少量内容,很少回头访问;机器内存少;

3.DOM4J生成和解析XML文档 
DOM4J 是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。

 4.JDOM生成和解析XML 
为减少DOM、SAX的编码量,出现了JDOM;优点:20-80原则,极大减少了代码量。使用场合:要实现的功能简单,如解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。

 

Dom4j操作xml

一.Document对象相关

1.读取XML文件,获得document对象.
Dom4j操作xml             SAXReader reader = new SAXReader();
Dom4j操作xml             Document   document = reader.read(new File("input.xml"));

2.解析XML形式的文本,得到document对象.
Dom4j操作xml             String text = "<members></members>";
Dom4j操作xml             Document document = DocumentHelper.parseText(text);
3.主动创建document对象.
Dom4j操作xml             Document document = DocumentHelper.createDocument();
Dom4j操作xml             Element root = document.addElement("members");// 创建根节点
二.节点相关

1.获取文档的根节点.
Dom4j操作xmlElement rootElm = document.getRootElement();
2.取得某节点的单个子节点.
Dom4j操作xmlElement memberElm=root.element("member");// "member"是节点名
3.取得节点的文字
Dom4j操作xmlString text=memberElm.getText();也可以用:
Dom4j操作xmlString text=root.elementText("name");这个是取得根节点下的name字节点的文字.

4.取得某节点下名为"member"的所有字节点并进行遍历.
Dom4j操作xmlList nodes = rootElm.elements("member");
Dom4j操作xml
Dom4j操作xml Dom4j操作xmlfor (Iterator it = nodes.iterator(); it.hasNext();)  Dom4j操作xml{
Dom4j操作xml    Element elm = (Element) it.next();
Dom4j操作xml   // do something
Dom4j操作xml}
5.对某节点下的所有子节点进行遍历.
Dom4j操作xml Dom4j操作xml            for(Iterator it=root.elementIterator();it.hasNext();) Dom4j操作xml{
Dom4j操作xml                 Element element = (Element) it.next();
Dom4j操作xml                // do something
Dom4j操作xml             }
6.在某节点下添加子节点.
Dom4j操作xmlElement ageElm = newMemberElm.addElement("age");
7.设置节点文字.
Dom4j操作xmlageElm.setText("29");
8.删除某节点.
Dom4j操作xmlparentElm.remove(childElm);// childElm是待删除的节点,parentElm是其父节点
9.添加一个CDATA节点.
Dom4j操作xml         Element contentElm = infoElm.addElement("content");
Dom4j操作xml         contentElm.addCDATA(diary.getContent());

三.属性相关.
1.取得某节点下的某属性
Dom4j操作xml             Element root=document.getRootElement();    
Dom4j操作xml             Attribute attribute=root.attribute("size");// 属性名name
2.取得属性的文字
Dom4j操作xml             String text=attribute.getText();也可以用:
Dom4j操作xmlString text2=root.element("name").attributeValue("firstname");这个是取得根节点下name字节点的属性firstname的值.

3.遍历某节点的所有属性
Dom4j操作xml             Element root=document.getRootElement();    
Dom4j操作xml Dom4j操作xml            for(Iterator it=root.attributeIterator();it.hasNext();) Dom4j操作xml{
Dom4j操作xml                 Attribute attribute = (Attribute) it.next();
Dom4j操作xml                 String text=attribute.getText();
Dom4j操作xml                 System.out.println(text);
Dom4j操作xml             }
4.设置某节点的属性和文字.
Dom4j操作xmlnewMemberElm.addAttribute("name", "sitinspring");
5.设置属性的文字
Dom4j操作xml             Attribute attribute=root.attribute("name");
Dom4j操作xml             attribute.setText("sitinspring");
6.删除某属性
Dom4j操作xml             Attribute attribute=root.attribute("size");// 属性名name
Dom4j操作xml             root.remove(attribute);
四.将文档写入XML文件.
1.文档中全为英文,不设置编码,直接写入的形式.
Dom4j操作xmlXMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
Dom4j操作xmlwriter.write(document);
Dom4j操作xmlwriter.close();
2.文档中含有中文,设置编码格式写入的形式.
Dom4j操作xml             OutputFormat format = OutputFormat.createPrettyPrint();
Dom4j操作xml             format.setEncoding("GBK");    // 指定XML编码        
Dom4j操作xml             XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);
Dom4j操作xml            
Dom4j操作xml             writer.write(document);
Dom4j操作xml             writer.close();
五.字符串与XML的转换
1.将字符串转化为XML
Dom4j操作xmlString text = "<members> <member>sitinspring</member> </members>";
Dom4j操作xmlDocument document = DocumentHelper.parseText(text);
2.将文档或节点的XML转化为字符串.
Dom4j操作xml             SAXReader reader = new SAXReader();
Dom4j操作xml             Document   document = reader.read(new File("input.xml"));            
Dom4j操作xml             Element root=document.getRootElement();                
Dom4j操作xml             String docXmlText=document.asXML();
Dom4j操作xml             String rootXmlText=root.asXML();
Dom4j操作xml             Element memberElm=root.element("member");
Dom4j操作xml             String memberXmlText=memberElm.asXML();
 
总结:

* DocumentHelper是一个文档助手类(工具类),它可以完成文档、元素、文本、属性、注释、CDATA、Namespace、XPath的创建,以及利用XPath完成文档的遍历和将文本转换成Document;

parseText完成将xml字符串转换成Doc的功能

Document doc = DocumentHelper.parseText("<root></root>");

createDocument创建一个文档

Document doc = DocumentHelper.createDocument();

如果带参数就会创建一个带有根元素的文档

 

createElement创建一个元素

Element el = DocumentHelper.createElement("el");

* Document的addElement方法可以给当前文档添加一个子元素

Element root = doc.addElement("catalog");

* addComment方法可以添加一段注释

root.addComment("An XML Catalog");

为root元素添加一段注释

 

* addProcessingInstruction添加一个标记

root.addProcessingInstruction("target", "instruction");

为root元素添加一个标记

 

* new BaseElement可以创建一个元素

Element journalEl = new BaseElement("journal");

 

* addAttribute添加属性

journalEl.addAttribute("title", "XML Zone");

* add添加一个元素

root.add(journalEl);

将journalEl元素添加到root元素中

 

* addElement添加一个元素,并返回当前元素

Element articleEl = journalEl.addElement("article");

给journalEl元素添加一个子元素article

 

* setText、addText可以设置元素的文本

authorEl.addElement("firstname").setText("Marcello");
authorEl.addElement("lastname").addText("Vitaletti");

* addDocType可以设置文档的DOCTYPE

doc.addDocType("catalog", null,file://c:/Dtds/catalog.dtd);

* asXML可以将文档或元素转换成一段xml字符串

doc.asXML();
root.asXML();

* XMLWriter类可以把文档写入到文件中

output = new XMLWriter(new FileWriter(new File("file/catalog.xml")));
output.write(doc);
output.close();

 

你可能感兴趣的:(dom4j)