jdom解析
JDOM是一种使用XML的独特Java工具包,用于快速开发XML应用程序。它的设计包含Java语言的语法乃至语义。JDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。(http://jdom.org)
JDOM直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念等),把SAX和DOM的功能有效地结合起来。DOM是用Java语言读、写、操作XML的新API函数。在直接、简单和高效的前提下,这些API函数被最大限度的优化。在使用设计上尽可能地隐藏原来使用XML过程中的复杂性。利用JDOM处理XML文档将是一件轻松、简单的事。JDOM主要用来弥补DOM及SAX在实际应用当中的不足之处。这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能,而对于DOM来说,JAVA程序员在使用时来用起来总觉得不太方便。DOM的缺点主要是由于DOM是一个接口定义语言(IDL),它的任务是在不同语言实现中的一个最低的通用标准,并不是为JAVA特别设计的。在JDOM中,XML元素就是Element的实例,XML属性就是Attribute的实例,XML文档本身就是Document的实例.JDOM是作为一种轻量级API被制定的,最主要的是它是以Java为中心的。它在遵循DOM主要规则的基础上除去了dom本身的缺点。
因为JDOM对象就是像Document、Element和Attribute这些类的直接实例,因此创建一个新JDOM对象就如在Java语言中使用new操作符一样容易。JDOM的使用是直截了当的。JDOM使用标准的Java编码模式。只要有可能,它使用Javanew操作符而不使用复杂的工厂模式,使对象操作即便对于初学用户也很方便。
JDOM是由以下几个包组成的
–org.jdom包含了所有的xml文档要素的java类
–org.jdom.adapters包含了与dom适配的java类
–org.jdom.filter包含了xml文档的过滤器类
–org.jdom.input包含了读取xml文档的类
–org.jdom.output包含了写入xml文档的类
–org.jdom.transform包含了将jdomxml文档接口转换为其他xml文档接口
–org.jdom.xpath包含了对xml文档xpath操作的类
org.jdom这个包里的类是你解析xml文件后所要用到的所有数据类型。–Attribute–CDATA–Coment–DocType–Document–Element–EntityRef–Namespace–ProscessingInstruction
–Text
Jdom主要使用方法:
1.Document类
Document的操作方法:
Elementroot=newElement("GREETING");
Documentdoc=newDocument(root);
root.setText("HelloJDOM!");
或者简单的使用
Document doc=new Document(newElement("GREETING").setText("HelloJDOM!t"));
2.这点和DOM不同。Dom则需要更为复杂的代码,如下:
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); DocumentBuilder builder =factory.newDocumentBuilder(); Document doc = builder.newDocument(); Element root =doc.createElement("root"); Text text = doc.createText("This is the root"); root.appendChild(text); doc.appendChild(root);
3.可以使用SAXBuilder的build方法来解析一个流从而得到一个Document对象
–Document build(java.io.File file) –Document build(org.xml.sax.InputSource in) –Document build(java.io.InputStream in) –Document build(java.net.URL url)
4.DOM的Document和JDOM的Document之间的相互转换使用方法
DOMBuilder builder = new DOMBuilder(); org.jdom.Document jdomDocument = builder.build(domDocument); –DOMOutputter converter = new DOMOutputter();// work with the JDOM document… –org.w3c.dom.Document domDocument = converter.output(jdomDocument); –// work with the DOM document…
5.XMLOutPutter类:
JDOM的输出非常灵活,支持很多种io格式以及风格的输出
Document doc = new Document(...); XMLOutputter outp = new XMLOutputter(); outp.output(doc, fileOutputStream); // Raw output outp.setTextTrim(true); // Compressed output outp.output(doc, socket.getOutputStream()); outp.setIndent(" ");// Pretty output outp.setNewlines(true); outp.output(doc, System.out);
DOM4J解析
DOM4J是dom4j.org出品的一个开源XML解析包,它是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。DOM4J使用起来非常简单。只要你了解基本的XML-DOM模型,就能使用。
它的主要接口都在org.dom4j这个包里定义:
看名字大致就知道它们的涵义如何了。下面咱一一看一下:
一.Document对象,三种创建方法
1.读取XML文件,获得document对象.
SAXReaderreader=newSAXReader();
Documentdocument=reader.read(newFile("input.xml"));
2.解析XML格式的字符串,获得document对象.
Stringtext="<members></members>";
Documentdocument=DocumentHelper.parseText(text);
3.创建document空对象.
Documentdocument=DocumentHelper.createDocument();
Elementroot=document.addElement("members");//创建根节点,只有空DOCUMENT对象才能创建ROOT结点
二.节点控制
1.获取文档的根节点.
Elementroot=document.getRootElement();
2.取得节点的文本
Stringtext=memberElm.getText();
也可以用:
Stringtext=root.elementText("name");//这个是取得根节点下的name字节点的文字;可以类推任何节点下的文本
3.设置节点文字.
ageElm.setText("29");
4.父节点下获得单个子节点对象.
ElementmemberElm=root.element("member");//"member"是节点名
5.取得父节点下遍历名为"member"的所有子节点.
Listnodes=rootElm.elements("member");
for(Iteratorit=nodes.iterator();it.hasNext();){
Elementelm=(Element)it.next();
//dosomething
}
6.父节点下的遍历所有子节点进行.
for(Iteratorit=root.elementIterator();it.hasNext();){
Elementelement=(Element)it.next();
//dosomething
}
7.父节点下添加子节点.
ElementageElm=newMemberElm.addElement("age");
8.父节点下删除子节点.
parentElm.remove(childElm);//childElm是待删除的节点,parentElm是其父节点
三.属性相关.
1.取得某节点下的某属性
Elementroot=document.getRootElement();
Attributeattribute=root.attribute("size");//属性名name
2.取得属性的文字
Stringtext=attribute.getText();
也可以用:
Stringtext2=root.element("name").attributeValue("firstname");这个是取得根节点下name字节点的属性firstname的值.
3.遍历某节点的所有属性
Elementroot=document.getRootElement();
for(Iteratorit=root.attributeIterator();it.hasNext();){
Attributeattribute=(Attribute)it.next();
Stringtext=attribute.getText();
System.out.println(text);
}
4.设置某节点的属性和文字.
newMemberElm.addAttribute("name","sitinspring");
5.设置属性的文字
Attributeattribute=root.attribute("name");
attribute.setText("sitinspring");
6.删除某属性
Attributeattribute=root.attribute("size");//属性名name
root.remove(attribute);
四.将文档写入XML文件.
1.文档中全为英文,不设置编码,直接写入的形式.
XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"));
writer.write(document);
writer.close();
2.文档中含有中文,设置编码格式写入的形式.
OutputFormatformat=OutputFormat.createPrettyPrint();
format.setEncoding("GBK");//指定XML编码
XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"),format);
writer.write(document);
writer.close();
五.字符串与XML的转换
1.将字符串转化为XML
Stringtext="<members><member>sitinspring</member></members>";
Documentdocument=DocumentHelper.parseText(text);
2.将文档或节点的XML转化为字符串.
SAXReaderreader=newSAXReader();
Documentdocument=reader.read(newFile("input.xml"));
Elementroot=document.getRootElement();
StringdocXmlText=document.asXML();
StringrootXmlText=root.asXML();
ElementmemberElm=root.element("member");
StringmemberXmlText=memberElm.asXML();
六.使用XPath快速找到节点.
读取的XML文档示例
<?xml version="1.0" encoding="UTF-8"?> <projectDescription> <name>MemberManagement</name> <comment></comment> <projects> <project>PRJ1</project> <project>PRJ2</project> <project>PRJ3</project> <project>PRJ4</project> </projects> <buildSpec> <buildCommand> <name>org.eclipse.jdt.core.javabuilder</name> <arguments> </arguments> </buildCommand> </buildSpec> <natures> <nature>org.eclipse.jdt.core.javanature</nature> </natures> </projectDescription>
使用XPath快速找到节点project.
public static void main(String[] args){ SAXReader reader = new SAXReader(); try{ Document doc = reader.read(new File("sample.xml")); List projects=doc.selectNodes("/projectDescription/projects/project"); //Element nodes0=xmlDoc.selectSingleNode("/bookstore"); //采用相对路径,即当前结点(包括当前结点)开始查找,与下列结果相同. //Element nodes=nodes0.selectNodes("book"); ////采用绝对路径,即当前结点(包括当前结点)开始查找, //XPATH语法详见: http://www.w3school.com.cn/xpath/xpath_syntax.asp Iterator it=projects.iterator(); while(it.hasNext()){ Element elm=(Element)it.next(); System.out.println(elm.getText()); } } catch(Exception ex){ ex.printStackTrace(); } }
推荐阅读:
Java程序员从笨鸟到菜鸟之(二十八)Javascript总结之语言基础