解析xml有四种方法:DOM,SAX,DOM4j,JDOM.
我们主要学了两种:DOM和SAX.
DOM适于解析比较简单的XML而SAX则适于解析较复杂的XML文件。各有各的好。
DOM和SAX的不同:
1. DOM是基于内存的,不管文件有多大,都会将所有的内容预先装载到内存中。从而消耗很大的内存空间。而SAX是基于事件的。当某个事件被触发时,才获取相应的XML的部分数据,从而不管XML文件有多大,都只占用了少量的内存空间。
2. DOM可以读取XML也可以向XML文件中插入数据,而SAX却只能对XML进行读取,而不能在文件中插入数据。这也是SAX的一个缺点。
3.SAX的另一个缺点:DOM我们可以指定要访问的元素进行随机访问,而SAX则不行。SAX是从文档开始执行遍历的。并且只能遍历一次。也就是说我们不能随机的访问XML文件,只能从头到尾的将XML文件遍历一次(当然也可以中间截断遍历)。
Dom解析
example1.xml
引用
<?xml version="1.0" ?>
<Root>
<A>
<B>
<Teacher name="Liucy">
C++
</Teacher>
<Teacher name="Huxz">
Java
</Teacher>
</B>
</A>
</Root>
ParseXmlwithDom1.java
import org.w3c.dom.*;
import javax.xml.parsers.*;
public class ParseXmlwithDom1 {
public static void main(String[] args) throws Exception{
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=dbf.newDocumentBuilder();
Document doc=builder.parse("example1.xml");
/*
Element root=doc.getDocumentElement();
*/
//NodeList nl=root.getChildNodes();
NodeList nl=doc.getElementsByTagName("Teacher");
for(int i=0;i<nl.getLength();i++){
Node n=nl.item(i);
/*
short s=n.getNodeType();
if (s==Node.ELEMENT_NODE){
*/
System.out.print("Element:");
Element e=(Element)n;
System.out.print(e.getTagName());
System.out.print(" name="+e.getAttribute("name"));
System.out.println(" textContent="+e.getTextContent().trim());
/*}
if (s==Node.TEXT_NODE){
System.out.print("Text:");
Text t=(Text)n;
String text=t.getTextContent().trim();
System.out.println(text);
}
*/
}
}
}
控制台输出:
Element:Teacher name=Liucy textContent=C++
Element:Teacher name=Huxz textContent=Java
SAX解析:
引用
<?xml version="1.0" ?>
<Root>
<Teacher1 name="Liucy">
C++
</Teacher1>
<Teacher2 name="Huxz">
Java
</Teacher2>
</Root>
ParseXmlwithSAX.java
import javax.xml.parsers.*;
import org.xml.sax.*;
import org.xml.sax.helpers.*;
import static java.lang.System.*;
public class ParseXmlwithSAX {
public static void main(String[] args) throws Exception {
SAXParserFactory fact=SAXParserFactory.newInstance();
SAXParser parser=fact.newSAXParser();
DefaultHandler dh=new MyHandler();
parser.parse("example2.xml",dh);
}
}
class MyHandler extends DefaultHandler{
public void characters(char[] cs, int start, int length) throws SAXException {
String str=new String(cs,start,length).trim();
if (str.length()==0) return;
out.println("处理文本 "+str);
}
public void endDocument() throws SAXException {
out.println("文档结束");
}
public void endElement(String uri, String localName, String qName) throws SAXException {
out.println("标记结束 "+qName);
}
public void startDocument() throws SAXException {
out.println("文档开始");
}
public void startElement(String uri, String localName, String qName, Attributes as) throws SAXException {
out.println("标记开始 "+qName);
if (as.getLength()!=0) {
String value=as.getValue("name");
out.println("name="+value);
}
}
}
控制台输出:
文档开始
标记开始 Root
标记开始 Teacher1
name=Liucy
处理文本 C++
标记结束 Teacher1
标记开始 Teacher2
name=Huxz
处理文本 Java
标记结束 Teacher2
标记结束 Root
文档结束