最近做的项目里需要XML拼接与解析,所以调研了一下相关内容。在Android程序中,Xml解析与Java中几乎相同,最常用的有SAX,DOM,PULL 三种解析方式。Android中内置了pull解析方式。这也是android推荐的解析方式。下面我们就看下这三种的用法。
这种解析方式基于事件的模型。通俗的讲就是XML文件在加载的过程中,加载到不同节点会相应触发不同方法来处理。
SAX解析XML文件采用事件驱动的方式进行,也就是说,SAX是逐行扫描文件,遇到符合条件的设定条件后就会触发特定的事件,回调你写好的事件处理程序。使用SAX的优势在于其解析速度较快,占用内存较少(相对于DOM而言)。而且SAX在解析文件的过程中得到自己需要的信息后可以随时终止解析,并不一定要等文件全部解析完毕。凡事有利必有弊,其劣势在于SAX采用的是流式处理方式,当遇到某个标签的时候,它并不会记录下以前所遇到的标签,也就是说,在处理某个标签的时候,比如在startElement方法中,所能够得到的信息就是标签的名字和属性,至于标签内部的嵌套结构,上层标签、下层标签以及其兄弟节点的名称等等与其结构相关的信息都是不得而知的。实际上就是把XML文件的结构信息丢掉了,如果需要得到这些信息的话,只能你自己在程序里进行处理了。所以相对DOM而言,SAX处理XML文档没有DOM方便,SAX处理的过程相对DOM而言也比较复杂
使用SAX解析XML文件一般有以下五个步骤:
1、创建一个SAXParserFactory对象(通过类名很容易得知它利用工厂方法模式实现的);
2、调用SAXParserFactory中的newSAXParser方法创建一个SAXParser对象;
3、然后在调用SAXParser中的getXMLReader方法获取一个XMLReader对象;
4、在XMLReader中注册事件处理接口,一般有ContentHandler、ErrorHandler、DTDHandler、EntityHandler四种;
5、调用XMLReader中的parse方法解析指定的XML字符串对象;
步骤四中提到的四个Handler是事件处理接口,SAX的事件处理函数就定义在这四个接口中,利用SAX解析XML文件需要重写接口中的方法。其中ContentHandler用来处理XML中的内容,ErrorHandler用来处理错误,DTDHandler用来处理DTD,EntityHandler用来处理XML文档中的实体;最常用的是ContentHandler这个接口,下面是该接口中的一些常用方法:
void startDocument():当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。
void endDocument():和上面的方法相对应,当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。
void startElement(String uri, String localName, String qName, Attributes atts):当读到一个开始标签的时候,会触发这个方法。namespaceURI就是命名空间,localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。要注意的是SAX中一个重要的特点就是它的流式处理,当遇到一个标签的时候,它并不会记录下以前所碰到的标签,也就是说,在startElement()方法中,所有你所知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不得而知的,都需要你的程序来完成。
void endElement(String uri, String localName, String qName):这个方法和上面的方法相对应,在遇到结束标签的时候,调用这个方法。
void characters(char[ ] ch, int start, int length):这个方法用来处理在XML文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。
下面是利用SAX解析XML文件的DEMO程序,首先定义一个XML文件users.xml.
<?xml version="1.0" encoding="utf-8"?> <users> <user id="1"> <name>wuxianglong</name> <password>199098</password> </user> <long:user id="2"> <name>wuwenyuan</name> <password>199189</password> </long:user> </users>
import java.util.ArrayList; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class MyHandler extends DefaultHandler { private ArrayList<User> users; private User user; private String content; public ArrayList<User> getUsers() { return users; } @Override public void startDocument() throws SAXException { super.startDocument(); users = new ArrayList<User>(); System.out.println("----------Start Parse Document----------" ); } @Override public void endDocument() throws SAXException { System.out.println("----------End Parse Document----------" ); } @Override public void characters(char[] ch, int start, int length) throws SAXException { super.characters(ch, start, length); // 获得标签中的文本 content = new String(ch, start, length); } @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { super.startElement(uri, localName, qName, attributes); // 打印出localname和qName System.out.println("LocalName->" + localName); System.out.println("QName->" + qName); if ("user".equals(localName)) { user = new User(); user.setId(Integer.parseInt(attributes.getValue("id"))); } } @Override public void endElement(String uri, String localName, String qName) throws SAXException { super.endElement(uri, localName, qName); if ("name".equals(localName)) { user.setName(content); } else if ("password".equals(localName)) { user.setPassword(content); } else if ("user".equals(localName)) { users.add(user); } }
2.DOM(Document Object Model):文档对象模型,它是基于对象的,又或者基于树的。它属于两次加载,首先把文档载入内存,第二次把文档解析形成一棵树。如果文档过大对内存占用是很大的。但它也有其优点,它可以解析的过程中修改文件树,可以随便存储文件树的任意部分,相对容易理解。
小文件用dom,大的用sax3)Pull解析: android 中内置了 pull 解析包。这也是 android 程序中所推荐的xml解析方式。 PULL解析器的运行方式和SAX类似,都是基于事件的模式。不同的是,在PULL解析过程中返回的是数字,且我们需要自己获取产生的事件然后做相应的操作,而不像SAX那样由处理器触发一种事件的方法,执行我们的代码。