SAX是一个解析速度快并且占用内存少的xml解析器,非常适合用于Android等移动设备。 SAX解析XML文件采用的是事件驱动,也就是说,它并不需要解析完整个文档,在按内容顺序解析文档的过程中,SAX会判断当前读到的字符是否合法XML语法中的某部分,如果符合就会触发事件。所谓事件,其实就是一些回调(callback)方法,这些方法(事件)定义在ContentHandler接口。下面是一些ContentHandler接口常用的方法:
startDocument()
当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。
endDocument()
和上面的方法相对应,当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。
startElement(String namespaceURI, String localName, String qName, Attributes atts)
当读到一个开始标签的时候,会触发这个方法。namespaceURI就是命名空间,localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。要注意的是SAX中一个重要的特点就是它的流式处理,当遇到一个标签的时候,它并不会纪录下以前所碰到的标签,也就是说,在startElement()方法中,所有你所知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不得而知的,都需要你的程序来完成。这使得SAX在编程处理上没有DOM来得那么方便。
endElement(String uri, String localName, String name)
这个方法和上面的方法相对应,在遇到结束标签的时候,调用这个方法。
characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。
SAX是基于事件驱动的。当然android的事件机制是基于回调函数的,在用SAX解析xml文档时候,在读取到文档开始和结束标签时候就会回调一个事件,在读取到其他节点与内容时候也会回调一个事件。
只要为SAX提供实现ContentHandler接口的类,那么该类就可以得到通知事件(实际上就是SAX调用了该类中的回调方法)。因为ContentHandler是一个接口,在使用的时候可能会有些不方便,因此,SAX还为其制定了一个Helper类:DefaultHandler,它实现了ContentHandler接口,但是其所有的方法体都为空,在实现的时候,你只需要继承这个类,然后重写相应的方法即可。使用SAX解析itcast.xml的代码如下:
public static List<Person> readXML(InputStream inStream) { try { SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParser = spf.newSAXParser(); //创建解析器 //设置解析器的相关特性,http://xml.org/sax/features/namespaces = true 表示开启命名空间特性 //saxParser.setProperty("http://xml.org/sax/features/namespaces",true); XMLContentHandler handler = new XMLContentHandler(); saxParser.parse(inStream, handler); inStream.close(); return handler.getPersons(); } catch (Exception e) { e.printStackTrace(); } return null; } |
SAX 支持已内置到JDK1.5中,你无需添加任何的jar文件。关于XMLContentHandler的代码实现请看本页下面备注。
实验:
1、 建立xml文件
在src目录下面直接建立xml文件如下
<?xml version="1.0" encoding="utf-8"?> <persons> <person id="100"> <name >Tom</name> <age>20</age> </person> <person id="101"> <name>Mary</name> <age>19</age> </person> </persons> |
2、 创建javabean cn.class3g.domain.person
package cn.class3g.domain; public class Person { private String name; private int age; private int id; public int getId() { return id; } public void setId(int id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } public String toString() { return "Person [name=" + name + ", age=" + age + ", id=" + id + "]"; } public Person(String name, int age, int id) { super(); this.name = name; this.age = age; this.id = id; } public Person() { } } |
3、 建立业务处理类SAXPersonService 、 PersonHandler
SAXPersonService
package cn.class3g.service; /* * 建立解析Persons.xml的业务类 */ public class SAXPersonService { //创建SAX解析器,并利用PersonHandler对象进行解析,并将结果返回 public List<Person> getPersonList(InputStream inStream) throws Exception{ SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser parser = factory.newSAXParser(); PersonHandler handler = new PersonHandler(); parser.parse(inStream, handler); List<Person> personList = handler.getPersons(); inStream.close(); return personList; } } |
PersonHandler
package cn.class3g.service; public class PersonHandler extends DefaultHandler { List<Person> persons; Person person; String elementTag=null; public List<Person> getPersons(){ return persons; } public void startDocument() throws SAXException { persons = new ArrayList<Person>(); } public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { if("person".equals(localName)){ person = new Person(); person.setId(new Integer(attributes.getValue(0))); } elementTag = localName; } public void characters(char[] ch, int start, int length) throws SAXException { if(elementTag != null){ String data = new String(ch,start, length).trim(); //为避免出现空指针异常,不要使用elementTag.equals("name") if("name".equals(elementTag)){ person.setName(data); }else if("age".equals(elementTag)){ person.setAge(Integer.valueOf(data)); } } } public void endElement(String uri, String localName, String qName) throws SAXException { /* *注意此时不能用elementTag,因为有可能遇到两个连续的结束标签,连续调用 *endElement,第一个结束标记调用时已经讲elementTag赋值为null,第二次调用会出现 *空指针异常 */ if("person".equals(localName) && person!=null){ persons.add(person); person = null; } elementTag = null; } public void endDocument() throws SAXException { } } |
编写测试类及测试方法
public void testSAX() throws Throwable{ InputStream is = this.getClass().getClassLoader() .getResourceAsStream("persons.xml"); SAXPersonService service = new SAXPersonService(); List<Person> personList = service.getPersonList(is); for(int i=0; i<personList.size(); i++){ Log.i("TAG", personList.get(i).toString()); } } |
DOM解析XML文件时,会将XML文件的所有内容以对象树方式存放在内存中,然后允许您使用DOM API遍历XML树、检索所需的数据。使用DOM操作XML的代码看起来比较直观,并且,在某些方面比基于SAX的实现更加简单。但是,因为DOM需要将XML文件的所有内容以对象树方式存放在内存中,所以内存的消耗比较大,特别对于运行Android的移动设备来说,因为设备的资源比较宝贵,所以建议还是采用SAX来解析XML文件,当然,如果XML文件的内容比较小采用DOM是可行的。
创建DOMPersonService类
package cn.class3g.service; … public class DOMPersonService { public static List<Person> getPersonList(InputStream in) throws Exception{ List<Person> personList = new ArrayList<Person>(); DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(in); //注意是org.w3c.dom.Element; Element root = document.getDocumentElement(); //获取根节点 NodeList nodes = root.getElementsByTagName("person"); for(int i=0; i<nodes.getLength(); i++){ Element personElement = (Element) nodes.item(i); Person person = new Person(); person.setId(Integer.valueOf(personElement.getAttribute("id"))); NodeList childNodes = personElement.getChildNodes(); //遍历person孩子节点,注意这里孩子节点包括那些空格和换行(它们是文本节点) for(int j=0; j<childNodes.getLength(); j++){ Node childNode = childNodes.item(j); //确定是否为元素节点 if(childNode.getNodeType() == Node.ELEMENT_NODE){ if("name".equals(childNode.getNodeName())){ person.setName(childNode.getFirstChild().getNodeValue()); }else if("age".equals(childNode.getNodeName())){ person.setAge(Integer.valueOf(childNode.getFirstChild().getNodeValue())); } } } personList.add(person); } return personList; } } |
测试方法
public void testDOM() throws Throwable{ InputStream is = this.getClass().getClassLoader() .getResourceAsStream("persons.xml"); DOMPersonService service = new DOMPersonService(); List<Person> personList = service.getPersonList(is); Log.i("TAG", personList.toString()); } |
除了可以使用 SAX和DOM解析XML文件,大家也可以使用Android内置的Pull解析器解析XML文件。 Pull解析器的运行方式与 SAX 解析器相似。它提供了类似的事件,如:开始元素和结束元素事件,使用parser.next()可以进入下一个元素并触发相应事件。事件将作为数值代码被发送,因此可以使用一个switch对感兴趣的事件进行处理。当元素开始解析时,调用parser.nextText()方法可以获取下一个Text类型元素的值。
Pull解析器的源码及文档下载网址:http://www.xmlpull.org/
实验步骤
添加文件 PullPersonService
package cn.class3g.service; … public class PullPersonService { public List<Person> getPersonList(InputStream in) throws XmlPullParserException, IOException { List<Person> personList = null; XmlPullParser parser = Xml.newPullParser(); parser.setInput(in, "utf-8"); int eventType = parser.getEventType(); Person person = null; while (eventType != XmlPullParser.END_DOCUMENT) { switch (eventType) { case XmlPullParser.START_DOCUMENT: personList = new ArrayList<Person>(); break; case XmlPullParser.START_TAG: // 判断是否为person元素节点 if ("person".equals(parser.getName())) { // 创建person,并读取属性id的值 person = new Person(); person.setId(Integer.valueOf(parser.getAttributeValue(0))); } else if (person != null) { if ("name".equals(parser.getName())) { // 获取name元素值 person.setName(parser.nextText()); } else if ("age".equals(parser.getName())) { person.setAge(Integer.valueOf(parser.nextText())); } } break; case XmlPullParser.END_TAG: //结束标记如果为“person”且person对象不空则添加如list if ("person".equals(parser.getName()) && person != null) { personList.add(person); person = null; } break; } eventType = parser.next(); } return personList; } } |
测试方法
public void testPull() throws Throwable{ InputStream is = this.getClass().getClassLoader() .getResourceAsStream("persons.xml"); PullPersonService service = new PullPersonService(); List<Person> personList = service.getPersonList(is); Log.i("TAG", personList.toString()); } |