李春春_

JavaEE实战——XML文档DOM、SAX、STAX解析方式详解

前言

本文接着上一篇博客进行XML文档解析处理语法的介绍。在上一篇博客XML语法中我们提到了，XML技术在企业中主要应用在存储、传输数据和作为框架的配置文件这两块领域。本博客介绍的技术主要就是应用在通过XML进行存储和传输数据这一块。大致分为：JAXP DOM 解析、JAXP SAX 解析、XML PULL 进行 STAX 解析这三个方面。

简介

使用xml 存储和传输数据

1、通过程序生成xml
2、读取xml中数据 ---- xml 解析

XML解析方式有三种：DOM、SAX、StAX

三种解析方式对应着三种解析思想，表述如下。

什么是DOM、SAX、StAX ？

DOM Document Object Model ----- 文档对象模型
DOM思想：将整个xml 加载内存中，形成文档对象，所有对xml操作都对内存中文档对象进行
DOM 是官方xml解析标准
* 所以DOM是所有开发语言都支持的 ---- Java、JavaScript 都支持DOM

SAX Simple API for XML ----- XML 简单 API

程序员为什么发明sax解析方式？？当xml 文档非常大，不可能将xml所有数据加载到内存
SAX 思想：一边解析，一边处理，一边释放内存资源 ---- 不允许在内存中保留大规模xml 数据

StAX The Stream API for XML ----- XML 流 API ---- JDK6.0新特性
STAX 是一种拉模式 XML 解析方式，SAX 是一种推模式 XML 解析方式（SAX性能不如STAX，STAX技术较新）

注解：
推push模式：由服务器为主导，向客户端主动发送数据( 推送 )
拉pull模式: 由客户端为主导，主动向服务器申请数据( 轮询 )

三种解析开发包

掌握了三种思想后，程序员在实际开发中，使用已经开发好工具包 ----- JAXP 、DOM4j 、XML PULL

注解：
解析方式与解析开发包关系？

解析方式是解析xml 思想，没有具体代码

解析开发包是解析xml思想具体代码实现。

JAXP 是sun官方推出实现技术同时支持 DOM SAX STAX
DOM4j 是开源社区开源框架支持 DOM 解析方式
XML PULL Android 移动设备内置xml 解析技术支持 STAX 解析方式

DOM和SAX/STAX区别

DOM、SAX、STAX 在实际开发中选择？

在javaee日常开发中 ---- 优先使用DOM （编程简单）
当xml 文档数据非常多，不可能使用DOM ---造成内存溢出 ------ 优先使用STAX
移动开发使用 STAX ---- Android XML PULL

JAXP DOM 解析

JAXP开发包简介

JAXP(Java API for XML Processing)：
DOM、SAX、STAX 只是XML解析方式，没有API
JAXP是 Sun 提供的一套XML解析API，它很好的支持DOM和SAX解析方式，JDK6.0开始支持STAX解析方式，JAXP 开发包是JavaSE的一部分，它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成，在 javax.xml.parsers 包中，定义了几个工厂类，程序员调用这些工厂类，可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。

JAXP 开发进行 xml解析软件包：
javax.xml.parsers 存放 DOM 和 SAX 解析器
javax.xml.stream 存放 STAX 解析相关类
org.w3c.dom 存放DOM解析时数据节点类
org.xml.sax 存放SAX解析相关工具类

DOM解析模型

DOM 是以层次结构组织的节点或信息片断的集合，是 XML 数据的一种树型表示
XML文档中所有的元素、属性、文本都会被解析成node节点 ---- 从而在内存中形成XML文档树型模型 ---- 所有的解析操作都围绕着这个模型进行
(属性节点不属于任何节点的父节点或者子节点！)
节点之间关系：parent、children、sibling(兄弟)

DOM 解析快速入门

1、创建 xml 文档 books.xml
在企业实际开发中，为了简化xml 生成和解析 ---- xml 数据文件通常不使用约束的

2、使用DOM解析xml
将整个xml文档加载到内存中：工厂 --- 解析器 ---解析加载

DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();//工厂
DocumentBuilder builder = builderFactory.newDocumentBuilder();//解析器
Document document = builder.parse("books.xml");//装载进内存

3、Document通过 getElementsByTagName("") 获得指定标签的节点集合 NodeList

通过 NodeList 提供 getLength 和 item遍历节点集合

遍历ArrayList
for (int i=0;i

 
   
  什么是 Node?  
  对于xml 来说，xml所有数据都是node节点 （元素节点、属性节点、文本节点、注释节点、CDATA节点、文档节点） 
  Element Attr Text Comment CDATASection Document  ----- 都是 Node 子接口 
  、Node对象提供了一系列常量来代表节点的类型（查看org.w3c.dom.Node接口源码）： 
  
 
  当开发人员获得某个Node类型后，就可以把Node节点转换成相应的节点对象（Element、Attr、Text）。 
  注解： 
  node有三个通用API ： 
      |--getNodeName()：返回节点的名称
      |--getNodeType()：返回节点的类型 ---- ELEMENT_NODE=1、ATTRIBUTE_NODE=2、TEXT_NODE=3
      |--getNodeValue()：返回节点的值  ---- 所有元素节点value都是 null 
  另外，对于元素节点ELEMENT来说： 
  |--获得元素节点中的属性值
      |--element.getAttribute(属性名称)
|--获得元素节点内部文本内容
      |--element.getTextContent()
      |--element.getFirstChild().getNodeValue() 
  代码示例： 
  books.xml： 
   
  

	
		java编程基础
		80
	
	
		java高级应用
		100
	
 
   
  测试程序： 
  package cn.itcast.dom.jaxp;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class DOMTest {
	@Test
	// 查询 java编程基础 书 售价
	public void demo3() throws Exception {
		// 装载xml 加载内存 --- Document对象
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("books.xml");

		// 利用全局查询 锁定 每个name节点
		NodeList nodelist = document.getElementsByTagName("name");
		for (int i = 0; i < nodelist.getLength(); i++) {
			Element name = (Element) nodelist.item(i);
			if (name.getTextContent().equals("java编程基础")) {
				// 图书 找到了
				// price 是 name 节点 兄弟的兄弟,三个换行符也是子节点
				Element price = (Element) name.getNextSibling()
						.getNextSibling();
				System.out.println(price.getTextContent());
			}
		}
	}

	@Test
	// 查询 java编程基础 书 售价
	public void demo2() throws Exception {
		// 装载xml 加载内存 --- Document对象
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("books.xml");

		// 全局查询 作为程序 切入
		NodeList nodelist = document.getElementsByTagName("book");
		// 遍历 强制转换 Element
		for (int i = 0; i < nodelist.getLength(); i++) {
			Element book = (Element) nodelist.item(i);
			// 找 哪个 book 节点 当中 name 节点值 java编程基础 ---- 查找book的name 子节点
			NodeList chidren = book.getChildNodes();
			//System.out.println(chidren.getLength());//注意:回车、空格也是子元素
			Element name = (Element) chidren.item(1); // book的第二个子节点就是name
			if (name.getTextContent().equals("java编程基础")) {
				// 当前for循环 这本书 是目标图书
				// 打印图书价格 price 是 book 第四个子节点
				Element price = (Element) chidren.item(3);
				System.out.println(price.getTextContent());
			}
		}
	}

	@Test
	public void demo1() throws Exception {
		// 通过DOM 解析 XML --- 载入整个xml 工厂 -- 解析器 --- 加载

		// 构造工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		// 通过工厂 获得解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();

		// 使用解析器 加载 xml文档
		Document document = builder.parse("books.xml");

		// Document代表整个xml 文档，通过操作Document，操作xml数据

		// 将所有图书名称打印出来
		// 这里 nodelist 代表节点的集合
		// 查询所有 name标签
		NodeList nodelist = document.getElementsByTagName("name");
		// 遍历集合中 所有 node
		System.out.println("图书name节点数量：" + nodelist.getLength());
		for (int i = 0; i < nodelist.getLength(); i++) {
			// 获得每个 node 节点
			Node node = nodelist.item(i); // 这里每个node 都是  ---- 元素
			Element e = (Element) node; // 将 节点转换为 子类型 节点
			System.out.println(e.getNodeName()); // 节点元素名称
			System.out.println(e.getNodeType()); // 节点元素 类型
			System.out.println(e.getNodeValue()); // 节点元素 值
			// 输出 name 元素 子节点文本节点值
			System.out.println(e.getFirstChild().getNodeValue());
			System.out.println(e.getTextContent());
			System.out.println("------------------------------------");
		}
	}
} 
   
  DOM 编程思路小结 
   
   
  1、装载XML文档 ---- Document (工厂--解析器--解析加载) 2、Document 获得指定元素 ----- getElementsByTagName （返回 NodeList） 
  
 3、遍历NodeList 获得 每个 Node 
  
 4、将每个Node 强制转换 Element  
  
 5、通过元素节点API 操作属性和文本内容  
  
       |--getAttribute  获得属性值 
  
       |--getTextContent 获得元素内部文本内容 
  这其中，第一步是固定套路：
 
  DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();//工厂
DocumentBuilder builder = builderFactory.newDocumentBuilder();//解析器
Document document = builder.parse("books.xml");//装载进内存 
   
  DOM的增删改查 ---- CURD 
   
  XML元素查询 
   
  节点对象的查询总结： 
      先用全局查找锁定范围，再用相对关系查找 得到需要数据。 
  |--全局查找元素节点
       |--document.getElementByTagName
      |--document.getElementById( 需要带约束的XML)
|--相对节点位置查找节点
      |--getChildNodes()：返回这个节点的所有子节点列表
      |--getFirstChild()：返回这个节点的第一个子节点
      |--getParentNode()：返回这个节点的父节点对象
      |--getNextSibling()：返回这个节点的下一个兄弟节点(注意空白也是节点)
      |--getPreviousSibling()：返回这个节点的前一个兄弟节点 
  注意：getElementById 方法 必须用于带有约束 xml文档中 ！！！！！！！ 
  例如： 
  books.xml： 
   
  

	
	
	
	
	>
]>

	
		java编程基础
		80
	
	
		java高级应用
		100
	
 
   
  getElementById 代码示例： 
   
  package cn.itcast.dom.jaxp;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class DOMTest {
	@Test
	// getElementById 用法 --- 查找 id b002 图书 名称
	public void demo4() throws Exception {
		// 装载xml 加载内存 --- Document对象
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("books.xml");

		// 直接通过id 查找 ----- 文档必须使用 约束 --- 不用约束xml文档 不能 使用getElementById
		Element book = document.getElementById("b002");
		System.out.println(book);
		System.out.println(book.getChildNodes().item(1).getTextContent());
	}
 
   
   
  所有开发语言默认支持DTD，当使用Schema时，单独编程导入schema ！ 
  如何对xml文件进行schema约束？ 
  
 
  DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
SchemaFactory factory = SchemaFactory.newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);
StreamSource ss = new StreamSource("books.xsd");
Schema schema = factory.newSchema(ss);
builderFactory.setSchema(schema);
builderFactory.setNamespaceAware(true); 
   
  XML回写 
  XML DOM 增加 、修改 和 删除操作 ------ 操作 内存中文档对象 ---- 操作内存结束后要回写进某一文件中 
  更新XML文档步骤：
|--javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换成XML格式进行输出
|--Transformer对象通过TransformerFactory获得
|--Transformer类通过transform方法完成转换操作，该方法接收一个源和一个目的地。我们可以通过：
      |--javax.xml.transform.dom.DOMSource类来关联要转换的document对象， 
      |--javax.xml.transform.stream.StreamResult 对象来表示数据的目的地。 
  代码示例： 
   
  package cn.itcast.dom.jaxp;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class DOMTest {
	@Test
	// 将 books.xml 加载内存中，将文档内容写入另一个xml books_bak.xml(回写)
	public void demo5() throws Exception, IOException {
		// 将 文档 载入内存
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("books.xml");

		// 回写xml 用到 Transformer
		TransformerFactory transformerFactory = TransformerFactory
				.newInstance();
		Transformer transformer = transformerFactory.newTransformer();

		DOMSource domSource = new DOMSource(document);// 用document构造数据源
		StreamResult result = new StreamResult(new File("books_bak.xml"));

		transformer.transform(domSource, result);
	}
} 
   
   
  其实你可以发现回写也是固定套路： 
   
  TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
DOMSource domSource = new DOMSource(document);// 用document构造数据源
StreamResult result = new StreamResult(new File("books_bak.xml"));
transformer.transform(domSource, result); 
   
  XML元素添加 
  |--创建节点元素
      |--document.createXXX()创建节点
|--将节点元素加入指定位置
      |--element.getDocumentElement()获得根节点
      |--element.appendChild(org.w3c.dom.Node)添加节点
|--回写XML 
   
  XML元素修改 
  |--加载xml到内存 
  
 
  |--查询到指定元素  
  
 
  |--修改元素的属性值 
  
 
        |--element.setAttribute(name,value); 
  
 
  |--修改元素内文本内容 
  
 
        |--element.setTextContent(value); 
  
 
  |--回写XML 
   
   
  XML元素删除 
  |--删除节点.getParentNode().removeChild(删除节点) 
  
 
        (删除必须通过父节点、注意每次删完之后修复nodelist长度！) 
   
  代码示例： 
   
  package cn.itcast.dom.jaxp;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;

/**
 * CURD create update read delete
 * 
 * @author seawind
 * 
 */
public class DOMCURDTest {
	@Test
	// 删除所有 java书名 ----- 图书
	public void testDelete() throws Exception {
		// 加载xml 到内存
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("books.xml");

		NodeList nodelist = document.getElementsByTagName("name");
		for (int i = 0; i < nodelist.getLength(); i++) {
			Element name = (Element) nodelist.item(i);
			if (name.getTextContent().contains("java")) {
				// 这本书删除 --- 通过name 获得图书
				Element book = (Element) name.getParentNode();
				// 删除 必须 通过父节点
				book.getParentNode().removeChild(book);
				i--; // 修复list长度
			}
		}

		// 回写
		TransformerFactory transformerFactory = TransformerFactory
				.newInstance();
		Transformer transformer = transformerFactory.newTransformer();
		DOMSource domSource = new DOMSource(document);// 用document构造数据源
		StreamResult result = new StreamResult(new File("books_bak.xml"));
		transformer.transform(domSource, result);
	}

	@Test
	// 将 java高级应用 价格上调 20%
	public void testUpdate() throws Exception {
		// 加载xml 到内存
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("books.xml");

		// 查找 java高级应用书
		NodeList nodelist = document.getElementsByTagName("name");
		for (int i = 0; i < nodelist.getLength(); i++) {
			Element name = (Element) nodelist.item(i);
			if (name.getTextContent().equals("java高级应用")) {
				// 找到了 --- 获得价格节点
				Element price = (Element) name.getNextSibling()
						.getNextSibling();
				double money = Double.parseDouble(price.getTextContent());
				money = money * 1.2;

				price.setTextContent(money + "");
			}
		}

		// 回写
		TransformerFactory transformerFactory = TransformerFactory
				.newInstance();
		Transformer transformer = transformerFactory.newTransformer();
		DOMSource domSource = new DOMSource(document);// 用document构造数据源
		StreamResult result = new StreamResult(new File("books_bak.xml"));
		transformer.transform(domSource, result);
	}

	@Test
	// 向xml 添加一个 book元素
	public void testAdd() throws Exception {
		// 1 将原来 books.xml 加载到内容
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory
				.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("books.xml");

		// 2、添加节点 创建节点 books
		Element newBook = document.createElement("book"); // 
		newBook.setAttribute("id", "b003");

		// 创建name节点
		Element newName = document.createElement("name"); // 
		newName.setTextContent("编程高手秘笈");

		// 将 新 name 放入 新 book
		newBook.appendChild(newName);

		// 3、添加节点到指定位置 ---- 获得books根节点
		Element root = document.getDocumentElement();
		root.appendChild(newBook);

		// 4、回写xml
		TransformerFactory transformerFactory = TransformerFactory
				.newInstance();
		Transformer transformer = transformerFactory.newTransformer();
		DOMSource domSource = new DOMSource(document);// 用document构造数据源
		StreamResult result = new StreamResult(new File("books_bak.xml"));
		transformer.transform(domSource, result);
	}
} 
   
  DOM总结： 
   
    
   
 
   
   
   
 
   
  JAXP SAX 解析 
  SAX 和 STAX 都是 基于事件驱动 ----- SAX推模式 STAX拉模式 
   
  SAX解析处理器的常用事件 
  |--DefaultHandler类（在 org.xml.sax.helpers 软件包中）来实现所有这些回调，并提供所有回调方法默认的空实现  
  
 
   
        |--startDocument()  ---- 文档开始事件 
  
 
   
        |--startElement() ---- 元素开始事件 
  
 
   
        |--characters() ---- 文本元素事件 
  
 
   
        |--endElement() ---- 元素结束事件 
  
 
   
        |--endDocument()  ----- 文档结束事件 
   
  SAX解析原理 
  SAX和DOM不同：
DOM解析器 ---- 将整个XML文档全部加载到内存，返回文档对象Document
      解析器DocumentBuilder ---- Document document = builder.parse(file)
SAX解析器 ---- 一边读取XML一边解析一边处理，并没有返回值
      解析器SAXParser ---- 将XML文档和文档解析处理器(DefaultHandler及其子类)同时传递给SAX解析器 ---- 解析器调用处理器相应的事件处理方法来处理文档 
  
 
  为什么说SAX是推模式解析？ 解析器控制xml文件解析，由解析器调用相应事件方法
由位于服务器端的解析器内部主导的事件方法调用 ---- 推模式 
  SAX解析器采用了基于事件的模型，它在解析XML文档的时候可以触发一系列的事件，发生相应事件时，将调用一个回调方法，例如：
 
  

	UNIX
 
   
   
  依次触发的事件： 
  Start document 
  
 
  Start element (config) 
  
 
  Characters (whitespace) 
  
 
  Start element (server) 
  
 
  Characters (UNIX) 
  
 
  End element (server) 
  
 
  Characters (whitespace) 
  
 
  End element (config) 
  
 
  End document 
  代码示例： 
  server.xml： 
   
  

	UNIX
SAX解析： 
  
 
   
   
  package cn.itcast.sax.jaxp;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

/**
 * 编写sax解析xml 实例
 * 
 * @author seawind
 * 
 */
public class SAXTest {
	public static void main(String[] args) throws Exception {
		// 1、工厂
		SAXParserFactory factory = SAXParserFactory.newInstance();
		// 2、通过工厂获得解析器
		SAXParser parser = factory.newSAXParser();

		// 3 、创建 Handler
		MyHandler handler = new MyHandler();

		// 4、将xml 文档 和 handler 同时传递给 解析器
		parser.parse("server.xml", handler);
	}
}

/**
 * 继承 DefaultHandler 重写 5 个事件方法
 * 
 * @author seawind
 * 
 */
class MyHandler extends DefaultHandler {
	@Override
	public void startDocument() throws SAXException {
		System.out.println("start document...");
	}

	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		System.out.println("start element(" + qName + ")...");
		// 打印server元素 id 属性 --- 判断当前开始元素是 server
		if (qName.equals("server")) {
			System.out.println("id属性的值：" + attributes.getValue("id"));
		}
	}

	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		String content = new String(ch, start, length);
		System.out.println("characters: " + content);
	}

	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		System.out.println("end element(" + qName + ")...");
	}

	@Override
	public void endDocument() throws SAXException {
		System.out.println("end document...");
	}

} 
   
  使用SAX方式解析XML步骤 
  |--使用SAXParserFactory创建SAX解析工厂
      |--SAXParserFactory spf = SAXParserFactory.newInstance();
|--通过SAX解析工厂得到解析器对象
      |--SAXParser sp = spf.newSAXParser();
|--通过解析器对象解析xml文件
      |--sp.parse("book.xml“,new XMLContentHandler());
      |--这里的XMLContentHandler 继承 DefaultHandler
            |--在startElement() endElement() 获得 开始和结束元素名称
            |--在characters() 获得读取到文本内容
            |--在startElement() 读取属性值  
  XML PULL 解析 
  STAX 拉模式xml 解析方式 ----- 客户端程序，自己控制xml事件，主动调用相应事件方法 
  XML PULL 解析器开发包简介 
  当使用XML PULL，如果使用Android系统，系统内置无需下载任何开发包；如果想JavaSE、JavaEE使用pull解析技术下载单独pull 开发工具包。、 
  xpp3 ----- XML Pull Parser 3 是pull API 代码实现 
  使用pull 解析器
1、去网站上 下载 pull 解析器的实现 xpp3 (Android 内置)
2、将 xpp3-1.1.3.4.C.jar 导入 java工程 
良好习惯：要导入jar包应当位于当前工程内部。
方法：在工程内新建lib文件夹，将jar复制过来，然后将pull解析器xpp3.jar包添加至Java Build Path (Libraries--Add JARs 或右键jar包 Add to Build Path)，这样pull解析器才能使用。
注解：jar 包就是.class文件 集合压缩包 （采用zip格式压缩）
3、创建pull 解析器 ---- XmlPullParser
4、将xml 文档内容传递 pull 解析器
5、需要客户端程序手动完成解析，XmlPullParser存放解析方法next()，用于解析器解析下一事件 
  STAX解析原理 
  Pull解析器 使用 stax 解析方式 ---- 拉模式解析 
  
 
  SAX解析器当接收到XML文件内容，服务器端解析器SAXParser自动开始解析，自动解析过程中调用处理器相应方法 ---- 推模式
Pull采用将xml文档传递解析器，解析器XmlPullParser不会自动解析，需要手动通过next触发文档解析事件，在客户端代码中获取当前事件 ，从而调用相应事件处理方法。 
  为什么 STAX 解析方式 效率 好于 SAX ？ 
  1、SAX 无选择性的，所有事件都会处理的解析方式，解析器控制事件的调用；StAX由用户自主控制需要处理事件类型以及事件的调用。
2、在使用Stax进行数据解析时，随时终止解析。 
  使用XML Pull解析 XML 
  |--参考官方文档
      |--http://www.xmlpull.org/v1/download/unpacked/doc/quick_intro.html
      |--Xpp3 XmlPullParser javadoc
|--关键代码
      |--创建解析器工厂
            |--XmlPullParserFactory factory =  XmlPullParserFactory.newInstance();
            |--factory.setNamespaceAware(true); 
      |--根据工厂创建解析器
            |--XmlPullParser xpp = factory.newPullParser(); 
      |--读取xml文件
            |--xpp.setInput(inStream, "UTF-8");
      |--当前节点事件类型
            |--int eventType = xpp.getEventType();
      |--下一个节点事件
            |--eventType = xpp.next();
      |--获得元素名称
            |--xpp.getName();
      |--获得标签属性值
            |--xpp.getAttributeValue
      |--获得标签后面文本内容
            |--xpp.nextText(); 
  代码示例： 
  books.xml： 
   
  

	
	
	
	
	>
]>

	
		java编程基础
		80
	
	
		java高级应用
		100
	
	
		编程高手秘笈
		200
		
 
   
  遍历代码实例、查询某本书的价格： 
  package cn.itcast.stax.pull;

import java.io.FileInputStream;

import org.junit.Test;
import org.xmlpull.v1.XmlPullParser;
import org.xmlpull.v1.XmlPullParserFactory;

/**
 * 通过 pull 解析器 解析 xml
 * 
 * @author seawind
 * 
 */
public class PullTest {
	@Test
	// 通过 pull 解析技术 查看 "编程高手秘笈" 价格
	public void demo2() throws Exception {
		// 1. 创建 pull 解析器
		XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
		XmlPullParser parser = factory.newPullParser();
		// 2. 将 xml文档传递 解析器
		parser.setInput(new FileInputStream("books.xml"), "utf-8");

		// 通过循环 驱动事件解析
		int event;

		// 查找name 标识位
		boolean isFound = false;
		while ((event = parser.getEventType()) != XmlPullParser.END_DOCUMENT) {
			// 获得 开始元素 name
			if (event == XmlPullParser.START_TAG
					&& parser.getName().equals("name")) {
				// 获得元素后面文本
				String bookname = parser.nextText();
				if (bookname.equals("编程高手秘笈")) {
					isFound = true;
					// 这本书就是我要找到
					// parser.next();
					// System.out.println(parser.getEventType());
					// parser.next(); // price 开始
					// System.out.println(parser.getEventType());
					// String money = parser.nextText();//太麻烦，用标识位简单
					// System.out.println(money);
				}
			}

			if (event == XmlPullParser.START_TAG
					&& parser.getName().equals("price") && isFound) {
				System.out.println(parser.nextText());
				break;
			}

			parser.next();
		}
	}

	@Test
	public void demo1() throws Exception {
		// 1、创建 xml pull 解析器
		// 工厂
		XmlPullParserFactory xmlPullParserFactory = XmlPullParserFactory
				.newInstance();

		// 通过工厂 获得解析器
		XmlPullParser parser = xmlPullParserFactory.newPullParser();

		// 2、将 xml 文件 传递 解析器
		parser.setInput(new FileInputStream("books.xml"), "utf-8");

		// pull 解析器用得是 拉模式 数据 解析
		int event;

		while ((event = parser.getEventType()) != XmlPullParser.END_DOCUMENT) {
			//System.out.println(event);
			
			// 打印哪个元素开始了 ---- 判断当前事件 是 元素开始事件
			if (event == XmlPullParser.START_TAG) {
				// 所有数据 从解析器 获得
				System.out.println(parser.getName() + "元素开始了...");
			}

			// 打印 哪个 元素 结束了
			if (event == XmlPullParser.END_TAG) {
				System.out.println(parser.getName() + "元素 结束了...");
			}

			// 处理下一个事件
			parser.next();
		}

		// parser.getEventType()获得当前事件类型
		// 可以通过查看XmlPullParser源码得到各常量代表意义
		// int event = parser.getEventType();
		//
		// System.out.println(event);//START_DOCUMENT = 0
		//
		// parser.next(); // 解析器解析下一个事件
		//
		// int event2 = parser.getEventType();
		//
		// System.out.println(event2);//START_TAG = 2
		//
		// parser.next();
		//
		// int event3 = parser.getEventType();
		//
		// System.out.println(event3);//TEXT = 4

	}
} 
  XML PULL 生成XML文档 
  Pull 解析器 生成 xml 文档功能 ---- 通过 XmlSerializer 生成 xml 文档 
  解析xml ：文档开始、元素开始、文本元素、元素结束、文档结束
 生成xml ：生成文档声明（文档开始），元素开始、文本内容、元素结束 、文档结束 
  代码示例： 
  1、生成简单xml
 2、通过对象数据生成xml
 3、通过对象List数据生成xml
       ---- 序列化 XmlSerializer 
   
  package cn.itcast.stax.pull;

import java.io.FileOutputStream;
import java.util.ArrayList;
import java.util.List;

import org.junit.Test;
import org.xmlpull.v1.XmlPullParserFactory;
import org.xmlpull.v1.XmlSerializer;

import cn.itcast.domain.Company;

/**
 * 生成 xml
 * 
 * @author seawind
 * 
 */
public class SerializerTest {
	@Test
	// 根据 List 生成xml
	public void demo3() throws Exception {
		List companies = new ArrayList();

		Company company = new Company();
		company.setName("传智播客");
		company.setPnum(200);
		company.setAddress("西二旗软件园！");

		Company company2 = new Company();
		company2.setName("CSDN");
		company2.setPnum(1000);
		company2.setAddress("西二旗 软件园 ");

		companies.add(company);
		companies.add(company2);

		// 序列化对象
		XmlSerializer serializer = XmlPullParserFactory.newInstance()
				.newSerializer();

		// 设置输出文件
		serializer.setOutput(new FileOutputStream("company.xml"), "utf-8");

		serializer.startDocument("utf-8", true);

		serializer.startTag(null, "companies");

		// 遍历list集合
		for (Company c : companies) {
			serializer.startTag(null, "company");

			serializer.startTag(null, "name");
			serializer.text(c.getName());
			serializer.endTag(null, "name");

			serializer.startTag(null, "pnum");
			serializer.text(c.getPnum() + "");
			serializer.endTag(null, "pnum");

			serializer.startTag(null, "address");
			serializer.text(c.getAddress());
			serializer.endTag(null, "address");

			serializer.endTag(null, "company");
		}

		serializer.endTag(null, "companies");

		serializer.endDocument();

	}

	@Test
	// 根据company对象数据生成xml
	public void demo2() throws Exception {
		Company company = new Company();
		company.setName("传智播客");
		company.setPnum(200);
		company.setAddress("西二旗软件园！");

		/*
		 * 
		 * 
		 * 传智播客
		 * 
		 * 200
		 * 
		 * 西二旗软件园
		 * 
		 * 
		 */

		// 获得序列化对象
		XmlSerializer serializer = XmlPullParserFactory.newInstance()
				.newSerializer();

		// 传递 输出目标文件 给序列化对象
		serializer.setOutput(new FileOutputStream("company.xml"), "utf-8");

		serializer.startDocument("utf-8", true);

		serializer.startTag(null, "company");

		serializer.startTag(null, "name");
		serializer.text(company.getName());
		serializer.endTag(null, "name");

		serializer.startTag(null, "pnum");
		serializer.text(company.getPnum() + "");
		serializer.endTag(null, "pnum");

		serializer.startTag(null, "address");
		serializer.text(company.getAddress());
		serializer.endTag(null, "address");

		serializer.endTag(null, "company");

		serializer.endDocument();
	}

	@Test
	public void demo1() throws Exception {
		// 获得XmlSerializer对象
		XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
		XmlSerializer serializer = factory.newSerializer();

		// 设置序列化输出文档
		serializer.setOutput(new FileOutputStream("company.xml"), "utf-8");

		// 文档开始
		serializer.startDocument("utf-8", true);

		// 元素开始
		serializer.startTag(null, "company"); // 没有命名空间 ，"" 或者 null

		// 文本元素
		serializer.text("传智播客");

		// 元素结束
		serializer.endTag(null, "company");

		// 文档结束
		serializer.endDocument();

		/*
		 * 
		 * 
		 * 
		 * 
		 * 传智播客
		 * 
		 * 
		 */
	}
} 
   
  STAX的增删改查 ---- CURD 
  对xml文件通过pull解析器进行CURD操作原理： 
   
   
    
   
  
 当下问题：pull解析器封装List对象过程 ---- 如何将XML数据 --> List