XML:可扩展标记语言
XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节需要阅读相关的技术文献,这里不做具体的阐述了。
XML称为可扩展标记语言,它与HTML一样,都是SGML(标准通用标记语言)XML是Internet环境中款平台的,依赖于内容技术,是当前处理结构画文档信息的有力工具,可扩展标记语言XML是一种简单的数据存储语言,使用一些简单的标记描述数据。
<?xml version="1.0"encoding="UTF-8"?> <persons> <person id="23"> <name>jack</name> <age>30</age> </person> <person id="20"> <name>rose</name> <age>25</age> </person> </persons>
以上是简单的XML的结构,XML结构解析如下:
1、节点
2、元素
3、属性和属性值
XML在不同的语言里解析方式都是一样的,只不过实现的语法不同而已。基本的解析方式有如下三种:
1、DOM(org.w3c.dom):"文档对象模型"方式,解析完的Xml将生成一个树状结构的对象。
2、SAX(org.xml.sax):以事件的形式通知程序,对xml进行解析。
3、XMLPULL(org.xmlpull.v1):类似于SAX方式,程序以“拉取”的方式对XML进行解析。
DOM解析方式:
DOM是一种用于XML文档对象模型,可用于直接访问XML文档的各个部位,在DOM中文档被模拟为树状,其中xml语法的每一个组成部分都表示一个节点,DOM允许用户便利文档树,从父节点移动到子节点的兄弟节点。并利用某节点类型特有的属性(元素具有属性,文本节点具有文本数据)
在DOM中,整个文档是一个节点文档,每一个xml标签是一个元素节点,包含xml元素中的文本是文本节点,每一个xml属性是一个属性节点。
SAX解析方式:
SAX是一种以时间驱动XML api,由它定义的事件流可以制定从解析器传到专门的处理程序的代码XML结构,简单的讲,它解析速度快,占用内存少。这种解析器比较适合android等移动设备。
SAX的优点:
因为SAX的优势是流的方式处理,当遇到一个标签的时候,并不会记录下当前所碰到的标签。也就是说,startElement方法中,你所知道的信息,仅仅是当前的签名的名字和属性,至于标签的潜逃结构,上层标签的名字,是否有子元素与其他结构相关的信息,都是不知道的。
PULL解析方式:
PULL解析器运行方式与sax解析器很相似,它提供了类似的事件。如开始元素和结束元素,使用parse.next()可以进行下一个元素并且出发相应的时间,时间将作为代码被发送,因此可以使用一个switch来对时间进行选择,然后进行相应的处理,。当开始解析元素的时候,调用parser.nextText()法官法可以获得下一个Text类型的元素。
综合以上三种解析方式,从内存的占用率来说:SX和PULL比DOM占用更少的内存解析方式,更加适合Android手机开发。
下面,我们以SAX解析方式为例,演示SAX解析xml文件的过程:
首先,要定义一个类用来继承DefaultHandler,之后重写startDocument,startElement,characters,EndElement方法。其中startDocument是在解析到开始文档的时候调用的方法,startElement是在解析开始元素的时候调用的,characters是在读取节点信息的时候调用,EndElement是在读取完成的时候调用的。
public class MyHandler extends DefaultHandler { // 存储单个解析的完整对象 private HashMap<String, String> map = null; // 存储所有解析的对象 private List<HashMap<String, String>> list = null; // 正在解析元素的标签 private String currentTag = null; // 解析当前元素的值 private String currentValue = null; // 解析当前的节点名称 private String nodeName = null; public MyHandler(String nodeName) { // TODO Auto-generated constructor stub this.nodeName = nodeName; } // 解析到开始文档的时候,触发startDocument @Override public void startDocument() throws SAXException { // 当读到第一个开始标签的时候会触发该方法 list = new ArrayList<HashMap<String, String>>(); super.startDocument(); } public List<HashMap<String, String>> getList() { return list; } // 解析到开始元素 @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { // 当遇到文档开头的时候调用该方法 if (qName.equals(nodeName)) { map = new HashMap<String, String>(); } if (attributes != null && map != null) { for (int i = 0; i < attributes.getLength(); i++) { map.put(attributes.getQName(i), attributes.getValue(i)); } } currentTag = qName; // super.startElement(uri, localName, qName, attributes); } // 读取文档节点内容 @Override public void characters(char[] ch, int start, int length) throws SAXException { // TODO Auto-generated method stub // 这个方法是用来处理XM;文件所读取到的内容 if (currentTag != null && map != null) { currentValue = new String(ch, start, length); if (currentValue != null && !currentValue.trim().equals("") && !currentValue.trim().equals("\n")) { map.put(currentTag, currentValue); } } // 把当前节点的对应的值和标签设置为空 currentTag = null; currentValue = null; // super.characters(ch, start, length); } // 读取文档节点内容完成时 @Override public void endElement(String uri, String localName, String qName) throws SAXException { // TODO Auto-generated method stub // 遇到结束标记的时候,调用该方法 if (qName.equals(nodeName)) { list.add(map); map = null; } super.endElement(uri, localName, qName); } }
PULL解析方法:
针对上述的xml文件中的节点元素名称做的一个pull解析器,收先要先声明一个类用来装载person对象,该类中存在 id,name,age三个属性并分别声明get和set方法,然后编写一个从服务器获取xml文件的方法,获取到服务器中的xml文件,并且以流的形式返回:
public class http { public http() { // TODO Auto-generated constructor stub } /** * 从服务器获取XML文件,返回一个流 * @param path * @return */ public static InputStream getXML(String path) { InputStream inputStream = null; try { URL url = new URL(path); if (url != null) { HttpURLConnection connection = (HttpURLConnection) url.openConnection(); connection.setReadTimeout(3000); connection.setDoInput(true); connection.setRequestMethod("GET"); int code = connection.getResponseCode(); if (code == 200) { inputStream = connection.getInputStream(); } } } catch (MalformedURLException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } return inputStream; } }获取到服务器中的xml文件后,开始使用pull方法解析xml数据了
public class PullXmlTools { //主要使用pull解析xml public PullXmlTools() { // TODO Auto-generated constructor stub } /** * * @param inputStream 从服务器获取xml文件,以流的形式返回 * @param encode 编码格式 需要跟xml格式一致 * @return * @throws XmlPullParserException * @throws IOException */ public static List<Person> parseXML(InputStream inputStream,String encode) throws XmlPullParserException, IOException{ List<Person> list =null; //用来装载解析每一个person节点的内容 Person person =null; //创建一个解析xml的工场 XmlPullParserFactory factory =XmlPullParserFactory.newInstance(); //获得xml解析类的引用 XmlPullParser parser =factory.newPullParser(); parser.setInput(inputStream,encode); //获得事件的类型 int eventType =parser.getEventType(); //判断是否读取到文档结束标签 while(eventType!=XmlPullParser.END_DOCUMENT){ switch (eventType){ case XmlPullParser.START_DOCUMENT: list = new ArrayList<Person>(); break; case XmlPullParser.START_TAG: if ("person".equals(parser.getName())) { //取出属性值,0表示第0个属性 int id = Integer.parseInt(parser.getAttributeName(0)); person.setId(id); }else if ("name".equals(parser.getName())) { String name = parser.nextText(); person.setName(name); }else if("age".equals(parser.getName())){ int age =Integer.parseInt(parser.nextText()); person.setAge(age); } break; case XmlPullParser.END_TAG: if ("person".equals(parser.getName())) { list.add(person); person = null; } break; } eventType =parser.next(); } return list; } }最后,在test文件中检测一下:
public class Test { public Test() { // TODO Auto-generated constructor stub } public static void main(String[] args) { String path ="http://192.168.199.247:8080/myhttp/person.xml"; InputStream inputStream = http.getXML(path); //定义一个List用来承装解析后的数据 List<Person> list =null; try { list = PullXmlTools.parseXML(inputStream, "utf-8"); } catch (XmlPullParserException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } //使用for循环来展示list中的数据,即解析xml文件后所得的数据 for(Person person:list){ System.out.println(person.toString()); } } }