一.XML简介
1.可扩展性标记语言(eXtensible Markup Language)
2.XML用于描述数据
3.应用场合:
(1)持久化存储数据
(2)数据交换
(3)数据配置
4.XML语法
(1)文档类型:
在编写XML文档时,需要先使用文档声明,声明XML文档的类型。
最简单的声明语法:

用encoding属性说明文档的字符编码:

(2)元素
对于XML标签中出现的所有空格和换行,XML解析程序都会当标签中的内容进行处理,例如:下面两段内容的意义是不一样的:

Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

由于在XML中,空格和换行都作为原始内容被处理,所以,在编写XML文件时,使用换行和缩进等方式来让原文中的把内容清晰可读的“良好”书写习惯可能要被迫改变
(3)注释
XML文件中的注释采用:“”格式
注意:
XML声明之前不能有注释
注释不能嵌套
(4)格式:
必须有XML声明语句
必须有且仅有一个根元素
标签大小写敏感
属性值用双引号或单引号
标签成对
元素正确嵌套
例1(联系):
使用XML描述下表中的学生成绩信息,XML文件为student.xml

XML表示如下:



    
        1
        张同
        java
        89
    
    
        2
        李佳
        sql
        58
    

将文件拉入浏览器看是否可以显示:
显示结果:

二.DOM(Doncument Object Model)解析
1.DOM解析是将XML文件在的内存中换成一个文档对象模型(通常称为DOM树),应用程序可以在任何时候访问XML文档中的任何一部分数据,因此,DOM解析的机制也被称为随机访问机制。
注意:DOM解析对内存的需求比较高
2.DOM解析的步骤:
(1)建立DocumentBuilderFactory
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

(2)建立DocumentBuilder
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

(3)建立Document
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

(4)建立NodeList

Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析
(5)进行XML信息读取
3.DOM数模型
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析_第1张图片
例2(DOM解析XML文件,我们以刚才写好的XML文件为例):

package org.xml.dom;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;

public class DOMParserDemo {

    public static void main(String[] args) {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();// 1.建立DOM工厂
        DocumentBuilder builder = null;
        try {
            builder = factory.newDocumentBuilder();// 2.获得DOM解析器
            Document document = builder.parse("e:" + File.separator
                    + "userinfo.xml");// 3.指定解析的文件路径,将XML文件在解析成DOM树
            NodeList nodelist = document.getElementsByTagName("province");// 根据标签名获取获取所有该标签名的节点
            String value = nodelist.item(3).getFirstChild().getTextContent();// 获取节点中的内容
            System.out.println("解析节点名称为province的第三个元素中的内容为:" + value);
            System.out.println("获取节点名称:" + nodelist.item(3).getNodeName());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

}

运行结果:

Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

例3(动态创建XML文件):

package org.xml.dom;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Text;

public class DOMCreateDemo {

    public static void main(String[] args) {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();// 1.创建DOM工厂
        DocumentBuilder builder = null;
        try {
            builder = factory.newDocumentBuilder();// 2.获取DOM解析器
            Document doc = builder.newDocument();// 3.新建文档
            Element students = doc.createElement("students");
            Element student = doc.createElement("student");
            Element id = doc.createElement("id");
            Element name = doc.createElement("name");
            Element subject = doc.createElement("subject");
            Element score = doc.createElement("score");
            Text idtext = doc.createTextNode("1");
            Text nametext = doc.createTextNode("王昭君");
            Text subjecttext = doc.createTextNode("java");
            Text scoretext = doc.createTextNode("99.4");
            students.appendChild(student);
            student.appendChild(id);
            student.appendChild(name);
            student.appendChild(subject);
            student.appendChild(score);
            id.appendChild(idtext);
            name.appendChild(nametext);
            subject.appendChild(subjecttext);
            score.appendChild(scoretext);
            doc.appendChild(students);
            TransformerFactory factory2 = TransformerFactory.newInstance();
            Transformer tf = factory2.newTransformer();
            tf.setOutputProperty(OutputKeys.INDENT, "yes");//自动换行
            tf.setOutputProperty(OutputKeys.ENCODING, "GBK");
            DOMSource soure = new DOMSource(doc);// 生成DOMSource里边包含了doc对象
            StreamResult rs = new StreamResult(new File("f:" + File.separator
                    + "student.xml"));//StreamResult封装了目标输出文件
            tf.transform(soure, rs);//开始写入
            System.out.println("student.xml文件生成成功......");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

}

运行结果:

Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

三.SAX(Simple APIs for XML)解析
1.SAXs是一个用于处理XML事件驱动的“推”模型,在读取文档时激活一系列事件,这些事件被推给事件处理器,然后由事件处理器提供对文档内容的访问
2.通常用于查找,读取XML数据
3.SAX解析步骤:
(1)编写SAX解析器,该解析器类继承自DefaultHanderler类,同时覆写相关方法
(2)建立SAX解析工厂:
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

(3)构造解析器:
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

(4)解析XML:
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

例4(利用SAX解析XML文档):
(1)自定义SAX解析器

package org.xml.saxdemo;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

//自定义解析器
public class MySAXHandler extends DefaultHandler {

    // 文档开始解析时自动调用该方法
    @Override
    public void startDocument() throws SAXException {
        System.out.println("XMl文档开始解析..");
    }

    // 开始解析元素时,自动调用此方法
    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        System.out.print("<" + qName);
        for (int i = 0; i < attributes.getLength(); i++) {
            System.out.print(" " + attributes.getLocalName(i) + "=\""
                    + attributes.getValue(i) + "\"");
        }
        System.out.print(">");
    }

    // 元素解析结束时自动调用该方法
    @Override
    public void endElement(String uri, String localName, String qName)
            throws SAXException {
        System.out.print("");
    }

    // 解析文本数据时自动调用该方法
    @Override
    public void characters(char[] ch, int start, int length)
            throws SAXException {
        System.out.print(new String(ch, start, length));
    }

    // 文档解析结束时自动调用该方法
    @Override
    public void endDocument() throws SAXException {
        System.out.println("文档解析结束..");
    }
}

(2)测试解析XML文件

package org.xml.saxdemo;

import java.io.File;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

public class SAXDemo {

    public static void main(String[] args) {
        MySAXHandler handler=new MySAXHandler();
        //1.建立sax解析工厂
        SAXParserFactory factory=SAXParserFactory.newInstance();
        //2.构造解析器
        try {
            SAXParser parser=factory.newSAXParser();
            //3.解析XML
            parser.parse("e:"+File.separator+"userinfo.xml",handler );
        } catch (Exception e) {
            e.printStackTrace();
        } 
    }

}

运行结果:
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析_第2张图片

例5(解析XML文档并将其封装如JavaBean对象中):
(1)编写JavaBean代码:
User对象:

package org.xml.saxbean2;

import java.util.List;

public class User {
    private String id;
    private String name;
    private List
adds; public String getId() { return id; } public void setId(String id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public List
getAdds() { return adds; } public void setAdds(List
adds) { this.adds = adds; } @Override public String toString() { return "User [id=" + id + ", name=" + name + ", adds=" + adds + "]"; } }

Address对象:

package org.xml.saxbean2;

public class Address {
    private String type;
    private String province;
    private String city;

    public String getType() {
        return type;
    }

    public void setType(String type) {
        this.type = type;
    }

    public String getProvince() {
        return province;
    }

    public void setProvince(String province) {
        this.province = province;
    }

    public String getCity() {
        return city;
    }

    public void setCity(String city) {
        this.city = city;
    }

    @Override
    public String toString() {
        return "Address [type=" + type + ", province=" + province + ", city="
                + city + "]";
    }

}

(2)自定义解析器:

package org.xml.saxbean2;

import java.util.*;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

// SAX解析器
public class MySAXHandler extends DefaultHandler {
    private User user;
    private Address address;
    private List
addressList; private List userList; private String text; // 存储文本 // XML文档开始解析时自动调用该方法 @Override public void startDocument() throws SAXException { System.out.println("开始读取XML文档.."); } // 开始解析文档元素时自动调用该方法 @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { if ("users".equals(qName)) { userList = new ArrayList(); } else if ("user".equals(qName)) { user = new User(); } else if ("adds".equals(qName)) { addressList = new ArrayList
(); } else if ("address".equals(qName)) { address = new Address(); address.setType(attributes.getValue(0)); } } // 解析文本数据时调用 @Override public void characters(char[] ch, int start, int length) throws SAXException { text = new String(ch, start, length); } // 元素解析完毕时开始调用 @Override public void endElement(String uri, String localName, String qName) throws SAXException { if ("id".equals(qName)) { user.setId(text); } else if ("name".equals(qName)) { user.setName(text); } else if ("province".equals(qName)) { address.setProvince(text); } else if ("city".equals(qName)) { address.setCity(text); } else if ("address".equals(qName)) { addressList.add(address); } else if ("adds".equals(qName)) { user.setAdds(addressList); } else if ("user".equals(qName)) { userList.add(user); } } // 文档解析完毕时开始调用 @Override public void endDocument() throws SAXException { for (User user : userList) { System.out.println(user); } } }

(3)测试代码

package org.xml.saxbean2;

import java.io.File;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

public class SAXDemo {

    public static void main(String[] args) {
        SAXParserFactory factory=SAXParserFactory.newInstance();
        try {
            SAXParser parser=factory.newSAXParser();
            parser.parse(new File("e:"+File.separator+"userinfo.xml"),new MySAXHandler());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

}

运行结果:
Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析
例5(解析网络XML文档,获取当前天气预报):
天气预报XML文档连接地址:
http://weather.xcyh.org/xml/7
(1)编写天气预报JavaBean

package org.xml.weather;

public class Data {
    private String data;
    private String weather;
    private String temperature;
    private String winddriect;

    public Data() {
    }

    public Data(String data, String weather, String temperature,
            String winddriect) {
        this.data = data;
        this.weather = weather;
        this.temperature = temperature;
        this.winddriect = winddriect;
    }

    public String getData() {
        return data;
    }

    public void setData(String data) {
        this.data = data;
    }

    public String getWeather() {
        return weather;
    }

    public void setWeather(String weather) {
        this.weather = weather;
    }

    public String getTemperature() {
        return temperature;
    }

    public void setTemperature(String temperature) {
        this.temperature = temperature;
    }

    public String getWinddriect() {
        return winddriect;
    }

    public void setWinddriect(String winddriect) {
        this.winddriect = winddriect;
    }

    @Override
    public String toString() {
        return "日期:" + data + ",  天气(weather):" + weather + ",  温度(temperature):"
                + temperature + ",  风向(winddriect):" + winddriect;
    }

}

(2)自定义SAX解析器

package org.xml.weather;

import java.util.ArrayList;
import java.util.List;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXWeatherHandler extends DefaultHandler {
    private Data data;
    private String text;// 用于接收本节点中的内容
    private List daList = new ArrayList();
    private boolean flag;

    @Override
    public void startDocument() throws SAXException {
        System.out.println("开始解析XML文件,获取天气预报..");
    }

    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        if ("data".equals(qName)) {
            data = new Data();
            flag = true;
        } else if ("live".equals(qName)) {
            flag = false;
        }
    }

    @Override
    public void characters(char[] ch, int localName, int qName)
            throws SAXException {
        text = new String(ch, localName, qName);
    }

    @Override
    public void endElement(String uri, String localName, String qName)
            throws SAXException {
        if ("date".equals(qName)) {
            data.setData(text);
        } else if ("weather".equals(qName)) {
            data.setWeather(text);
        } else if ("temperature".equals(qName)) {
            if (flag) {
                data.setTemperature(text);
            }
        } else if ("winddirect".equals(qName)) {
            if (flag) {
                data.setWinddriect(text);
            }
        } else if ("data".equals(qName)) {
            daList.add(data);
        }
    }

    @Override
    public void endDocument() throws SAXException {
        System.out.println("西安最近的天气状况为:");
        for (Data data : daList) {
            System.out.println(data);
        }
    }
}

(3)测试SAX解析,获取当前天气信息

package org.xml.weather;

import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

public class WeatherDemo {

    public static void main(String[] args) {
        SAXWeatherHandler weatherHandler = new SAXWeatherHandler();
        SAXParserFactory factory = SAXParserFactory.newInstance();
        URL url = null;
        InputStream input = null;
        try {
            url = new URL("http://weather.xcyh.org/xml/7");
            HttpURLConnection conn = (HttpURLConnection) url.openConnection();
            conn.connect();// 开始连接
            input = conn.getInputStream();
            SAXParser parser = factory.newSAXParser();
            parser.parse(input, weatherHandler);
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            try {
                input.close();
            } catch (Exception e) {
                e.printStackTrace();
            }
        }

    }

}

运行结果:

Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析_第3张图片

四.Dom4j解析XML
1.Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。
例6(利用dom4j解析XML文件):

package org.xml.dom4j;

import java.io.File;
import java.util.Iterator;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class DOM4jReaderDemo {

    public static void main(String[] args) {
        SAXReader saxReader=new SAXReader();
        try {
            Document doc= saxReader.read(new File("e:"+File.separator+"userinfo.xml"));
            org.dom4j.Element root=doc.getRootElement();//获取根节点
            Iterator iter=root.elementIterator();   // 获取根元素下的所有直属元素的迭代器
            while(iter.hasNext()){
                Element e= iter.next();   // 获取根元素下的每个直属元素
                List addressList=e.element("adds").elements("address");
                for(Element el:addressList){
                    String cityText=el.element("city").getText();
                    System.out.println(cityText);
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

}

运行结果:

Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析
例7(利用dom4j动态创建xml文档):

package org.xml.dom4j;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;

public class DOM4jCreateDemo {

    public static void main(String[] args) {
        Document doc=DocumentHelper.createDocument();
        Element root=doc.addElement("schools");
        Element school1=root.addElement("school");
        Element name1=school1.addElement("name");
        name1.setText("清华大学");
        Element address1=school1.addElement("address");
        address1.setText("北京");

        Element school2=root.addElement("school");
        Element name2=school2.addElement("name");
        name2.setText("南京大学");
        Element address2=school2.addElement("address");
        address2.setText("南京");

        OutputFormat format=OutputFormat.createPrettyPrint();   // 设置输出属性的
        format.setEncoding("GBK");   // 设置输出编码
        XMLWriter xw=null;
        try {
            xw=new XMLWriter(new FileOutputStream("c:"+File.separator+"mydom4j.xml"),format);
            xw.write(doc);  // 写出XML到磁盘上
            System.out.println("写出成功!");
        } catch (Exception e) {
            e.printStackTrace();
        }finally{
            try {
                xw.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        } 
    }

}

运行结果:

Java学习总结(二十一)——XML文档解析:DOM解析,SAX解析

写出文档展示:




  
    清华大学
    
北京
南京大学
南京
                                                                                【本次总结完毕】