xml文件的解析

一、XML解析的两种方式

1、DOM方式

  DOM:Document Object Model,这种方式是W3C推荐的处理XML的一种方式。
  DOM解析直接把整个xml文件加载进内存,我们可以非常方便的操作任意的标签和属性,但是如果xml过大,可能会出现内存溢出。
  我们主要使用这种方式。

2、SAX方式

   SAX:Simple API for XML。这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它。
  SAX解析是一个节点一个节点的解析,如果要获取指定节点,比较耗时。但是不会出现内存溢出。

3、XML解析开发包

  JAXP:是SUN 公司推出的解析标准实现;
  Dom4J:是开源组织推出的解析开发包,我们主要介绍DOM4J的用法。

二、Dom4J的使用

  由于DOM4J是开源组织推出的解析开发包,所以我们在使用的时候需要导入jar包。
  资源链接: https://pan.baidu.com/s/19x3EyBhlw5gDywGT-sSpIA 密码: 3722
  导入方式参考《JavaBean》 中BeanUtils的导入方法,有需要的读者可以查看。

1、Dom4J的方法概述

  • Document
      Element getRootElement():获取根元素对象(标签)
  • Element
      List elements():获取所有的子元素
      List elements(String name):根据指定的元素名称来获取相应的所有的子元素
      Element element(String name):根据指定的元素名称来获取子元素对象,如果元素名称重复,则获取第一个元素
  • 获取文本
      String elementText(String name):根据指定的子元素名称来获取子元素中的文本
      String getText():获取当前元素对象的文本
      void setText(String text):设置当前元素对象的文本
  • 跟属性相关的方法
      addElement(String name):加入元素
      public Element addAttribute(String name,String value):根据指定的属性名称和值进行添加或者修改
  • 其他方法
      addElement(String name):加入元素
      static Element createElement(String name):创建元素

2、解析文件的前提

  (1)有Document对象
  (2)有根元素对象(RootElement)

3、Dom4J的案例

  首先定义一个xml文件:


 
         
            郑州  
            高薪区 
          
        开封  
        洛阳  
        信阳   
    

  然后写一个工具类,将重复使用的一些方法放进去:

import java.io.FileOutputStream;
import java.io.IOException;

import org.dom4j.Document;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

public class Dom4JUtiles {
    private Dom4JUtiles() {
    }

    // 获取Document对象并返回
    public static Document getDocument() throws Exception {
        SAXReader reader = new SAXReader();
        // 括号内文件的路径要写全路径
        Document read = reader.read("src/com/itheima/review/city.xml");
        return read;
    }

    //注意: 由于我们调用方法完毕, 仅仅是在内存中进行了修改, 所以还需要用到OutputFormat和XMLWirter两个类配合使用将数据写入到文件
    // 将修改后的document对象重新写入xml文件中
    public static void WriteToXML(Document document) throws IOException {
        OutputFormat format = OutputFormat.createPrettyPrint();
        XMLWriter writer = new XMLWriter(new FileOutputStream("src/com/itheima/review/city.xml"),format);
        writer.write(document);
    }
}

案例1:得到某个具体的节点内容:打印"郑州"

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //1、得到某个具体的节点内容:打印"郑州"
        method1();
    }

    //1、得到某个具体的节点内容:打印"郑州"
    public static void method1() throws Exception{
        //获取document对象
        Document document = Dom4JUtiles.getDocument();
        //获取根元素的对象
        Element rootElement = document.getRootElement();
        //获取子元素对象的集合
        List elements = rootElement.elements();
        //获取郑州这个子元素的对象
        Element element = elements.get(0);
        //获取第一个子元素的名称
        String text = element.elementText("Name");
        //输出内容
        System.out.println(text);
    }
}

案例2:遍历所有元素节点:打印他们的元素名称。

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //2、遍历所有元素节点:打印他们的元素名称。
        method2();
    }

//2、遍历所有元素节点:打印他们的元素名称。
    public static void method2() throws Exception{
        //获取Document对象
        Document document = Dom4JUtiles.getDocument();
        //获取根元素对象
        Element rootElement = document.getRootElement();
        treeWalk(rootElement);
    }
    
    //利用递归的思想,获取每个子元素下面的所有元素
    public static void treeWalk(Element element){
        System.out.println(element.getName());
        
        List elements = element.elements();
        for (Element e : elements) {
            treeWalk(e);
        }
    }
}

案例3:修改某个元素节点的主体内容:信阳-->安阳

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //3、修改某个元素节点的主体内容:信阳-->安阳
        method3();
    }

//3、修改某个元素节点的主体内容:信阳-->安阳
    public static void method3() throws Exception{
        //获取Document对象
        Document document = Dom4JUtiles.getDocument();
        //获取根元素对象
        Element rootElement = document.getRootElement();
        //获取所有子元素的对象集合
        List elements = rootElement.elements();
        //获取信阳元素节点
        Element element = elements.get(3);
        //修改节点主题内容-->安阳
        element.setText("安阳");
        //写回xml文件
        Dom4JUtiles.WriteToXML(document);
    }
}

案例4:删除指定元素节点:删除元素开封

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //4、删除指定元素节点:删除元素开封
        method4();
    }

//4、删除指定元素节点:删除元素开封
    public static void method4() throws Exception{
        //获取Document对象
        Document document = Dom4JUtiles.getDocument();
        //获取根元素对象
        Element rootElement = document.getRootElement();
        //获取子元素的对象集合
        List elements = rootElement.elements();
        //获取开封子元素的对象
        Element element = elements.get(1);
        //由于子元素不能自己删除自己,所以我们需要获取子元素的父元素,调用父元素中的方法删除子元素
        Element parent = element.getParent();
        parent.remove(element);
        //写回xml文件
        Dom4JUtiles.WriteToXML(document);
        
    }
}

案例5:向指定元素节点中增加子元素节:添加一个新城市南阳

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //5、向指定元素节点中增加子元素节:添加一个新城市南阳
        method5();
    }

//5、向指定元素节点中增加子元素节:添加一个新城市南阳
    public static void method5() throws Exception{
        //获取Document对象
        Document document = Dom4JUtiles.getDocument();
        //获取根元素的对象
        Element rootElement = document.getRootElement();
        //创建新的元素节
        Element newElement = rootElement.addElement("City");
        //为新的元素节点添加内容
        newElement.setText("南阳");
        //写回文件
        Dom4JUtiles.WriteToXML(document);
        
    }
}

案例6:向指定元素节点上增加同级元素节点:在洛阳前面,添加一个三门峡

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //6、向指定元素节点上增加同级元素节点:在洛阳前面,添加一个三门峡
        method6();
    }

//6、向指定元素节点上增加同级元素节点:在洛阳前面,添加一个三门峡
    public static void method6() throws Exception{
        //首先创建一个新的元素
        Element createElement = DocumentHelper.createElement("City");
        createElement.setText("三门峡");
        
        //获取Document对象
        Document document = Dom4JUtiles.getDocument();
        //获取根元素对象
        Element rootElement = document.getRootElement();
        //获取所有子元素对象的集合
        List elements = rootElement.elements();
        elements.add(1, createElement);
        //写回文件
        Dom4JUtiles.WriteToXML(document);
    }
}

案例7:操作XML文件属性:打印State的Name

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //7、操作XML文件属性:打印State的Name
        method7();
    }

//7、操作XML文件属性:打印State的Name
    public static void method7() throws Exception{
        //获取Document对象
        Document document = Dom4JUtiles.getDocument();
        //获取根元素的对象
        Element rootElement = document.getRootElement();
        //获取根元素的属性的对象
        Attribute name = rootElement.attribute("Name");
        //获取属性的内容
        String text = name.getText();
        //打印属性
        System.out.println(text);
    }
}

案例8:添加属性:State: GDP="99999亿"

public class Dom4JTest {
    public static void main(String[] args) throws Exception {
        //8、添加属性:State: GDP="99999亿"
        method8();
    }

//8、添加属性:State: GDP="99999亿"
    public static void method8() throws Exception{
        //创建Document对象
        Document document = Dom4JUtiles.getDocument();
        //创建根元素对象
        Element rootElement = document.getRootElement();
        //为根元素添加属性
        rootElement.addAttribute("GDP", "99999亿");
        //写回文件
        Dom4JUtiles.WriteToXML(document);
        
    }
}

你可能感兴趣的:(xml文件的解析)