dom4j解析

dom4j解析

1.简介

  当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的旧知识是可以完成的,

不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,

并提交对应的解析器,方便开发人员操作XML。

2.解析方式和解析器

开发中比较常见的解析方式有三种,如下:

 

   1.DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

 

    a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

 

    b) 缺点:XML文档过大,可能出现内存溢出显现。

 

   2.SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,

每执行一行,都将触发对应的事件。

 

    a) 优点:处理速度快,可以处理大文件

 

    b) 缺点:只能读,逐行后将释放资源。

 

      3. PULL:  Android内置的XML解析方式,类似SAX。

 

解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

 

 

 

 

 

 

 

 常见的解析开发包:

  JAXP: sun公司提供支持DOM和SAX开发包

  JDom:dom4j兄弟

  jsoup:一种处理HTML特定解析开发包

  dom4j:比较常用的解析开发包,hibernate底层采用。

3.DOM解析原理及结构模型

 

  XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,

 

并获得一个Document对象,通过Document对象就可以对DOM进行操作

dom4j解析_第1张图片

 

 

 dom4j解析_第2张图片

 

 

  DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!

4.API使用

 

  如果需要使用dom4j,必须导入jar包。

  dom4j必须使用核心类SaxReader加载xml文档获得Document通过Document对象获得文档的根元素,然后就可以操作了。

dom4j解析_第3张图片

步骤:

  1.获取解析器

  2.获得document文档对象

  3.获取根元素

  4.获取根元素下的子元素

  5.遍历子元素

  6.判断元素名称为servlet的元素

  7.获取servlet-name元素

  8.获取servlet-class元素

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.junit.Test;

public class TestDom4j {
    @Test
    public void testReadWebXML() {
        try {
            // 1.获取解析器
            SAXReader saxReader = new SAXReader();
            // 2.获得document文档对象
            Document doc = saxReader.read("src/com/oracle/demo06/web.xml");
            // 3.获取根元素
            Element rootElement = doc.getRootElement();
            // System.out.println(rootElement.getName());//获取根元素的名称
            // System.out.println(rootElement.attributeValue("version"));//获取根元素中的属性值
            // 4.获取根元素下的子元素
            List childElements = rootElement.elements();
            // 5.遍历子元素
            for (Element element : childElements) {
                //6.判断元素名称为servlet的元素
                if ("servlet".equals(element.getName())) {
                    //7.获取servlet-name元素
                    Element servletName = element.element("servlet-name");
                    //8.获取servlet-class元素
                    Element servletClass = element.element("servlet-class");
                    System.out.println(servletName.getText());
                    System.out.println(servletClass.getText());
                }
            }

        } catch (DocumentException e) {
            e.printStackTrace();
        }
    }

}

 

你可能感兴趣的:(dom4j解析)