XML(eXtensible Markup Language)

目录

为什么需要XML?

一 XML语法 

1.文档声明

2.元素

语法:

 3.属性

 4.注释

5.CDATA节

二 树结构

三 转义字符

四 DOM4J

1.XML解析技术

2.dom4j介绍

3.dom4j基本使用


XML 指可扩展标记语言(eXtensible Markup Language)。

XML 被设计用来传输和存储数据,不用于表现和展示数据,HTML 则用来表现数据。

为什么需要XML?

● 解决程序间数据传输的问题:=> 目前多用json替代

比如 qq 之间的数据传送,用 xml 格式来传送数据,具有良好的可读性,可维护性。

● xml 可以做配置文件

xml 文件做配置文件可以说非常的普遍,比如我们的 tomcat 服务器的 server.xml ,web.xml

● xml 可以充当小型的数据库 => 程序自己的数据格式存放

xml 文件做小型数据库,也是不错的选择,我们程序中可能用到的数据,如果放在数据库 中读取不合适(因为你要增加维护数据库工作),可以考虑直接用 xml 来做小型数据库 ,而且 直接读取文件显然要比读取数据库快

一 XML语法 

  • 文档声明
  • 元素
  • 属性
  • 注释
  • CDATA区,特殊字符

1.文档声明

XML 声明放在 XML 文档的第一行 , 由以下几个部分组成:

1.version - -文档符合 XML1.0 规范   2.encoding - -文档字符编码,比如"utf-8"

2.元素


    Tove
    Jani
    Reminder
    Don't forget me this weekend!

语法:

1.每个 XML 文档必须有且只有一个根元素

2.根元素是一个完全包括文档中其他所有元素的元素。

3.根元素的起始标记要放在所有其他元素的起始标记之前。

4.根元素的结束标记要放在所有其他元素的结束标记之后

5.XML 元素指 XML 文件中出现的标签,一个标签分为开始标签和结束标签,一个标签 有如下几种书写形式 包含标签体:www.sohu.cn 不含标签体的:, 简写为:

6.一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套,绝对不允许交叉嵌套 

元素命名规则:

 区分大小写,例如

和是两个不同的标记。

 不能以数字开头。

 不能包含空格。

 名称中间不能包含冒号(:)。

 如果标签单词需要间隔,建议使用下划线 比如 h

 3.属性


    mary
    18
    
  •  属性值用双引号(")或单引号(')分隔(如果属性值中有',用"分隔;有",用'分隔)
  • 一个元素可以有多个属性,它的基本格式为:<元素名 属性名="属性值">
  • 特定的属性名称在同一个元素标记中只能出现一次
  • 属性值不能包括& 字符

 4.注释


  •  注释内容中不要出现- -
  • 不要把注释放在标记中间
  • 注释不能嵌套
  • 可以在除标记以外的任何地方放注释

5.CDATA节

 有些内容不想让解析引擎执行,而是当作原始内容处理(即当做普通文本),可 以使用 CDATA 包括起来,CDATA 节中的所有字符都会被当作简单文本,而不是 XML 标记

  •  可以输入任意字符(除]]>外)
  • 不能嵌套

二 树结构

XML 文档必须包含根元素。该元素是所有其他元素的父元素。

XML 文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。

所有的元素都可以有子元素:


    
        Everyday Italian
        Giada De Laurentiis
        2005
        30.00
    
    
        Harry Potter
        J K. Rowling
        2005
        29.99
    
    
        Learning XML
        Erik T. Ray
        2003
        39.95
    

XML(eXtensible Markup Language)_第1张图片

三 转义字符

对于一些单个字符,若想显示其原始样式,也可以使用转义的形式予以处理

XML(eXtensible Markup Language)_第2张图片

四 DOM4J

DOM4J文档

1.XML解析技术

  • 不管是 html 文件还是 xml 文件它们都是标记型文档,都可以使用 w3c 组织制定的 dom 技术来解析
  • document 对象表示的是整个文档(可以是 html 文档,也可以是 xml)

早期 JDK 为我们提供了两种 xml 解析技术: DOM 和 Sax 

  1. dom 解析技术是 W3C 组织制定的,而所有的编程语言都对这个解析技术使用了自己 语言的特点进行实现。 Java 对 dom 技术解析也做了实现
  2. sun 公司在 JDK5 版本对 dom 解析技术进行升级:SAX( Simple API for XML ) SAX 解析,它是以类似事件机制通过回调告诉用户当前正在解析的内容。 是一行一行的读 取 xml 文件进行解析的。不会创建大量的 dom 对象。 所以它在解析 xml时在性能上优于 Dom 解析

第三方的XML解析技术

  1. jdom在dom基础上进行了封装
  2. dom4j又对jdom 进行了封装 ***
  3. pull主要用在Android手机开发,跟sax类似 都是事件机制解析xml文件

2.dom4j介绍

  •  Dom4j 是一个简单、灵活的开放源代码的库(用于解析/处理 XML 文件)。Dom4j 是由早期 开发 JDOM 的人分离出来而后独立开发的。

  •  与 JDOM 不同的是,dom4j 使用接口和抽象基类,虽然 Dom4j 的 API 相对要复杂一些, 但它提供了比 JDOM 更好的灵活性。
  •  Dom4j 是一个非常优秀的 Java XML API,具有性能优异、功能强大和极易使用的特点。 现在很多软件采用的 Dom4j。
  •  使用 Dom4j 开发,需下载 dom4j 相应的 jar 文件

3.dom4j基本使用

    public static void getDocument() throws DocumentException {

        ========================读取========================

        //读取XML文件,获取document对象
        SAXReader reader = new SAXReader();//创建解析器
        Document document1 = reader.read(new File("src\\com\\web\\helloXML.xml"));

        //解析XML形式文本,获取document对象
        String xml="";
        Document document2 = DocumentHelper.parseText(xml);

        //主动创建document对象
        Document document3 = DocumentHelper.createDocument();
        Element root = document3.addElement("members");

        ========================遍历=======================

        //1. 得到 rootElement, 你是 OOP
        Element rootElement = document.getRootElement();

        //2. 得到 rootElement 的 student Elements
        List students = rootElement.elements("student");

        for (Element student : students) {//element 就是 Student 元素/节点
            //获取 Student 元素 的 name Element
            Element name = student.element("name");
            Element age = student.element("age");
            Element resume = student.element("resume");
            Element gender = student.element("gender");

            System.out.println("学生信息= " + name.getText() + " " + age.getText() +
                " " + resume.getText() + " " + gender.getText());
        }

        =======================CRUD=======================
        createELement() addAttribute() add() remove() setText()

    }

你可能感兴趣的:(Web,xml)