XML小结

          一、XML简介
          1、XML是指可扩展标记语言(eXtensible Markup Language),用户自定义的标签。相对于HTML来讲的。
          2、XML被设计的宗旨是表示数据。HTML是用来显示数据的。目前经常使用的XML版本是1.0
          3、XML除了表示数据外。在实际的企业开发中,主要用XML作为程序的配置文件。
          二、XML的基本语法

          1)文档声明

 

           编写xml文件的时候,必须要添加声明, 声明必须出现在第一行。
           最简单的文档声明:<?xml version="1.0"?>
           如果要添加中文字符: 需要给其设定encoding属性。
           <?xml version="1.0" encoding="gbk"?>
           standalone 属性, 用来说明xml 文档是否独立.
           注意:在写标点符号的时候,需要是英文的标点符号。
           2)元素
           a) 一个xml的元素也可以叫做标签, 这个必须要有开始和结束标签。   如果标签中没有标签体,那么也可以简写成, 例如 :<北京/>   , 标签要合理的嵌套。 一个xml 文档必须有且仅有一个根标签。
           b) xml中的空格和换行会被当做元素内容去处理,所以在实际开发过程中,需要将 空格和换行给去掉。
           3)属性
           一个xml标签可以有多个属性,语法类似 html中设置属性的语法。 <mytag name="value"/>
           其中,标签中的属性也可以改写成这样一种形式:
           <mytag>
                  <name>
                           <firstname></firstnamename>
                           <secondname></secondname>
                </name>
           </mytag>
            4注释  
            注释的格式:<!--    --> 注释也不能够嵌套。 xml中的注释不能够出现在第一行.
            5.CDATA区 、
            CDATA (Character Data) 的缩写。实际开发过程中一些数据可能不想让解析引擎处理.
  就可以把它们放到CDATA区中。
            <![CDATA[
                      文本内容
             ]]>
             特殊字符:
             &  &            ampersand
             >  >             great than
             <  <             less than
             "  "               quotation
             '  '           apostrophe
             6.处理指令(processing instruction) (PI)
             <?xml-stylesheet type="text/css" href="s.css"?> 文档的声明也是一个处理指令
             三、XML的约束
             1、格式良好的XML文档:符合XML语法的。
             2、有效的XML文档:遵循约束规范的。 格式良好的不一定是有效的,但有效的必定格式良好。
             四、DTD的基本语法
             1、DTD:Document Type Definition
             2、作用:约束XML的书写规范。
             3、DTD文件保存到磁盘时,必须使用UTF-8编码
             4、如何引入外部的DTD文档来约束当前的XML文档
             DTD文件在本地:<!DOCTYPE 根元素名称 SYSTEM "DTD文件的路径">
             DTD文件在网络上:<!DOCTYPE 根元素名称 PUBLIC "DTD名称" "DTD的路径URL">
             5、DTD的语法细节
             5.1定义元素
             语法:<!ELEMENT 元素名称 使用规则>
             使用规则:
             (#PCDATA):指示元素的主体内容只能是普通的文本.(Parsed Character Data)
             EMPTY:指示元素的不能有主体内容。
             ANY:用于指示元素的主体内容为任意类型 (子元素):指示元素中包含的子元素
如果子元素用逗号分开,说明必须按照声明顺序去编写XML文档, 如果子元素用“|”分开,说明任选其一。 用+、*、?来表示元素出现的次数
             5.2定义元素的属性(attribute)
             语法:<!ATTLIST 哪个元素的属性
             属性名1 属性值类型 设置说明
             属性名2 属性值类型 设置说明>
             属性值类型:
             CDATA:说明该属性的取值为一个普通文本, ENUMERATED (DTD没有此关键字):
             语法:<!ATTLIST 元素名称 (值1|值2) "值1">
             ID:属性的取值不能重复
             设置说明:
             #REQUIRED:表示该属性必须出现
             #IMPLIED:属性可有可无
             #FIXED:表示属性的取值为一个固定值 语法:#FIXED "固定值"
             直接值:表示属性的取值为该默认值
             5.2定义实体
             关键字ENTITY, 实体的定义分为引用实体和参数实体
             引用实体:
             作用:在DTD中定义,在XML中使用
             语法:<!ENTITY 实体名称 "实体内容">
             在XML中使用:&实体名称;
             参数实体:
             作用:在DTD中定义,在DTD中使用
             语法:<!ENTITY % 实体名称 "实体内容">
             在DTD中使用:%实体名称;
             五、XML解析方式概述
             1、常用XML的解析方式:DOM和SAX
              DOM:Document Object Model是W3C推荐使用的解析方式。
              SAX:Simple API for XML。非官方标准。
              2、常用解析开发包:
              JAXP:SUN推出的实现,能进行DOM和SAX方式解析 Dom4J, JDom等。
              六、JAXP进行DOM解析
              JAXP的API都在JavaSE中。
              org.w3c.dom:提供DOM方式解析XML的标准接口。
              org.xml.sax:提供SAX方式解析XML的标准接口。

              javax.xml:提供了解析XML文档的类。

你可能感兴趣的:(XML小结)