xml基础
1、什么是XML?
Extensible Markup Language,翻译过来为可扩展标记语言。
2、XML技术用于解决什么问题?
XML语言出现的根本目标在于描述上图那种,在现实生活中经常出现的有关系的数据。
在XML语言中,它允许用户自定义标签。一个标签用于描述一段数据;一个
标签可分为开始标签和结束标签,在开始标签和结束标签之间,又可以使用其它标签
描述其它数据,以此来实现数据关系的描述。例如:
3、XML常见应用:
XML技术除用于保存有关系的数据之外,它还经常用作软件配置文件,以描述程
序模块之间的关系。
在一个软件系统中,为提高系统的灵活性,它所启动的模块通常由其配置文件
决定。例如一个软件在启动时,它需要启动A、B两个模块,而A、B这两个模块在
启动时,又分别需要A1、A2和B1、B2模块的支持,为了准确描述这种关系,此时使
用XML文件最为合适不过。
4、xml的语法:
一个XML文件分为如下几部分内容:
文档声明
元素
属性
注释
CDATA区 、特殊字符
处理指令(processing instruction)
5、XML语法-文档声明:
在编写XML文档时,需要先使用文档声明,声明XML文档的类型。
最简单的声明语法:
用encoding属性说明文档的字符编码:
用standalone属性说明文档是否独立:
6、规定
(1)XML元素指XML文件中出现的标签,一个标签分为开始标签和结束标签,:包含
标签体:www.baidu.cn
(2)一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套,绝对不允许
交叉嵌套 ,例如:
(3)格式良好的XML文档必须有且仅有一个根标签,其它标签都是这个根标签的子
孙标签。
(4)对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处
理。
(5)一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的
一些规范:
区分大小写,例如, 和 是两个不同的标记。
不能以数字或"_" (下划线)开头。
不能以xml(或XML、或Xml 等)开头。
不能包含空格。
名称中间不能包含冒号(:)。
(6)一个标签可以有多个属性,每个属性都有它自己的名称和取值,例如:
(7)属性值一定要用双引号(")或单引号(')引起来
(8)定义属性必须遵循与标签相同的命名规范
(9)在XML技术中,标签属性所代表的信息,也可以被改成用子元素的形式来描
述,例如:
(10)Xml文件中的注释采用:“” 格式。
注意:
XML声明之前不能有注释
注释不能嵌套,例如:
……
-->
(11)最好在名字里面不要出现点“.”
(12)最好不要使用“-”,而使用“_”
(13)名字尽量简洁,减小xml
(14)名称的大小写尽量统一
(15)名称可以使用非英文字母,但是主要以使用中文或其他文字时的字符集的设
置,有些软件不支持。
7、CDATA区:
在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理。
遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出。
语法:
]]>
8、转义字符: