超越学XML&DTD笔记技术总结(之一)

>> XML定义:
XML(Extensible Markup Language)可扩展的标记语言,它是标准通用标记语言(Standard Generalized Markup Language,SGML)的一个子集。

>> W3C是万维网联盟(World Wide Web Consortium)W3C不是官方组织,它发布的规范为推荐(建议)标准。

>> XML对文档格式的要求须注意的地方:
1)所有的标签都区分大小写
2)所有的标签的属性值必须用双引号或单引号括起来.

>>XML声明:
〈?xml version="1.0" encoding="gb2312" standalone="yes"?〉//在?左右两边不能有空格,XML声明必须在第一行,前面不能有任何字符

>>文档类型声明:DTD
用DTD(Document Type Definition,文档类型
定义),规范XML文档 DTD文件是一个文本文件,用.dtd作为扩展名。
>>XML元素组成:
1)开始标签
2)元素内容
3)结束标签

>>XML元素的四种形式:
1)空元素------------〈student/〉//几乎不用
2)带有属性的空元素-------〈student name="张三" age="18"/〉
3)带有内容的元素--------〈student〉这是一个学生的信息〈name〉张三〈/name〉〈age〉28〈/age〉〈/student〉
4)带有内容和属性的元素----- 〈student name="张三"〉〈age〉28〈/age〉〈/student〉

>> 元素和标签之间的区别:
元素是指开始标签、结束标签以及两者之间的一切内容,包括属性、文本、注释及子元素。标签是一对尖括号< > 和两者之间的内容,包括元
素名和所有属性。

例:〈font color="blue"〉是一个标签,〈/font〉也是一个标签,〈font color="blue"〉Hello〈/font〉则是一个元素

>> 元素内容的构成:
1)子元素-----在类似于之间的元素
2)字符数据----除&、< 、]]〉的任何字符
3)字符引用和实体引用----如&字符引用为&#x3c;<字符预定义实体引用为&lt;
4)CDATA段----CDATA段以〈![开始,以]]〉结束,CDATA段中的内容不被XML处理器分析,所以可以含有任意字符,写程式代码时可以用到,以结束,特别时可用]]〉解决问题(和以上不同的是多个空格)

>> XML的注释:
 〈!-- 和 --〉之间的内容被xml处理器忽略

>> 处理指令(Processing Instructions , PI)
常见的使用样式表单的处理指令:
〈?xml-stylesheet href="hello.css" type="text/css"?〉
 对于不认识的处理指令,大多数应用程序采取忽略的方式进行处理。

>>空白处理
 XML文档中可以在元素中使用一个特殊的属性xml:space , 来通知应用程序保留此元素中的空白 
xml:space属性必须被声明为Enumerated(枚举)类型,值必须为“default”和“preserve”两者之一,也可以两个都取.
 例:
 〈!ATTLIST poem xml:space (default|preserve) 'preserve'〉

 〈!ATTLIST pre xml:space (preserve) #FIXED 'preserve'〉

>>行尾处理
XML数据以行来分隔,空白字符以ASCII码行尾控制字符:回车(CR,#xA)  换行(LF,#xD).WIN和LINUX等应用方式不同,为了简化工作要将所有的两字符序列#xD#xA,以及单独的#xD字符转换成单个的#xA字符

>>语言标识
 XML文档中可以在元素中使用一个特殊的属性xml:lang
例:〈p xml:lang="en"〉The quick brown fox jumps over the lazy dog.〈/p〉

    〈p xml:lang="en-GB"〉What color is it ?〈/p〉

    〈p xml:lang="en-US"〉What color is it ?〈/p〉
xml:lang的一个简单的声明可以采用如下形式:

xml:lang NMTOKEN #IMPLIED

你可能感兴趣的:(java,xml)