XML规范简单理解

xml 的特性

  1. xml的设计宗旨是传输数据,而html宗旨是显示内容。

  2. xml有自我描述性。

  3. 需要自定义标签。

  4. xml元素指的是从标签开始到结束的部分。元素可以包含其他元素,文本或者两者的混合物。

     
         
             Harry Potter
             J K. Rowling
             2008
             99.99
         
     
    

上例子中,只有book有属性。

xml的命名规则

  1. 名称可以含有数字,字母和其他字符。
  2. 不能以数字或者标点开始。
  3. 不能以xml开始。
  4. 不能包含空格。
  5. 避免有中划线"-"。可以使用下划线"_"。
  6. 避免":"。冒号会被转换为命名空间使用。
  7. 空标签的写法:或者

W3C对xml的一些规定

  1. xml对大小写敏感。
  2. 必须正确的嵌套。
  3. 必须有根元素。
  4. 属性值必须加引号。单引号和双引号都可以。
  5. 文本中的<必须被<代替。否则解析错误。
  6. 注释和html相同。
  7. xml中以\n来存储换行,win以\r\n存储换行,linux和unix以\r存储换行。
  8. 建议xml少用属性:属性无法包含多重值,属性无法描述为树结构,属性不易扩展,属性难以阅读。
  9. 元数据==存储数据的数据应当存储为属性。

xml的DTD(文档类型定义)

DTD的作用是定义xml的文档结构,使用一系列合法的元素来定义文档结构:

    
        
        
        
        
    ]>

而W3C支持一种基于XML的DTD代替者,名字为XML Schema:

    
    
        
            
            
            
            
        
    
    

xml有命名空间

如果两个xml文件同时使用相同的元素名称,那么命名会起冲突。
例如,一个表格:

Apple

一个有关桌子的信息:

Coffee table20

使用前缀

某个表格信息可以表示为:


    
    Apple
    

某个家具信息:


    Coffee table
    20

使用命名空间


    
    Apple
    

带有家具信息的xml:


    Coffee table
    20

通过xmlns将此xml与某个命名空间相关联。

默认命名空间

如果每次在元素前面加f:或者h:是件很繁琐的事情,以下办法就可以省去命名空间的前缀:

xmlns="namespaceURI"

xml文档的解析

xml文档中的所有文本均会被解析,这是由于每个元素中可能嵌套其他元素。

此处文本会被解析

除非用CDATA来标识出不应该被解析的部分

CDATA部分以""结束。


xml编码

编码方式

xml需要编码为unicode编码。

你可能感兴趣的:(XML规范简单理解)