XML

一、什么是XML?

XML指可扩展标记语言
XML是一种标记语句,很类似HTML
XML标签没有被预定义,需要自行定义标签

二、XML和HTML的差异:

  1. XML为不同的目的而设计
  2. XML被设计为传输和存储数据,其焦点是数据的内容,HTML被设计用来显示数据, 其焦点是数据的外观
  3. XML意在传输信息,而HTML意在显示信息

三、XML的特点

  1. XML可以自定义标签

George
John
Reminder
Don't forget the meeting!

上例中的标签没有在任何XML标准中定义过,比如这些标签都是有作者自己发明的

  1. XML必须包含根元素
    XML 文档必须有一个元素是所有其他元素的父元素。该元素称为根元素。


    George
    John
    Reminder
    Don't forget the meeting!

如上所示,XML文件的根元素为note,剩下的4行描述的是根的子元素
所有的XML标签都必须有关闭标签,在XML中省略标签是非法的,所有的元素都必须有关闭标签。
如下所示:

This is a paragraph

This is another paragraph

  1. XML标签对大小写敏感
    XML 标签对大小写敏感。在 XML 中,标签 与标签 是不同的。
    必须使用相同的大小写来编写打开标签和关闭标签:
这是错误的。
这是正确的。 

XML必须正确的嵌套:如下所示:由于 元素是在 元素内打开的,那么它必须在 元素内关闭。

This text is bold and italic
  1. XML 的属性值须加引号
    与 HTML 类似,XML 也可拥有属性(名称/值的对)。
    在XML 中,XML的属性值须加引号。请研究下面的两个XML文档。第一个是错误的,第二个是正确的:
     
     George
     John
      
     
     George
     John
      
    

在第一个文档中的错误是,note 元素中的 date 属性没有加引号。

  1. 标签可以自由命名
  2. 标签成对出现
  3. 标签可以重名

四、XML 中的注释

在 XML 中编写注释的语法与 HTML 的语法很相似:

 

五、什么是 XML 元素?

XML 元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。
元素可包含其他元素、文本或者两者的混合物。元素也可以拥有属性。



  Harry Potter 
  J K. Rowling 
  2005 
  29.99 


  Learning XML 
  Erik T. Ray 
  2003 
  39.95 

 

在上例中, 都拥有元素内容,因为它们包含了其他元素。 只有文本内容,因为它仅包含文本。
在上例中,只有 元素拥有属性 (category="CHILDREN")。

六、XML 命名规则

XML 元素必须遵循以下命名规则:

  • 名称可以含字母、数字以及其他的字符
  • 名称不能以数字或者标点符号开始
  • 名称不能以字符 “xml”(或者 XML、Xml)开始
  • 名称不能包含空格

七、XML读取文本

from xml.dom import minidom

打开文件

root =minidom.parse(filepath)
firstnode =root.getElementsByTagName(onenode)[0]
secondnode=firstnode.getElementsByTagName(twonodee)[0].firstChild.data

你可能感兴趣的:(XML)