Expat学习笔记(1)

expat是一个由C语言编写的XML解析库。James Clark创建了这个库,现在是制定XML标准的W3组织的技术leader。现在的版本是2.0。2.0开始就由Clark Cooper领导的开发组在sourceforge.net负责开发。

expat是一个基于SAX模型的、非验证(默认,v1.2开始提供验证接口,需要用户手动处理)的轻量级XML解释器。

          目前XML的解析主要有两大模型:SAXDOM

      其中SAX(Simple API for XML)是基于事件的解析方法。基本工作原理是分析XML文档,通过触发事件来通知用户解析的结果。这种方式占用内存少,速度快,但用户程序相应得会比较复杂。

      而DOM(Document Object Model),则是一次性将整个XML文档进行分析,在内存中以树结构保存解析结果。同时,向用户提供一系列的接口来访问和编辑该树结构。这种方式占用内存大,速度往往慢于SAX,但可以给用户提供一个面向对象的访问接口,对用户更为友好。

      对于一个特定的XML文档而言,其正确性分为两个层次。首先是其格式应该符合XML的基本格式要求,比如第一行要有声明,标签的嵌套层次必须前后一致等等,符合这些要求的文件,就是一个合格的XML文件,称作well-formatted。但除此之外,一个XML文档因其内容的不同还必须在语义上符合相应的标准,这些标准由相应的DTD文件或者Schema文件来定义,符合了这些定义要求的XML文件,称作valid

      因此,解析器也分为验证和非验证两种。是验证的会跟据XML文件中的声明,用相应的DTD文件对XML文件进行校验,检查它是否满足DTD文件的要求。非验证性的则忽略DTD文件,只要基本格式正确,就可以进行解析。

参考其他资料,XML解析库简单总结如下:

名称

访问接口

是否支持验证

备注

Expat

SAX

手动


LibXML2

SAX/DOM

 

TinyXml

DOM

 

XML4C

SAX/DOM

Xerces-C是一家,不过用了ICU,国际化似乎更好

Xerces-C

SAX/DOM

 

XML Booster

Local

不清楚

这个库不是特别了解,好像是类似yacc那样,可以生成一个特定的解析器,估计效率应该很高(看名字也像)。

 

 

 

你可能感兴趣的:(XML)