xml解析库对比总结(解析方式,第三方库,TinyXml)

一. 解析方式

xml的2种解析方式(DOM和SAX解析方式): https://blog.csdn.net/weixin_42472048/article/details/81264570

dom解析和sax解析区别:
     dom方式解析
            根据xml的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象
            优点:很方便实现增删改操作
            缺点:如果文件过大,造成内存溢出
     sax方式解析
            采用事件驱动,边读边解析,从上到下,一行一行的解析,解析到某一个对象,返回对象名称,
            当SAX解析结束,不会保存任何XML文档的数据。
            优点:如果文件过大,不会造成内存溢出,方便实现查询操作
            缺点:不能实现增删改操作

二. 第三方库介绍对比:

尽管XML解析器有很多种,而且功能差异很大,甚至是支持跨平台、多语言,但是对于你的应用而言,尽量选择一种相对熟悉、功能够用的即可,没必要去追求庞杂的解析器,我们只需关注:功能够用、相对稳定、适合扩展这三个功能即可。一旦有问题,修正和扩展都要更为容易。

PugiXML:

仅DOM方式;速度快; https://www.cnblogs.com/haomiao/p/5041065.html

RapidXML:

仅DOM方式;速度快

libxml:

可以验证DTD;几乎适合于常见的所有操作系统下编译和开发使用; C代码支持XML解析最全的,支持xpath语法;

libxml++(地址:http://libxmlplusplus.sourceforge.net/)是对libxml XML解析器的C++封装版本。此外还有各种语言封装包,参加官方链接。

libxml的使用(1)--读取xml:https://www.cnblogs.com/fire909090/p/6798136.html

libxml2的安装及使用[总结]:https://www.cnblogs.com/Anker/p/3542058.html

Libxml2主要的优点有:

( http://blog.sina.com.cn/s/blog_a7c44c8801018qc5.html ):

          1.   安装、使用比较简单,容易入门;

          2.   支持的编码格式较多,能很好的解决中文问题(使用一个很简单的编码转换函数);

          3.   支持Xpath解析(这点对于任意定位xml文档中的节点还是很有用的哦);

          4.    支持Well-formed 和valid验证,具体而言支持DTD验证,Schema验证功能正在完善中(目前多数解析器都还不完全支持shema验证功能);

          5.   支持目前通用的Dom、Sax方式解析等等。

不足之处也是有的:

          1.  指针太多,使用不当时就会出现错误,在Linux系统中表现为常见的段错误,同样管理不当易造成内存泄漏;

           2.个人认为内面有些函数的功能设计的不是很好(比如获取Xpath函数,它不获取节点属性,这样子有些情况会定位不准)

C/C++利用libxml2高效输出XML大文件详解:https://www.jb51.net/article/128707.htm

Xerces:

支持SAX和DOM ;可以验证DTD;文件越大,element解析越慢;除了C++版本,Xerces同时还提供Xerces Java,Xerces Perl等版本。

TinyXML:

DOM方式;C++开发,支持Windows和Linux。小巧玲珑,非常适合存储简单数据,配置文件,对象序列化等数据量不是很大的操作。支持对XML的读取和修改,不直接支持XPath,需要借助另一个相关的类库TinyXPath才可以支持XPath.

一个例子:https://blog.csdn.net/woniu211111/article/details/76445059

TinyXml库 使用方法: https://blog.csdn.net/qq_26374395/article/details/80171906

使用TinyXML读写xml文件: https://blog.csdn.net/lgstudyvc/article/details/77859919

TinyXml快速入门: https://blog.csdn.net/qq_38022972/article/details/82221898

TinyXml入门简易教程: https://blog.csdn.net/qq_24571549/article/details/70980125

-------------------------------------------------------------------------------------------------

配置使用过程:

1. tinyxml在windows环境下编译:https://blog.csdn.net/u012870721/article/details/78237930

2. Windows下Tinyxml的正确配置:https://blog.csdn.net/iorijjw/article/details/8515268

  (在 "项目" -> "xxx 属性" -> "配置属性" -> "连接器" -> "输入" 中, 找到 "忽略特定默认库", 如果是 Debug 模式则向其中输入 libcmtd.lib 这步做与不做,有待进一步研究)

3. TinyXML Tutorial 中文指南:

           http://www.cnblogs.com/kex1n/archive/2010/10/03/1841502.html

在线文档: http://www.grinninglizard.com/tinyxmldocs/tutorial0.html
------------------------------------------------------------------

遇到的问题:

tinyxml中文乱码(内存模式): https://blog.csdn.net/myruo/article/details/81514118

-------------------------------------------------------------------------------------------------

一个简单的实例应用:写xml文件

#include "tinyXml.h"
#pragma comment(lib, "tinyxml.lib")
#pragma comment(lib, "tinyxmlSTL.lib")

int main()
{
    build_simple_doc();
    system("pause");
    return 0;
}
void build_simple_doc()
{
	/*
	
	
		
			
		
		
	
	*/

	TiXmlDocument doc;
	TiXmlDeclaration *decl = new TiXmlDeclaration("1.0", "utf-8", "");
	doc.LinkEndChild(decl);
	
	TiXmlElement *rootElement = new TiXmlElement("scene");
	rootElement->SetAttribute("version", "0.5.0");
	//TiXmlText *text = new TiXmlText("world");
	//rootElement->LinkEndChild(text);
	doc.LinkEndChild(rootElement);

	TiXmlElement *myIntegrator = new TiXmlElement("integrator");
	myIntegrator->SetAttribute("type", "path");
	rootElement->LinkEndChild(myIntegrator);

	TiXmlElement *myBoolean = new TiXmlElement("boolean");
	myBoolean->SetAttribute("name", "hideEmitters");
	myBoolean->SetAttribute("value", "false");
	myBoolean->SetAttribute("otherAttriube", "someValue");
	myIntegrator->LinkEndChild(myBoolean);
	/*
		注意:myBoolean没有EndChild, 所以不会有  这一行
			同一个element不能添加两次(树结构),会导致卡死!!
	*/

	TiXmlComment *comment = new TiXmlComment();
	comment->SetValue("物体模型");
	rootElement->LinkEndChild(comment);

	doc.SaveFile("example1_byhand.xml");
}

一个简单的实例应用:修改xml文件:

代码:

void modify_secene_xml(const char* pFilename)
{
	printf("File: %-s:\n", pFilename);

	TiXmlDocument doc(pFilename);
	if (!doc.LoadFile()) return;
	TiXmlHandle hDoc(&doc);
	TiXmlElement* pElem;
	TiXmlHandle hRoot(0);
	TiXmlHandle subRoot(0);

	pElem = hDoc.FirstChildElement().Element();
	if (!pElem) return;

	hRoot = TiXmlHandle(pElem);
		
	//pElem = hRoot.FirstChild("shape").FirstChildElement().Element();
	//pElem = pElem->NextSiblingElement()->NextSiblingElement();

	//// modify string in texture	
	pElem = hRoot.FirstChild("shape").FirstChild("bsdf").Element();
	subRoot = TiXmlHandle(pElem);
	pElem = subRoot.FirstChild("bsdf").FirstChild("texture").FirstChildElement().Element();
	printf( "%-20s\t-->\t", pElem->Attribute("value") );
	
	pElem->SetAttribute("value", "mydefine.png");			 // <--------------------
	printf("%-20s\n", pElem->Attribute("value"));
	
	//// modify value of string of emitter
	pElem = hRoot.FirstChild("emitter").FirstChild("string").Element();
	printf("%-20s\t-->\t", pElem->Attribute("value"));
	
	pElem->SetAttribute("value", "mydefineenvmap.exr");		// <--------------------
	printf("%-20s\n", pElem->Attribute("value"));

	doc.SaveFile(pFilename);
}
//************************************************************//
int main()
{
	modify_secene_xml("test_byhand.xml");					// <--------------------
	system("pause");
	return 0;
}

待修改文件:(修改 "original.png" 及 "original.exr" )



    
        
    
    
    
        
        
            
        
        
            
                
                    
                
            
        
    
    
        
        
            
        
        
            
        
        
            
            
            
            
        
    
    
    
        
        
    

打印结果:

三. 链接

C++各大有名库的介绍对比:https://blog.csdn.net/business122/article/details/78260909

常见C/C++ XML解析器比较:https://www.cnblogs.com/snailgardening/p/xml_jiexi.html

 

你可能感兴趣的:(c++)