jfkidear

创建xml文件

C++的XML编程经验――LIBXML2库使用指南

写这篇文章的原因有如下几点：1)C++标准库中没有操作XML的方法，用C++操作XML文件必须熟悉一种函数库，LIBXML2是其中一种很优秀的XML库，而且它同时支持多种编程语言；2)LIBXML2库的Tutorial写得不太好，尤其是编码转换的部分，不适用于中文编码的转换；3)网上的大多数关于Libxml2的介绍仅仅是翻译了自带的资料，没有详细介绍如何在windows平台下进行编程，更很少提到如何解决中文问题。

基于以上几点原因，决定写一个在Windows平台下，使用C/C++语言，应用LibXml2库来进行xml文档操作，同时使用ICONV库进行中文编码转换的文档。其中还涉及了Makefile、XPATH等相关内容。本文中所有的源代码在http://www.blogjava.net/Files/wxb_nudt/xml_src.rar。

1. 下载与安装LIBXML2和ICONV

Libxml2是一个C语言的XML程序库，可以简单方便的提供对XML文档的各种操作，并且支持XPATH查询，以及部分的支持XSLT转换等功能。Libxml2的下载地址是http://xmlsoft.org/，完全版的库是开源的，并且带有例子程序和说明文档。最好将这个库先下载下来，因为这样可以查看其中的文档和例子。

windows版本的的下载地址是http://www.zlatkovic.com/libxml.en.html；这个版本只提供了头文件、库文件和dll，不包含源代码、例子程序和文档。在文本中，只需要下载libxml2库、iconv库和zlib库就行了（注意，libxml2库依赖iconv和zlib库，本文中重点关注libxml2和iconv，zlib不介绍），我使用的版本是libxml2-2.6.30.win32.zip、zlib-1.2.3.win32.zip和iconv-1.9.2.win32.zip。

在编程的时候，我们使用windows版本的libxml2、zlib和iconv，将其解压缩到指定文件夹，例如D:"libxml2-2.6.30.win32，D:"zlib-1.2.3.win32以及D:"iconv-1.9.2.win32。事实上，我们知道在windows下面使用头文件、库文件和dll是不需要安装的，它又没有使用任何需要注册的组件或者数据库，只需要告诉编译器和链接器这些资源的位置就可以了。

注意：要在path变量中加上D:"iconv-1.9.2.win32"bin;D:"zlib-1.2.3.win32"bin;D:"libxml2-2.6.30.win32"bin这三个地址，否则在执行的时候就找不到。或者使用更简单的方法，把其中的三个dll到拷贝到system32目录中。

有两种方法来编译链接基于libxml2的程序，第一种是在VC环境中设置lib和include路径，并在link设置中添加libxml2.lib和iconv.lib；第二种是用编译器选项告诉编译器cl.exe头文件的位置，并用链接器选项告诉链接器link.exe库文件的位置，同时在windows环境变量path中添加libxml2中bin文件夹的位置，以便于程序运行时可以找到dll（也可以将dll拷贝到system32目录下）。显然我选择了第二种，那么编译链接一个名为CreateXmlFile.cpp源文件的命令如下：

cl /c /I D:"iconv-1.9.2.win32"include /I D:"libxml2-2.6.30.win32"include CreateXmlFile.cpp

link /libpath:D:"iconv-1.9.2.win32"lib /libpath:D:"libxml2-2.6.30.win32"lib CreateXmlFile.obj iconv.lib libxml2.lib

显然这样很费时，那么再不用makefile就显得矫情了，于是，一个典型的使用nmake.exe（VC自带的makefile工具）的文件如下：MAKEFILE

# 本目录下所有源代码的makefile，使用方法是nmake TARGET_NAME=源代码文件名字（不加后缀）

# 例如 nmake TARGET_NAME=CreateXmlFile

# Author: Wang Xuebin

# Flags - 编译debug版本

#指定要使用的库的路径,需要用户修改的变量一般放在makefile文件的最上面

LIBXML2_HOME = D:"libxml2-2.6.30.win32

ICONV_HOME = D:"iconv-1.9.2.win32

#指定编译器选项,/c表明cl命令只编译不链接;/MTd表明使用多线程debug库;/Zi表明产生完整的调试信息;

#/Od表明关闭编译优化;/D _DEBUG表明定义一个名为_DEBUG的宏

CPP_FLAGS=/c /MTd /Zi /Od /D _DEBUG

#链接选项,/DEBUG表明创建Debug信息

EXE_LINK_FLAGS=/DEBUG

#指定链接的库

LIBS=iconv.lib libxml2.lib

#指定编译路径选项,链接路径选项

INCLUDE_FLAGS= /I $(LIBXML2_HOME)"include /I $(ICONV_HOME)"include

LIB_PATH_FLAGS = /libpath:$(ICONV_HOME)"lib /libpath:$(LIBXML2_HOME)"lib

#################################################

# Targets 目标

$(TARGET_NAME) : $(TARGET_NAME).exe

clean : $(TARGET_NAME).exe

$(TARGET_NAME).obj : $(TARGET_NAME).cpp

cl $(CPP_FLAGS) $(INCLUDE_FLAGS) $(TARGET_NAME).cpp

$(TARGET_NAME).exe : $(TARGET_NAME).obj

link $(EXE_LINK_FLAGS) $(LIB_PATH_FLAGS) $(TARGET_NAME).obj $(LIBS)

clean : $(TARGET_NAME).exe

del $(TARGET_NAME).exe

del $(TARGET_NAME).obj

del $(TARGET_NAME).ilk

del $(TARGET_NAME).pdb

本文不准备介绍makefile的写法，但后续例子程序的编译链接依葫芦画瓢都没有问题，执行编译链接的命令如下：

nmake TARGET_NAME=CreateXmlFile

执行清理的命令如下：

nmake TARGET_NAME=CreateXmlFile clean

2. Libxml2中的数据类型和函数

一个函数库中可能有几百种数据类型以及几千个函数，但是记住大师的话，90%的功能都是由30%的内容提供的。对于libxml2，我认为搞懂以下的数据类型和函数就足够了。

2.1 内部字符类型xmlChar

xmlChar是Libxml2中的字符类型，库中所有字符、字符串都是基于这个数据类型。事实上它的定义是：xmlstring.h

typedef unsigned char xmlChar;

使用unsigned char作为内部字符格式是考虑到它能很好适应UTF-8编码，而UTF-8编码正是libxml2的内部编码，其它格式的编码要转换为这个编码才能在libxml2中使用。

还经常可以看到使用xmlChar*作为字符串类型，很多函数会返回一个动态分配内存的xmlChar*变量，使用这样的函数时记得要手动删除内存。

2.2 xmlChar相关函数

如同标准c中的char类型一样，xmlChar也有动态内存分配、字符串操作等相关函数。例如xmlMalloc是动态分配内存的函数；xmlFree是配套的释放内存函数；xmlStrcmp是字符串比较函数等等。

基本上xmlChar字符串相关函数都在xmlstring.h中定义；而动态内存分配函数在xmlmemory.h中定义。

2.3 xmlChar*与其它类型之间的转换

另外要注意，因为总是要在xmlChar*和char*之间进行类型转换，所以定义了一个宏BAD_CAST，其定义如下：xmlstring.h

#define BAD_CAST (xmlChar *)

原则上来说，unsigned char和char之间进行强制类型转换是没有问题的。

2.4 文档类型xmlDoc、指针xmlDocPtr

xmlDoc是一个struct，保存了一个xml的相关信息，例如文件名、文档类型、子节点等等；xmlDocPtr等于xmlDoc*，它搞成这个样子总让人以为是智能指针，其实不是，要手动删除的。

xmlNewDoc函数创建一个新的文档指针。

xmlParseFile函数以默认方式读入一个UTF-8格式的文档，并返回文档指针。

xmlReadFile函数读入一个带有某种编码的xml文档，并返回文档指针；细节见libxml2参考手册。

xmlFreeDoc释放文档指针。特别注意，当你调用xmlFreeDoc时，该文档所有包含的节点内存都被释放，所以一般来说不需要手动调用xmlFreeNode或者xmlFreeNodeList来释放动态分配的节点内存，除非你把该节点从文档中移除了。一般来说，一个文档中所有节点都应该动态分配，然后加入文档，最后调用xmlFreeDoc一次释放所有节点申请的动态内存，这也是为什么我们很少看见xmlNodeFree的原因。

xmlSaveFile将文档以默认方式存入一个文件。

xmlSaveFormatFileEnc可将文档以某种编码/格式存入一个文件中。

2.5 节点类型xmlNode、指针xmlNodePtr

节点应该是xml中最重要的元素了，xmlNode代表了xml文档中的一个节点，实现为一个struct，内容很丰富：tree.h

typedef struct _xmlNode xmlNode;

typedef xmlNode *xmlNodePtr;

struct _xmlNode {

void *_private;/* application data */

xmlElementType type; /* type number, must be second ! */

const xmlChar *name; /* the name of the node, or the entity */

struct _xmlNode *children; /* parent->childs link */

struct _xmlNode *last; /* last child link */

struct _xmlNode *parent;/* child->parent link */

struct _xmlNode *next; /* next sibling link */

struct _xmlNode *prev; /* previous sibling link */

struct _xmlDoc *doc;/* the containing document */

/* End of common part */

xmlNs *ns; /* pointer to the associated namespace */

xmlChar *content; /* the content */

struct _xmlAttr *properties;/* properties list */

xmlNs *nsDef; /* namespace definitions on this node */

void *psvi;/* for type/PSVI informations */

unsigned short line; /* line number */

unsigned short extra; /* extra data for XPath/XSLT */

};

可以看到，节点之间是以链表和树两种方式同时组织起来的，next和prev指针可以组成链表，而parent和children可以组织为树。同时还有以下重要元素：

l 节点中的文字内容：content；

l 节点所属文档：doc；

l 节点名字：name；

l 节点的namespace：ns；

l 节点属性列表：properties；

Xml文档的操作其根本原理就是在节点之间移动、查询节点的各项信息，并进行增加、删除、修改的操作。

xmlDocSetRootElement函数可以将一个节点设置为某个文档的根节点，这是将文档与节点连接起来的重要手段，当有了根结点以后，所有子节点就可以依次连接上根节点，从而组织成为一个xml树。

2.6 节点集合类型xmlNodeSet、指针xmlNodeSetPtr

节点集合代表一个由节点组成的变量，节点集合只作为Xpath的查询结果而出现（XPATH的介绍见后面），因此被定义在xpath.h中，其定义如下：

* A node-set (an unordered collection of nodes without duplicates).

typedef struct _xmlNodeSet xmlNodeSet;

typedef xmlNodeSet *xmlNodeSetPtr;

struct _xmlNodeSet {

int nodeNr; /* number of nodes in the set */

int nodeMax; /* size of the array as allocated */

xmlNodePtr *nodeTab;/* array of nodes in no particular order */

/* @@ with_ns to check wether namespace nodes should be looked at @@ */

};

可以看出，节点集合有三个成员，分别是节点集合的节点数、最大可容纳的节点数，以及节点数组头指针。对节点集合中各个节点的访问方式很简单，如下：

xmlNodeSetPtr nodeset = XPATH查询结果;

for (int i = 0; i < nodeset->nodeNr; i++)

{

nodeset->nodeTab[i];

}

注意，libxml2是一个c函数库，因此其函数和数据类型都使用c语言的方式来处理。如果是c++，我想我宁愿用STL中的vector来表示一个节点集合更好，而且没有内存泄漏或者溢出的担忧。

3. 简单xml操作例子

了解以上基本知识之后，就可以进行一些简单的xml操作了。当然，还没有涉及到内码转换（使得xml中可以处理中文）、xpath等较复杂的操作。

3.1 创建xml文档

有了上面的基础，创建一个xml文档显得非常简单，其流程如下：

l 用xmlNewDoc函数创建一个文档指针doc；

l 用xmlNewNode函数创建一个节点指针root_node；

l 用xmlDocSetRootElement将root_node设置为doc的根结点；

l 给root_node添加一系列的子节点，并设置子节点的内容和属性；

l 用xmlSaveFile将xml文档存入文件；

l 用xmlFreeDoc函数关闭文档指针，并清除本文档中所有节点动态申请的内存。

注意，有多种方式可以添加子节点：第一是用xmlNewTextChild直接添加一个文本子节点；第二是先创建新节点，然后用xmlAddChild将新节点加入上层节点。

源代码文件是CreateXmlFile.cpp，如下：

/********************************************************************

created: 2007/11/09

created: 9:11:2007 15:34

filename: CreateXmlFile.cpp

author: Wang xuebin

depend: libxml2.lib

build: nmake TARGET_NAME=CreateXmlFile

purpose: 创建一个xml文件

*********************************************************************/

#include <stdio.h>

#include <libxml/parser.h>

#include <libxml/tree.h>

#include <iostream.h>

int main()

{

//定义文档和节点指针

xmlDocPtr doc = xmlNewDoc(BAD_CAST"1.0");

xmlNodePtr root_node = xmlNewNode(NULL,BAD_CAST"root");

//设置根节点

xmlDocSetRootElement(doc,root_node);

//在根节点中直接创建节点

xmlNewTextChild(root_node, NULL, BAD_CAST "newNode1", BAD_CAST "newNode1 content");

xmlNewTextChild(root_node, NULL, BAD_CAST "newNode2", BAD_CAST "newNode2 content");

xmlNewTextChild(root_node, NULL, BAD_CAST "newNode3", BAD_CAST "newNode3 content");

//创建一个节点，设置其内容和属性，然后加入根结点

xmlNodePtr node = xmlNewNode(NULL,BAD_CAST"node2");

xmlNodePtr content = xmlNewText(BAD_CAST"NODE CONTENT");

xmlAddChild(root_node,node);

xmlAddChild(node,content);

xmlNewProp(node,BAD_CAST"attribute",BAD_CAST "yes");

//创建一个儿子和孙子节点

node = xmlNewNode(NULL, BAD_CAST "son");

xmlAddChild(root_node,node);

xmlNodePtr grandson = xmlNewNode(NULL, BAD_CAST "grandson");

xmlAddChild(node,grandson);

xmlAddChild(grandson, xmlNewText(BAD_CAST "This is a grandson node"));

//存储xml文档

int nRel = xmlSaveFile("CreatedXml.xml",doc);

if (nRel != -1)

{

cout<<"一个xml文档被创建,写入"<<nRel<<"个字节"<<endl;

}

//释放文档内节点动态申请的内存

xmlFreeDoc(doc);

return 1;

}

编译链接命令如下：

nmake TARGET_NAME=CreateXmlFile

然后执行可执行文件CreateXmlFile.exe，会生成一个xml文件CreatedXml.xml，打开后如下所示：

<?xml version="1.0"?>

<root>

<newNode1>newNode1 content</newNode1>

<newNode2>newNode2 content</newNode2>

<newNode3>newNode3 content</newNode3>

<node2 attribute="yes">NODE CONTENT</node2>

<son>

<grandson>This is a grandson node</grandson>

</son>

</root>

最好使用类似XMLSPY这样的工具打开，因为这些工具可以自动整理xml文件的栅格，否则很有可能是没有任何换行的一个xml文件，可读性较差。

3.2 解析xml文档

解析一个xml文档，从中取出想要的信息，例如节点中包含的文字，或者某个节点的属性，其流程如下：

l 用xmlReadFile函数读出一个文档指针doc；

l 用xmlDocGetRootElement函数得到根节点curNode；

l curNode->xmlChildrenNode就是根节点的子节点集合；

l 轮询子节点集合，找到所需的节点，用xmlNodeGetContent取出其内容；

l 用xmlHasProp查找含有某个属性的节点；

l 取出该节点的属性集合，用xmlGetProp取出其属性值；

l 用xmlFreeDoc函数关闭文档指针，并清除本文档中所有节点动态申请的内存。

注意：节点列表的指针依然是xmlNodePtr，属性列表的指针也是xmlAttrPtr，并没有xmlNodeList或者xmlAttrList这样的类型。看作列表的时候使用它们的next和prev链表指针来进行轮询。只有在Xpath中有xmlNodeSet这种类型，其使用方法前面已经介绍了。

源代码如下：ParseXmlFile.cpp

/********************************************************************

created: 2007/11/15

created: 15:11:2007 11:47

filename: ParseXmlFile.cpp

author: Wang xuebin

depend: libxml2.lib

build: nmake TARGET_NAME=ParseXmlFile

purpose: 解析xml文件

*********************************************************************/

#include <libxml/parser.h>

#include <iostream.h>

int main(int argc, char* argv[])

{

xmlDocPtr doc; //定义解析文档指针

xmlNodePtr curNode; //定义结点指针(你需要它为了在各个结点间移动)

xmlChar *szKey; //临时字符串变量

char *szDocName;

if (argc <= 1)

{

printf("Usage: %s docname"n", argv[0]);

return(0);

}

szDocName = argv[1];

doc = xmlReadFile(szDocName,"GB2312",XML_PARSE_RECOVER); //解析文件

//检查解析文档是否成功，如果不成功，libxml将指一个注册的错误并停止。

//一个常见错误是不适当的编码。XML标准文档除了用UTF-8或UTF-16外还可用其它编码保存。

//如果文档是这样，libxml将自动地为你转换到UTF-8。更多关于XML编码信息包含在XML标准中.

if (NULL == doc)

{

fprintf(stderr,"Document not parsed successfully. "n");

return -1;

}

curNode = xmlDocGetRootElement(doc); //确定文档根元素

/*检查确认当前文档中包含内容*/

if (NULL == curNode)

{

fprintf(stderr,"empty document"n");

xmlFreeDoc(doc);

return -1;

}

/*在这个例子中，我们需要确认文档是正确的类型。“root”是在这个示例中使用文档的根类型。*/

if (xmlStrcmp(curNode->name, BAD_CAST "root"))

{

fprintf(stderr,"document of the wrong type, root node != root");

xmlFreeDoc(doc);

return -1;

}

curNode = curNode->xmlChildrenNode;

xmlNodePtr propNodePtr = curNode;

while(curNode != NULL)

{

//取出节点中的内容

if ((!xmlStrcmp(curNode->name, (const xmlChar *)"newNode1")))

{

szKey = xmlNodeGetContent(curNode);

printf("newNode1: %s"n", szKey);

xmlFree(szKey);

}

//查找带有属性attribute的节点

if (xmlHasProp(curNode,BAD_CAST "attribute"))

{

propNodePtr = curNode;

}

curNode = curNode->next;

}

//查找属性

xmlAttrPtr attrPtr = propNodePtr->properties;

while (attrPtr != NULL)

{

if (!xmlStrcmp(attrPtr->name, BAD_CAST "attribute"))

{

xmlChar* szAttr = xmlGetProp(propNodePtr,BAD_CAST "attribute");

cout<<"get attribute = "<<szAttr<<endl;

xmlFree(szAttr);

}

attrPtr = attrPtr->next;

}

xmlFreeDoc(doc);

return 0;

}

编译链接命令如下：

nmake TARGET_NAME=ParseXmlFile

执行命令如下，使用第一次创建的xml文件作为输入：

ParseXmlFile.exe CreatedXml.xml

观察源代码可发现，所有以查询方式得到的xmlChar*字符串都必须使用xmlFree函数手动释放。否则会造成内存泄漏。

3.3 修改xml文档

有了上面的基础，修改xml文档的内容就很简单了。首先打开一个已经存在的xml文档，顺着根结点找到需要添加、删除、修改的地方，调用相应的xml函数对节点进行增、删、改操作。源代码见ChangeXmlFile，编译链接方法如上。执行下面的命令：

ChangeXmlFile.exe CreatedXml.xml

可以得到一个修改后的xml文档ChangedXml.xml，如下：

<?xml version="1.0"?>

<root>

<newNode2>content changed</newNode2>

<newNode3 newAttr="YES">newNode3 content</newNode3>

<node2 attribute="no">NODE CONTENT</node2>

<son>

<grandson>This is a grandson node</grandson>

<newGrandSon>new content</newGrandSon>

</son>

</root>

需要注意的是，并没有xmlDelNode或者xmlRemoveNode函数，我们删除节点使用的是以下一段代码：

if (!xmlStrcmp(curNode->name, BAD_CAST "newNode1"))

{

xmlNodePtr tempNode;

tempNode = curNode->next;

xmlUnlinkNode(curNode);

xmlFreeNode(curNode);

curNode = tempNode;

continue;

}

即将当前节点从文档中断链（unlink），这样本文档就不会再包含这个子节点。这样做需要使用一个临时变量来存储断链节点的后续节点，并记得要手动删除断链节点的内存。

3.4 使用XPATH查找xml文档

简而言之，XPATH之于xml，好比SQL之于关系数据库。要在一个复杂的xml文档中查找所需的信息，XPATH简直是必不可少的工具。XPATH语法简单易学，并且有一个很好的官方教程，见http://www.zvon.org/xxl/XPathTutorial/Output_chi/introduction.html。这个站点的XML各种教程齐全，并且有包括中文在内的各国语言版本，真是让我喜欢到非常！

使用XPATH之前，必须首先熟悉几个数据类型和函数，它们是使用XPATH的前提。在libxml2中使用Xpath是非常简单的，其流程如下：

l 定义一个XPATH上下文指针xmlXPathContextPtr context，并且使用xmlXPathNewContext函数来初始化这个指针；

l 定义一个XPATH对象指针xmlXPathObjectPtr result，并且使用xmlXPathEvalExpression函数来计算Xpath表达式，得到查询结果，将结果存入对象指针中；

l 使用result->nodesetval得到节点集合指针，其中包含了所有符合Xpath查询结果的节点；

l 使用xmlXPathFreeContext释放上下文指针；

l 使用xmlXPathFreeObject释放Xpath对象指针；

具体的使用方法可以看XpathForXmlFile.cpp的这一段代码，其功能是查找符合某个Xpath语句的对象指针：

xmlXPathObjectPtr getNodeSet(xmlDocPtr doc, const xmlChar *szXpath)

{

xmlXPathContextPtr context; //XPATH上下文指针

xmlXPathObjectPtr result; //XPATH对象指针，用来存储查询结果

context = xmlXPathNewContext(doc); //创建一个XPath上下文指针

if (context == NULL)

{

printf("context is NULL"n");

return NULL;

}

result = xmlXPathEvalExpression(szXpath, context); //查询XPath表达式，得到一个查询结果

xmlXPathFreeContext(context); //释放上下文指针

if (result == NULL)

{

printf("xmlXPathEvalExpression return NULL"n");

return NULL;

}

if (xmlXPathNodeSetIsEmpty(result->nodesetval)) //检查查询结果是否为空

{

xmlXPathFreeObject(result);

printf("nodeset is empty"n");

return NULL;

}

return result;

}

一个完整的使用Xpath的例子在代码XpathForXmlFile.cpp中，它查找一个xml文件中符合"/root/node2[@attribute='yes']"语句的结果，并且将找到的节点的属性和内容打印出来。编译链接命令如下：

nmake TARGET_NAME=XpathForXmlFile

执行方式如下：

XpathForXmlFile.exe CreatedXml.xml

观察结果可以看出找到了一个节点，即root下面node2节点，它的attribute属性值正好等于yes。更多关于Xpath的内容可以参考XPATH官方手册。只有掌握了XPATH，才掌握了使用大型XML文件的方法，否则每寻找一个节点都要从根节点找起，会把人累死。

4. 用ICONV解决XML中的中文问题

Libxml2中默认的内码是UTF-8，所有使用libxml2进行处理的xml文件，必须首先显式或者默认的转换为UTF-8编码才能被处理。

要在xml中使用中文，就必须能够在UTF-8和GB2312内码（较常用的一种简体中文编码）之间进行转换。Libxml2提供了默认的内码转换机制，并且在libxml2的Tutorial中有一个例子，事实证明这个例子并不适合用来转换中文。

所以需要我们显式的使用ICONV来进行内码转换，libxml2本身也是使用ICONV进行转换的。ICONV是一个专门用来进行编码转换的库，基本上支持目前所有常用的编码。它是glibc库的一个部分，常常被用于UNIX系统中。当然，在windows下面使用也没有任何问题。前面已经提到了ICONV的安装和使用方法，这里主要讲一下编程相关问题。

本节其实和xml以及libxml2没有太大关系，你可以把它简单看作是一个编码转换方面的专题。我们仅仅需要学会使用两个函数就可以了，即从UTF-8转换到GB2312的函数u2g，以及反向转换的函数g2u，源代码在wxb_codeConv.c中：

/********************************************************************

created: 2007/11/15

created: 15:11:2007 10:30

filename: wxb_codeConv.c

author: Wang xuebin

depend: iconv.lib

build: 不需要build，被包含到其它源代码中

purpose: 提供从UTF-8到GB2312的内码转换，以及反向的转换

*********************************************************************/

#include "iconv.h"

#include <string.h>

//代码转换:从一种编码转为另一种编码

int code_convert(char* from_charset, char* to_charset, char* inbuf,

int inlen, char* outbuf, int outlen)

{

iconv_t cd;

char** pin = &inbuf;

char** pout = &outbuf;

cd = iconv_open(to_charset,from_charset);

if(cd == 0)

return -1;

memset(outbuf,0,outlen);

if(iconv(cd,(const char**)pin,(unsigned int *)&inlen,pout,(unsigned int*)&outlen)

== -1)

return -1;

iconv_close(cd);

return 0;

}

//UNICODE码转为GB2312码

//成功则返回一个动态分配的char*变量，需要在使用完毕后手动free，失败返回NULL

char* u2g(char *inbuf)

{

int nOutLen = 2 * strlen(inbuf) - 1;

char* szOut = (char*)malloc(nOutLen);

if (-1 == code_convert("utf-8","gb2312",inbuf,strlen(inbuf),szOut,nOutLen))

{

free(szOut);

szOut = NULL;

}

return szOut;

}

//GB2312码转为UNICODE码

//成功则返回一个动态分配的char*变量，需要在使用完毕后手动free，失败返回NULL

char* g2u(char *inbuf)

{

int nOutLen = 2 * strlen(inbuf) - 1;

char* szOut = (char*)malloc(nOutLen);

if (-1 == code_convert("gb2312","utf-8",inbuf,strlen(inbuf),szOut,nOutLen))

{

free(szOut);

szOut = NULL;

}

return szOut;

}

使用的时候将这个c文件include到其它源文件中。include一个c文件并不奇怪，在c语言的年代我们常常这么干，唯一的害处的编译链接出来的可执行程序体积变大了。当然这时因为我们这段代码很小的原因，再大一点我就要用dll了。

从UTF-8到GB2312的一个典型使用流程如下：

l 得到一个UTF-8的字符串szSrc；

l 定义一个char*的字符指针szDes，并不需要给他动态审判内存；

l szDes = u2g(szSrc)，这样就可以得到转换后的GB2312编码的字符串；

l 使用完这个字符串后使用free(szDes)来释放内存。

本文并不准备讲述iconv中的函数细节，因为那几个函数以及数据类型都非常简单，我们还是重点看一下如何在libxml2中使用编码转换来处理带有中文的xml文件。下面是使用以上方法来创建一个带有中文的XML文件的例子程序CreateXmlFile_cn.cpp，源代码如下：

/********************************************************************

created: 2007/11/17

created: 9:11:2007 15:34

filename: CreateXmlFile.cpp

author: Wang xuebin

depend: libxml2.lib iconv.lib

build: nmake TARGET_NAME=CreateXmlFile_cn

purpose: 创建一个xml文件，其中包含中文

*********************************************************************/

#include <stdio.h>

#include <libxml/parser.h>

#include <libxml/tree.h>

#include <iostream.h>

#include "wxb_codeConv.c" //自己写的编码转换函数

int main(int argc, char **argv)

{

//定义文档和节点指针

xmlDocPtr doc = xmlNewDoc(BAD_CAST"1.0");

xmlNodePtr root_node = xmlNewNode(NULL,BAD_CAST"root");

//设置根节点

xmlDocSetRootElement(doc,root_node);

//一个中文字符串转换为UTF-8字符串，然后写入

char* szOut = g2u("节点1的内容");

//在根节点中直接创建节点

xmlNewTextChild(root_node, NULL, BAD_CAST "newNode1", BAD_CAST "newNode1 content");

xmlNewTextChild(root_node, NULL, BAD_CAST "newNode2", BAD_CAST "newNode2 content");

xmlNewTextChild(root_node, NULL, BAD_CAST "newNode3", BAD_CAST "newNode3 content");

xmlNewChild(root_node, NULL, BAD_CAST "node1",BAD_CAST szOut);

free(szOut);

//创建一个节点，设置其内容和属性，然后加入根结点

xmlNodePtr node = xmlNewNode(NULL,BAD_CAST"node2");

xmlNodePtr content = xmlNewText(BAD_CAST"NODE CONTENT");

xmlAddChild(root_node,node);

xmlAddChild(node,content);

szOut = g2u("属性值");

xmlNewProp(node,BAD_CAST"attribute",BAD_CAST szOut);

free(szOut);

//创建一个中文节点

szOut = g2u("中文节点");

xmlNewChild(root_node, NULL, BAD_CAST szOut,BAD_CAST "content of chinese node");

free(szOut);

//存储xml文档

int nRel = xmlSaveFormatFileEnc("CreatedXml_cn.xml",doc,"GB2312",1);

if (nRel != -1)

{

cout<<"一个xml文档被创建,写入"<<nRel<<"个字节"<<endl;

}

xmlFreeDoc(doc);

return 1;

}

编译链接命令如下：

nmake TARGET_NAME=CreateXmlFile_cn

完成后执行CreateXmlFile_cn.exe可以生成一个xml文件CreatedXml_cn.xml，其内容如下：

<?xml version="1.0" encoding="GB2312"?>

<root>

<newNode1>newNode1 content</newNode1>

<newNode2>newNode2 content</newNode2>

<newNode3>newNode3 content</newNode3>

<node2 attribute="属性值">NODE CONTENT</node2>

<中文节点>content of chinese node</中文节点>

</root>

观察可知，节点的名称、内容、属性都可以使用中文了。在解析、修改和查找XML文档时都可以使用上面的方法，只要记住，进入xml文档之前将中文编码转换为UTF-8编码；从XML中取出数据时，不管三七二十一都可以转换为GB2312再用，否则你很有可能见到传说中的乱码！

5. 用XML来做点什么

有了以上的基础，相信已经可以顺利的在c/c++程序中使用XML文档了。那么，我们到底要用XML来做什么呢？我随便说一说自己的想法：

第一，可以用来作为配置文件。例如很多组件就是用XML来做配置文件；当然，我们知道用INI做配置文件更简单，只要熟悉两个函数就可以了；不过，复杂一点的配置文件我还是建议采用XML；

第二，可以用来作为在程序之间传送数据的格式，这样的话最好给你的xml先定义一个XML Schema，这样的数据首先可以做一个良构校验，还可以来一个Schema校验，如此的话出错率会比没有格式的数据小得多。目前XML已经广泛作为网络之间的数据格式了；

第三，可以用来作为你自定义的数据存储格式，例如对象持久化之类的功能；

最后，可以用来显示你的技术很高深，本来你要存储一个1，结果你这样存储了：

<?xml version="1.0" encoding="GB2312"?>

<root>

<My_Program_Code content="1"></My_Program_Code>

</root>

然后再用libxml2取出来，最好还来几次编码转换，是不是让人觉得你很牛呢，哈哈！说笑了，千万不要这么做。

6. 小结

本文是实用编程技术的第四篇，有兴趣的可以看看我的前三篇：

DLL编写教程

纸黄金均价管理小软件—黄金秘书

Socket编程指南及示例程序

另外，关于XML也可以看看我写的这几篇博客：

XML的本质讨论

XSL：转换从哪里开始?

数据库和XML数据读取性能比较

毕业之后，对一些实用的编程技术更加感兴趣，因此感觉能力小有提高，比天天钻研理论进步了一小点了。最后按惯例，贴一副女儿近照。

Linux下的xml文件的创建

2011-07-28 09:27 18人阅读评论(0) 收藏举报

创建一个xml文档流程如下：

l 用xmlNewDoc函数创建一个文档指针doc；

l 用xmlNewNode函数创建一个节点指针root_node；

l 用xmlDocSetRootElement将root_node设置为doc的根结点；

l 给root_node添加一系列的子节点，并设置子节点的内容和属性；

用函数xmlAddChild或xmlNewChild

l 用xmlSaveFile将xml文档存入文件；

l 用xmlFreeDoc函数关闭文档指针，并清除本文档中所有节点动态申请的内存

#include </usr/include/libxml2/libxml/parser.h>
#include </usr/include/libxml2/libxml/tree.h>

int main(int argc , char **argv)
{
    // 创建一个指向文档的指针节点
xmlDocPtr     pdoc = NULL;
     //创建并初始化xml文件内的节点,本程序是两层
xmlNodePtr    proot_node = NULL ,pnode = NULL;

     //对文档指针初始化
pdoc = xmlNewDoc( BAD_CAST "1.0");

     //对根节点申请创建
proot_node = xmlNewNode(NULL , BAD_CAST "vm");
     //设置根节点进行属性
xmlNewProp(proot_node , NULL , NULL);

     //使根结点和文档结点进行关联,定义该文档的根结点
xmlDocSetRootElement(pdoc , proot_node);

     //对节点pnode进行申请创建
pnode = xmlNewNode( NULL , BAD_CAST "resp" );
     //设置根节点属性
xmlNewProp(pnode , BAD_CAST"value" , BAD_CAST"0");

     // 创造root节点的子节点,产生层次结构,定义谁是谁的子结点
xmlAddChild(proot_node,pnode);

      //保存文档
xmlSaveFormatFileEnc(argc > 1 ? argv[1] : "-", pdoc, "UTF-8", 1);//显示行格式化输出
xmlSaveFile("CreatedXml.xml",pdoc);                               //常用输出方式

      //释放文档指针
xmlFreeDoc(pdoc);

xmlCleanupParser();

xmlMemoryDump();      //debug memory for regression tests

return(0);
}
//如果需要对某节点添加内容,则需要进行一下操作.
// xmlNodePtr content = xmlNewText(BAD_CAST"NODE CONTENT");
// xmlAddChild(node,content);
//如果采取变量拼接方法的话则进行一下操作
// value=flag;
//char *str;
//str=(char *)malloc(100);
//sprintf(str,"%d",value);
//xmlNewProp(node,BAD_CAST"value",BAD_CAST str);此时对某节点属性和值进行采取变量方式设置
//使用sprintf不要忽略头文件的包含#include<stdio.h>
//如果需要添加子结点，还可以采取函数

//xmlNodePtr p1=xmlNewChild (proot_node, NULL, BAD_CAST "resp" , NULL );

Xerces C++ 解析XML文件、 apache Xerces C++、Linux下C++解析XML

2009-09-08 17:00

1、Xerces-C++是什么？
      Xerces-C++ 的前身是 IBM 的 XML4C 项目。XML4C 和 XML4J 是两个并列的项目，而 XML4J 是 Xerces-J——Java 实现——的前身。IBM 将这两个项目的源代码让与 Apache 软件基金会(Apache Software Foundation)，他们将其分别改名为 Xerces-C++ 和 Xerces-J。这两个项目是 Apache XML 组的核心项目（如果看到的是“Xerces-C”而不是“Xerces-C++”，也是同一个东西，因为这个项目一开始就是用 C（译者注：原文为C++）语言编写的）。
2、Xerces-C++: 功能介绍
Xerces-C++是一个非常健壮的 XML 解析器,其提供的两种解析XML文档的方法,DOM和SAX (我是采用DOM方法)。
SAX是一个面向事件的编程API.一个解析引擎消耗XML序列数据,并在发现进来的XML数据的结构时回调应用程序,这些回调称为事件句柄.
与SAX不同,它允许对XML文档进行编辑并保存为一个文件或者流,还允许以编程的方式构建一个XML文档.DOM提供了一个内存中的模型,你可以遍历文档树,删除节点或者嫁接新节点.与解析的SAX事件不同,DOM事件反映出用户与文档的互动以及使用文档的改变.
总的来说,SAX是按行遍历XML文档的,而DOM是先把XML文档生成树,然后遍历DOM树,来解析每个节点.
Xerces-C++：学习的过程
2.1、平台选择：
在学习Xerces-C++之前你必须选择一种应用平台，可以是windows、linux、cygwin，以及solaris等系统平台。在这里，我选用的是Redhat Enterprise Linux AS3,选用的Xerces-C++ 是xerces-c-src_2_7_0.tar.gz，可以从官方网站：http://www.apache.org/ 直接下载。
2.2、编译源码
由于我下载下来的是源码，所以需要对其进行编译，否则我们无法加载库文件。
首先进入你的工作目录：cd   /home/olcom/laubo（这是我当前工作目录）
然后解压你的源码包： tar zxvf xerces-c-src_2_7_0.tar.gz
设置包含源代码的环境变量：
export XERCESCROOT=/home/olcom/laubo/xerces-c-src_2_7_0
进入目录：cd xerces-c-src_2_7_0/src/xercesc
运行脚本生成makefile文件：
./runConfigure -plinux -cgcc -xg++ -C--prefix=/opt/ApacheXML
选项：－p     为操作系统平台
－c     C         编译器
－x     C++编译器
－c     库的配置路径
编译源码：make
make install
(编译可能要花费你好一会儿，在我的机器上花费大约7分钟的时间，所以要耐心等候)
2.3、学习类库
因为类库很大，所以刚开始，我并没有选择去分析与阅读类库，我是先在网上了一个比较完整的例子，然后对其进行编译和调试，然后从例子下手去分析类库所提供的接口。这里，我把自己的程序简化了一下，希望可以作为大家学习的例子。
首先，我们需要定义一种 XML文档的样式。在这里，我们简单的定义一种样式（含有中文），如下：
//sample.xml
<?xml version="1.0" encoding="utf-8" standalone="no"?>
<国家调查>
<Node1>
<subNode>
<subNode1>
<subNode11>china     111-> 江苏 </subNode11>
<subNode11>china     112-> 天津 </subNode11>
<subNode11>china     113-> 北京 </subNode11>
<subNode11>china     114-> 上海 </subNode11>
<subNode11>china     115-> 广州 </subNode11>
</subNode1>
</subNode>
<subNode1>Asia     12-> 韩国 </subNode1>
<subNode2>Asia     13-> 日本 </subNode2>
<subNode3>Asia     14-> 越南 </subNode3>
<subNode4>Asia     15-> 柬埔寨 </subNode4>
<subNode5>Asia     16-> 老挝 </subNode5>
</Node1>
<Node2>
<subNode>America   21-> 巴西 </subNode>
<subNode>America   22-> 阿根廷 </subNode>
<subNode>America   23-> 智利 </subNode>
<subNode>America   24-> 墨西哥 </subNode>
<subNode>America   25-> 巴拉圭 </subNode>
<subNode>America   26-> 美国 </subNode>
<subNode>America   27-> 加拿大 </subNode>
</Node2>
<Node3>
<subNode>Europe   31-> 英国</subNode>
<subNode>Europe   32-> 意大利 </subNode>
<subNode>Europe   33-> 法国</subNode>
<subNode>Europe   34-> 德国 </subNode>
<subNode>Europe   35-> 西班牙</subNode>
<subNode>Europe   36-> 匈牙利 </subNode>
</Node3>
<Node5>THE END </Node5>
</国家调查>
定义好格式后，我们来看看程序是如何实现对其解析的，程序如下：

CODE:
[Copy to clipboard]

//CXML.h
#ifndef XML_PARSER_HPP
#define XML_PARSER_HPP
#include <xercesc/util/TransService.hpp>
#include <xercesc/dom/DOM.hpp>
#include <xercesc/dom/DOMDocument.hpp>
#include <xercesc/dom/DOMDocumentType.hpp>
#include <xercesc/dom/DOMElement.hpp>
#include <xercesc/dom/DOMImplementation.hpp>
#include <xercesc/dom/DOMImplementationLS.hpp>
#include <xercesc/dom/DOMNodeIterator.hpp>
#include <xercesc/dom/DOMNodeList.hpp>
#include <xercesc/dom/DOMText.hpp>
#include <xercesc/dom/DOMAttr.hpp>
#include <xercesc/parsers/XercesDOMParser.hpp>
#include <xercesc/util/XMLUni.hpp>
#include <xercesc/framework/XMLFormatter.hpp>
#include <xercesc/util/XMLString.hpp>
#include <stdlib.h>
#include <string>
#include <vector>
#include <stdexcept>
using namespace std;
using namespace xercesc;
class XMLStringTranslate;
class CXML
{
public:
CXML();
~CXML();
XMLTransService::Codes tranServiceCode;
void xmlParser(string&) throw(std::runtime_error);
private:
XMLStringTranslate *XMLTan;
xercesc::XercesDOMParser *m_DOMXmlParser; //定义解析对象
};
class XMLStringTranslate : public XMLFormatTarget
{
public:

XMLStringTranslate(const char * const encoding);
bool TranslatorUTF8ToChinese(string &strTranslatorMsg);
bool UTF8_2_GB2312(char *in, int inLen, char *out, int outLen);
string translate(const XMLCh* const value);
const XMLCh * const translate(const char * const value);
virtual ~XMLStringTranslate();

protected:
XMLFormatter * fFormatter;
XMLCh         *   fEncodingUsed;
XMLCh         *   toFill;
char *   m_value;
protected:
enum Constants
{
kTmpBufSize      = 16 * 1024,
kCharBufSize     = 16 * 1024
};
void clearbuffer();
virtual void writeChars(const XMLByte* const toWrite
, const unsigned int    count
, XMLFormatter* const   formatter);
};
#endif

//CXML.cpp
#include <string>
#include <iostream>
#include <sstream>
#include <stdexcept>
#include <list>
#include <sys/types.h>
#include <sys/stat.h>
#include <errno.h>
#include <unistd.h>
#include <iconv.h>
#include "CXML.h"
bool XMLStringTranslate::UTF8_2_GB2312(char *in, int inLen, char *out, int outLen)      //码型转换
{
iconv_t cd = iconv_open( "gbk", "UTF-8" );
// check cd
if( (int)cd == -1 )
{
cout << "iconv is ERROR" << endl;
return false;
}
char *pin = in, *pout = out;
int   inLen_ = inLen + 1;
int   outLen_ = outLen;

iconv( cd, &pin, (size_t*)&inLen_, &pout, (size_t*)&outLen_ );
iconv_close(cd);
return true;
}
bool XMLStringTranslate::TranslatorUTF8ToChinese(string &strTranslatorMsg)
{
char*   pstrSource = const_cast<char*>(strTranslatorMsg.c_str());
char    pstrDestination[strTranslatorMsg.length()*2+1];   //如此处编译出错，可改为
//char    *pstrDestination = new char[strTranslatorMsg.length()*2+1], 但要记住释放
memset(pstrDestination, '\0', strTranslatorMsg.length()*2+1);
if(!UTF8_2_GB2312(pstrSource, strTranslatorMsg.length(), pstrDestination, strTranslatorMsg.length()))
return false;

strTranslatorMsg = pstrDestination;
return true;
}
CXML::CXML()
{
try
{
// Initialize Xerces-C++ library
XMLPlatformUtils::Initialize();
}
catch(xercesc::XMLException & excp)
{
char* msg = XMLString::transcode(excp.getMessage());
printf("XML toolkit initialization error: %s\n", msg);
XMLString::release(&msg);
}

XMLTan = new XMLStringTranslate("utf-8");
//创建 XercesDOMParser 对象，用于解析文档
m_DOMXmlParser = new XercesDOMParser;
}
CXML::~CXML()
{
try
{
delete XMLTan;
XMLPlatformUtils::Terminate();
}
catch(XMLException& excp)
{
char* msg = XMLString::transcode(excp.getMessage());
printf("XML toolkit terminate error: %s\n", msg);
XMLString::release(&msg);
}
}
void CXML::xmlParser(string & xmlFile) throw( std::runtime_error )
{
//获取文件信息状态
struct stat fileStatus;
int iretStat = stat(xmlFile.c_str(), &fileStatus);
if( iretStat == ENOENT )
throw ( std::runtime_error("file_name does not exist, or path is an empty string.") );
else if( iretStat == ENOTDIR )
throw ( std::runtime_error("A component of the path is not a directory."));
else if( iretStat == ELOOP )
throw ( std::runtime_error("Too many symbolic links encountered while traversing the path."));
else if( iretStat == EACCES )
throw ( std::runtime_error("ermission denied."));
else if( iretStat == ENAMETOOLONG )
throw ( std::runtime_error("File can not be read\n"));

//配置DOMParser
m_DOMXmlParser->setValidationScheme( XercesDOMParser::Val_Auto );
m_DOMXmlParser->setDoNamespaces( false );
m_DOMXmlParser->setDoSchema( false );
m_DOMXmlParser->setLoadExternalDTD( false );

try
{
//调用 Xerces C++ 类库提供的解析接口
m_DOMXmlParser->parse(xmlFile.c_str()) ;

//获得DOM树
DOMDocument* xmlDoc = m_DOMXmlParser->getDocument();
DOMElement *pRoot = xmlDoc->getDocumentElement();
if (!pRoot )
{
throw(std::runtime_error( "empty XML document" ));
}

// create a walker to visit all text nodes.
/**********************************************
DOMTreeWalker *walker =
xmlDoc->createTreeWalker(pRoot, DOMNodeFilter::SHOW_TEXT, NULL, true);
// use the tree walker to print out the text nodes.
std::cout<< "TreeWalker:\n";

for (DOMNode *current = walker->nextNode(); current != 0; current = walker->nextNode() )
{

char *strValue = XMLString::transcode( current->getNodeValue() );
std::cout <<strValue;
XMLString::release(&strValue);
}
std::cout << std::endl;

*************************************************/

// create an iterator to visit all text nodes.
DOMNodeIterator* iterator = xmlDoc->createNodeIterator(pRoot,
DOMNodeFilter::SHOW_TEXT, NULL, true);

// use the tree walker to print out the text nodes.
std::cout<< "iterator:\n";

for ( DOMNode * current = iterator->nextNode();
current != 0; current = iterator->nextNode() )
{
string strValue = XMLTan->translate(current->getNodeValue() );
XMLTan->TranslatorUTF8ToChinese(strValue);
std::cout <<strValue<<endl;
}

std::cout<< std::endl;

}
catch( xercesc::XMLException& excp )
{
char* msg = xercesc::XMLString::transcode( excp.getMessage() );
ostringstream errBuf;
errBuf << "Error parsing file: " << msg << flush;
XMLString::release( &msg );
}
}
XMLStringTranslate::XMLStringTranslate(const char * const encoding):fFormatter(0),
m_value(0),fEncodingUsed(0),toFill(0)
{
XMLFormatTarget * myFormTarget = this;
fEncodingUsed=XMLString::transcode(encoding);
fFormatter = new XMLFormatter(fEncodingUsed
,myFormTarget
,XMLFormatter::NoEscapes
,XMLFormatter::UnRep_CharRef);
toFill=new XMLCh[kTmpBufSize];
clearbuffer();
}
XMLStringTranslate::~XMLStringTranslate()
{
if(fFormatter)
delete fFormatter;
if(fEncodingUsed)
delete [] fEncodingUsed;
if(m_value)
free(m_value);
if(toFill)
free(toFill);

fFormatter=0;
fEncodingUsed=0;
m_value=0;
toFill=0;
}
void XMLStringTranslate::writeChars(const XMLByte* const   toWrite
, const unsigned int     count
, XMLFormatter* const    formatter)
{
if(m_value)
free(m_value);
m_value=0;
m_value=new char[count+1];
memset(m_value,0,count+1);
memcpy(m_value,(char *)toWrite,count+1);
}
void XMLStringTranslate::clearbuffer()
{
if(!toFill)
return;
for(int i=0;i<kTmpBufSize;i++)
toFill[i]=0;
}
[/i]string XMLStringTranslate::translate(const XMLCh* const value)    //实现从 XMLCh* 到 string类型的转换
{
*fFormatter<<value;
string strValue=string(m_value);
return strValue;
}
const XMLCh * const XMLStringTranslate::translate(const char * const value)
{
clearbuffer();
const unsigned int   srcCount=XMLString::stringLen(value);
unsigned char fCharSizeBuf[kCharBufSize];
XMLTranscoder * pTranscoder=(XMLTranscoder *)fFormatter->getTranscoder();
unsigned int bytesEaten;
unsigned int size=pTranscoder->transcodeFrom(
(XMLByte *)value,
srcCount,
toFill,
kTmpBufSize,
bytesEaten,
fCharSizeBuf
);
toFill[size]=0;
string t1=string(value);
string t2=translate(toFill);
assert(t1==t2);
return toFill;
}
#ifdef   MAIN_TEST
int main()
{
string xmlFile = "sample.xml";
CXML cxml;
cxml.xmlParser(xmlFile);
return 0;
}
#endif
//Makefile
#tHIS IS MAKEFILE FOR XERCES-C++ APPLIACTION
MAIN = xml
CC = g++
CFLAGS = -c -g -Wall
$(MAIN):CXML.o
[TAB]$(CC) CXML.o   -o xml -L/opt/ApacheXML/lib -lxerces-c
CXML.o:CXML.cpp
[TAB]$(CC)   $(CFLAGS) -pedantic -I/opt/ApacheXML/include   CXML.cpp -DMAIN_TEST
.PHONY:clean
clean:
[TAB]rm CXML.o   $(MAIN)

下面简要分析一下源程序：
首先，要想利用Xerces C++类库来解析XML文档，必须要对类库进行初始化，所以在类XML的构造函数中，我们对类库进行了初始化：XMLPlatformUtils::Initialize();
接下来，我们定义的解析对象，并在构造函数中对其进行了初始化操作，然后，在xmlParser函数中我们调用类库的解析函数接口，传人xml文件名（m_DOMXmlParser->parse(xmlFile.c_str()) ;）。因为在这里我们选用的是DOM方法，所以接下来我们需要创建DOM树：DOMDocument* xmlDoc = m_DOMXmlParser->getDocument();，并获取DOM树的根节点   DOMElement *pRoot = xmlDoc->getDocumentElement()。
再接下来是什么呢？根据上面所说的，我们需要遍历这棵DOM树，因此我们需要一种遍历方法，在程序中我给出了两种遍历的方法，一种是创建遍历树 DOMTreeWalker *walker = xmlDoc->createTreeWalker(pRoot, DOMNodeFilter::SHOW_TEXT, NULL, true)，还有一种是通过迭代器来遍历整棵DOM树 DOMNodeIterator* iterator = xmlDoc->createNodeIterator(pRoot,     DOMNodeFilter::SHOW_TEXT,   NULL, true)。两种方法都可以达到同样的效果。程序中注释掉的代码是创建遍历树方法。
遍历完，并打印出节点值以后，我们需要终止对类库的调用，所以在析构函数中：XMLPlatformUtils::Terminate()。
解析简单xml文档的基本步骤就是如此简单,至于复杂的XML文档，解析的步骤，尤其是创建DOM树的方法有点不同，在这里便不作介绍。接下来，来讲一下困扰我多天的中文解析问题。我们知道，Xerces C++默认只支持节点名中文，至于节点值，属性值则不支持，即使解析出来的也是乱码，所以需要自己解决。在这里，我们选用UTF-8编码格式的XML文档。先来看一下乱码的原因,由于XML解析器解析的字符串都是 XMLCh*（typedef unsigned int XMLCh）格式的，一个字符占用一个字节，而汉字字符确要占用两个字节。故若不做适当的转换，汉字的输出结果就变成乱码了。在http://www.vckbase.com/document/viewdoc/?id=738 提供了一种解决的方法，但是那个解决方案只有在locale环境为UTF-8的情况下你才可以看见正常的中文输出，在locale为GB18030等环境下，你的中文是乱码。但是在一种环境下可以正常显示，说明已经可以正常解析出来了，只是在不同环境的机器上需要进行码型转换，因此，我在他提供的类中又添加了两种方法，来进行码型转换：
bool TranslatorUTF8ToChinese(string &strTranslatorMsg);         //实现从UTF-8到GBK、GB2312等码型的转换
bool UTF8_2_GB2312(char *in, int inLen, char *out, int outLen);
这样，你就可以在把UTF-8编码的中文正常的解析打印出来了。

 TinyXML生成xml文件
 www.diybl.com    时间 ： 2009-04-03  作者：匿名   编辑：sky 点击：  1599 [ 评论 ]

声明：欢迎任何人和组织转载本blog中文章，但必须标记文章原始链接和作者信息。

本文链接：http://blog.csdn.net/li_007/archive/2009/03/31/4038989.aspx

开拓进取的小乌龟------->CSDN点滴点点滴滴Blog

前面简单介绍了TinyXML，顺便写了一个简单的例子来测试利用TinyXML生成xml文件，其实代码实现很简单。如下：

void WrittingXML(TiXmlString & xmlFile)
{
TiXmlDeclaration * xmlDec = new TiXmlDeclaration("1.0", "UTF-8", "yes");
TiXmlDocument * xmlDocs = new TiXmlDocument();
xmlDocs->LinkEndChild(xmlDec);
TiXmlElement * element = new TiXmlElement("Document");
xmlDocs->LinkEndChild(element);
TiXmlComment * comment = new TiXmlComment(" This is a list of new books ");
element->LinkEndChild(comment);
TiXmlElement * book = new TiXmlElement("Book");
book->SetAttribute("Name", "How to use TinyXML");
element->LinkEndChild(book);
TiXmlElement * author = new TiXmlElement("Author");
TiXmlText * Authortext = new TiXmlText("Leezhm");
author->LinkEndChild(Authortext);
book->LinkEndChild(author);
TiXmlElement * date = new TiXmlElement("Date");
TiXmlText * Datetext = new TiXmlText("2009-3-30");
date->LinkEndChild(Datetext);
book->LinkEndChild(date);
xmlDocs->SaveFile(xmlFile.c_str());
delete xmlDocs;
}

运行后利用IE 8.0打开截图如下：

好了，看后就知道很简单的，这也是我选择它的一个原因，但这里做很简单的测试，没有对xml进行验证代码实现，但是TinyXML自己带的test Application中有对xml进行验证的函数，大家有兴趣可以去看。

代码很简单不啰嗦，说点别的，仔细看看代码，其中使用了很多new来建立了对象指针，但是只看到一个delete，也许你会说着会引起内存泄漏，其实在上面的函数中，后面的delete也可以不要，并且还不会造成内存泄漏。原因看看TinyXML实现的源码中TiXmlNode的析构函数的实现代码如下：当然顺便注意下所有的类的虚拟构造函数。

TiXmlNode::~TiXmlNode()
{
TiXmlNode* node = firstChild;
TiXmlNode* temp = 0;
while ( node )
{
temp = node;
node = node->next;
delete temp;
}
}

在结合一下前面文章介绍TinyXML的继承图表就清楚了为什么这儿不需要我们手动释放堆栈了，特别是不需要一个一个地释放，只需要最后释放最高节点就可以，比如TiXmlDocument节点。。。。。。在我实现的函数中其实也可以不需要delete xmlDocs这句的，因为他们都是局部变量，当变量的作用域结束的时候，会自动释放。当然使用delete会触发相应的class的析构函数的调用，这些都是C++的实现机制，在次不多说。

BTW：正是由于上面的原理，我们添加到TinyXML中的节点。。。都必须是动态用new来创建的。如果创建的不是指针，在内存释放的时候会出现错误的，这个可以自己去测试。我想TinyXML这样实现是因为TInyXML实现机制的要求，因为它是基于DOM，所有的节点都是在内存中。

 
      C++的XML编程经验――LIBXML2库使用指南 
    
 
     2010-02-08 15:57  
     499人阅读  
     评论(0)  
     收藏  
     举报 
    
写这篇文章的原因有如下几点：1)C++标准库中没有操作XML的方法，用C++操作XML文件必须熟悉一种函数库，LIBXML2是其中一种很优秀的XML库，而且它同时支持多种编程语言；2)LIBXML2库的Tutorial写得不太好，尤其是编码转换的部分，不适用于中文编码的转换；3)网上的大多数关于Libxml2的介绍仅仅是翻译了自带的资料，没有详细介绍如何在windows平台下进行编程，更很少提到如何解决中文问题。
基于以上几点原因，决定写一个在Windows平台下，使用C/C++语言，应用LibXml2库来进行xml文档操作，同时使用ICONV库进行中文编码转换的文档。其中还涉及了Makefile、XPATH等相关内容。本文中所有的源代码在http://www.blogjava.net/Files/wxb_nudt/xml_src.rar。
1.       下载与安装LIBXML2和ICONV
 Libxml2是一个C语言的XML程序库，可以简单方便的提供对XML文档的各种操作，并且支持XPATH查询，以及部分的支持XSLT转换等功能。Libxml2的下载地址是http://xmlsoft.org/，完全版的库是开源的，并且带有例子程序和说明文档。最好将这个库先下载下来，因为这样可以查看其中的文档和例子。
windows版本的的下载地址是http://www.zlatkovic.com/libxml.en.html；这个版本只提供了头文件、库文件和dll，不包含源代码、例子程序和文档。在文本中，只需要下载libxml2库、iconv库和zlib库就行了（注意，libxml2库依赖iconv和zlib库，本文中重点关注libxml2和iconv，zlib不介绍），我使用的版本是libxml2-2.6.30.win32.zip、zlib-1.2.3.win32.zip和iconv-1.9.2.win32.zip。
在编程的时候，我们使用windows版本的libxml2、zlib和iconv，将其解压缩到指定文件夹，例如D:"libxml2-2.6.30.win32，D:"zlib-1.2.3.win32以及D:"iconv-1.9.2.win32。事实上，我们知道在windows下面使用头文件、库文件和dll是不需要安装的，它又没有使用任何需要注册的组件或者数据库，只需要告诉编译器和链接器这些资源的位置就可以了。
注意：要在path变量中加上D:"iconv-1.9.2.win32"bin;D:"zlib-1.2.3.win32"bin;D:"libxml2-2.6.30.win32"bin这三个地址，否则在执行的时候就找不到。或者使用更简单的方法，把其中的三个dll到拷贝到system32目录中。
有两种方法来编译链接基于libxml2的程序，第一种是在VC环境中设置lib和include路径，并在link设置中添加libxml2.lib和iconv.lib；第二种是用编译器选项告诉编译器cl.exe头文件的位置，并用链接器选项告诉链接器link.exe库文件的位置，同时在windows环境变量path中添加libxml2中bin文件夹的位置，以便于程序运行时可以找到dll（也可以将dll拷贝到system32目录下）。显然我选择了第二种，那么编译链接一个名为CreateXmlFile.cpp源文件的命令如下：
 
cl /c /I D:"iconv-1.9.2.win32"include /I D:"libxml2-2.6.30.win32"include CreateXmlFile.cpp
link /libpath:D:"iconv-1.9.2.win32"lib /libpath:D:"libxml2-2.6.30.win32"lib CreateXmlFile.obj iconv.lib libxml2.lib
显然这样很费时，那么再不用makefile就显得矫情了，于是，一个典型的使用nmake.exe（VC自带的makefile工具）的文件如下：MAKEFILE
 
#
# 本目录下所有源代码的makefile，使用方法是nmake TARGET_NAME=源代码文件名字（不加后缀）
# 例如 nmake TARGET_NAME=CreateXmlFile
# Author: Wang Xuebin
#
# Flags - 编译debug版本
#
#指定要使用的库的路径,需要用户修改的变量一般放在makefile文件的最上面
LIBXML2_HOME = D:"libxml2-2.6.30.win32
ICONV_HOME = D:"iconv-1.9.2.win32
#指定编译器选项,/c表明cl命令只编译不链接;/MTd表明使用多线程debug库;/Zi表明产生完整的调试信息;
#/Od表明关闭编译优化;/D _DEBUG表明定义一个名为_DEBUG的宏
CPP_FLAGS=/c /MTd /Zi /Od /D _DEBUG
#链接选项,/DEBUG表明创建Debug信息
EXE_LINK_FLAGS=/DEBUG
#指定链接的库
LIBS=iconv.lib libxml2.lib
#指定编译路径选项,链接路径选项
INCLUDE_FLAGS= /I $(LIBXML2_HOME)"include /I $(ICONV_HOME)"include
LIB_PATH_FLAGS = /libpath:$(ICONV_HOME)"lib /libpath:$(LIBXML2_HOME)"lib
#################################################
#
# Targets 目标
#
$(TARGET_NAME) : $(TARGET_NAME).exe
clean : $(TARGET_NAME).exe
$(TARGET_NAME).obj : $(TARGET_NAME).cpp
    cl $(CPP_FLAGS) $(INCLUDE_FLAGS) $(TARGET_NAME).cpp
$(TARGET_NAME).exe : $(TARGET_NAME).obj
 link $(EXE_LINK_FLAGS) $(LIB_PATH_FLAGS) $(TARGET_NAME).obj $(LIBS)
clean : $(TARGET_NAME).exe
 del $(TARGET_NAME).exe
 del $(TARGET_NAME).obj
 del $(TARGET_NAME).ilk
 del $(TARGET_NAME).pdb
本文不准备介绍makefile的写法，但后续例子程序的编译链接依葫芦画瓢都没有问题，执行编译链接的命令如下：
 
nmake TARGET_NAME=CreateXmlFile
执行清理的命令如下：
 
nmake TARGET_NAME=CreateXmlFile clean
2.       Libxml2中的数据类型和函数
 一个函数库中可能有几百种数据类型以及几千个函数，但是记住大师的话，90%的功能都是由30%的内容提供的。对于libxml2，我认为搞懂以下的数据类型和函数就足够了。
2.1   内部字符类型xmlChar
 xmlChar是Libxml2中的字符类型，库中所有字符、字符串都是基于这个数据类型。事实上它的定义是：xmlstring.h
 
typedef unsigned char xmlChar;
使用unsigned char作为内部字符格式是考虑到它能很好适应UTF-8编码，而UTF-8编码正是libxml2的内部编码，其它格式的编码要转换为这个编码才能在libxml2中使用。
还经常可以看到使用xmlChar*作为字符串类型，很多函数会返回一个动态分配内存的xmlChar*变量，使用这样的函数时记得要手动删除内存。
2.2   xmlChar相关函数
 如同标准c中的char类型一样，xmlChar也有动态内存分配、字符串操作等相关函数。例如xmlMalloc是动态分配内存的函数；xmlFree是配套的释放内存函数；xmlStrcmp是字符串比较函数等等。
基本上xmlChar字符串相关函数都在xmlstring.h中定义；而动态内存分配函数在xmlmemory.h中定义。
2.3   xmlChar*与其它类型之间的转换
 另外要注意，因为总是要在xmlChar*和char*之间进行类型转换，所以定义了一个宏BAD_CAST，其定义如下：xmlstring.h
 
#define BAD_CAST (xmlChar *)
原则上来说，unsigned char和char之间进行强制类型转换是没有问题的。
2.4   文档类型xmlDoc、指针xmlDocPtr
 xmlDoc是一个struct，保存了一个xml的相关信息，例如文件名、文档类型、子节点等等；xmlDocPtr等于xmlDoc*，它搞成这个样子总让人以为是智能指针，其实不是，要手动删除的。
xmlNewDoc函数创建一个新的文档指针。
xmlParseFile函数以默认方式读入一个UTF-8格式的文档，并返回文档指针。
xmlReadFile函数读入一个带有某种编码的xml文档，并返回文档指针；细节见libxml2参考手册。
xmlFreeDoc释放文档指针。特别注意，当你调用xmlFreeDoc时，该文档所有包含的节点内存都被释放，所以一般来说不需要手动调用xmlFreeNode或者xmlFreeNodeList来释放动态分配的节点内存，除非你把该节点从文档中移除了。一般来说，一个文档中所有节点都应该动态分配，然后加入文档，最后调用xmlFreeDoc一次释放所有节点申请的动态内存，这也是为什么我们很少看见xmlNodeFree的原因。
xmlSaveFile将文档以默认方式存入一个文件。
xmlSaveFormatFileEnc可将文档以某种编码/格式存入一个文件中。
2.5   节点类型xmlNode、指针xmlNodePtr
 节点应该是xml中最重要的元素了，xmlNode代表了xml文档中的一个节点，实现为一个struct，内容很丰富：tree.h
 
typedef struct _xmlNode xmlNode;
typedef xmlNode *xmlNodePtr;
struct _xmlNode {
    void           *_private;/* application data */
    xmlElementType   type;   /* type number, must be second ! */
    const xmlChar   *name;      /* the name of the node, or the entity */
    struct _xmlNode *children; /* parent->childs link */
    struct _xmlNode *last;   /* last child link */
    struct _xmlNode *parent;/* child->parent link */
    struct _xmlNode *next;   /* next sibling link */
    struct _xmlNode *prev;   /* previous sibling link */
    struct _xmlDoc *doc;/* the containing document */
    /* End of common part */
    xmlNs           *ns;        /* pointer to the associated namespace */
    xmlChar         *content;   /* the content */
    struct _xmlAttr *properties;/* properties list */
    xmlNs           *nsDef;     /* namespace definitions on this node */
    void            *psvi;/* for type/PSVI informations */
    unsigned short   line;   /* line number */
    unsigned short   extra; /* extra data for XPath/XSLT */
};
可以看到，节点之间是以链表和树两种方式同时组织起来的，next和prev指针可以组成链表，而parent和children可以组织为树。同时还有以下重要元素：
l         节点中的文字内容：content；
l         节点所属文档：doc；
l         节点名字：name；
l         节点的namespace：ns；
l         节点属性列表：properties；
Xml文档的操作其根本原理就是在节点之间移动、查询节点的各项信息，并进行增加、删除、修改的操作。
xmlDocSetRootElement函数可以将一个节点设置为某个文档的根节点，这是将文档与节点连接起来的重要手段，当有了根结点以后，所有子节点就可以依次连接上根节点，从而组织成为一个xml树。
2.6   节点集合类型xmlNodeSet、指针xmlNodeSetPtr
 节点集合代表一个由节点组成的变量，节点集合只作为Xpath的查询结果而出现（XPATH的介绍见后面），因此被定义在xpath.h中，其定义如下：
 
/*
 * A node-set (an unordered collection of nodes without duplicates).
 */
typedef struct _xmlNodeSet xmlNodeSet;
typedef xmlNodeSet *xmlNodeSetPtr;
struct _xmlNodeSet {
    int nodeNr;          /* number of nodes in the set */
    int nodeMax;      /* size of the array as allocated */
    xmlNodePtr *nodeTab;/* array of nodes in no particular order */
    /* @@ with_ns to check wether namespace nodes should be looked at @@ */
};
可以看出，节点集合有三个成员，分别是节点集合的节点数、最大可容纳的节点数，以及节点数组头指针。对节点集合中各个节点的访问方式很简单，如下：
 
xmlNodeSetPtr nodeset = XPATH查询结果;
for (int i = 0; i < nodeset->nodeNr; i++)
{
 nodeset->nodeTab[i];
}
注意，libxml2是一个c函数库，因此其函数和数据类型都使用c语言的方式来处理。如果是c++，我想我宁愿用STL中的vector来表示一个节点集合更好，而且没有内存泄漏或者溢出的担忧。
3.       简单xml操作例子
 了解以上基本知识之后，就可以进行一些简单的xml操作了。当然，还没有涉及到内码转换（使得xml中可以处理中文）、xpath等较复杂的操作。
3.1   创建xml文档
 有了上面的基础，创建一个xml文档显得非常简单，其流程如下：
l         用xmlNewDoc函数创建一个文档指针doc；
l         用xmlNewNode函数创建一个节点指针root_node；
l         用xmlDocSetRootElement将root_node设置为doc的根结点；
l         给root_node添加一系列的子节点，并设置子节点的内容和属性；
l         用xmlSaveFile将xml文档存入文件；
l         用xmlFreeDoc函数关闭文档指针，并清除本文档中所有节点动态申请的内存。
注意，有多种方式可以添加子节点：第一是用xmlNewTextChild直接添加一个文本子节点；第二是先创建新节点，然后用xmlAddChild将新节点加入上层节点。
源代码文件是CreateXmlFile.cpp，如下：
 
/********************************************************************
    created:   2007/11/09
    created:   9:11:2007   15:34
    filename: CreateXmlFile.cpp
    author:       Wang xuebin
    depend:       libxml2.lib
    build:     nmake TARGET_NAME=CreateXmlFile
    purpose:   创建一个xml文件
*********************************************************************/
#include <stdio.h>
#include <libxml/parser.h>
#include <libxml/tree.h>
#include <iostream.h>
int main()
{
    //定义文档和节点指针
    xmlDocPtr doc = xmlNewDoc(BAD_CAST"1.0");
    xmlNodePtr root_node = xmlNewNode(NULL,BAD_CAST"root");
    //设置根节点
    xmlDocSetRootElement(doc,root_node);
    //在根节点中直接创建节点
    xmlNewTextChild(root_node, NULL, BAD_CAST "newNode1", BAD_CAST "newNode1 content");
    xmlNewTextChild(root_node, NULL, BAD_CAST "newNode2", BAD_CAST "newNode2 content");
    xmlNewTextChild(root_node, NULL, BAD_CAST "newNode3", BAD_CAST "newNode3 content");
    //创建一个节点，设置其内容和属性，然后加入根结点
    xmlNodePtr node = xmlNewNode(NULL,BAD_CAST"node2");
    xmlNodePtr content = xmlNewText(BAD_CAST"NODE CONTENT");
    xmlAddChild(root_node,node);
    xmlAddChild(node,content);
    xmlNewProp(node,BAD_CAST"attribute",BAD_CAST "yes");
    //创建一个儿子和孙子节点
    node = xmlNewNode(NULL, BAD_CAST "son");
    xmlAddChild(root_node,node);
    xmlNodePtr grandson = xmlNewNode(NULL, BAD_CAST "grandson");
    xmlAddChild(node,grandson);
    xmlAddChild(grandson, xmlNewText(BAD_CAST "This is a grandson node"));
    //存储xml文档
    int nRel = xmlSaveFile("CreatedXml.xml",doc);
    if (nRel != -1)
    {
       cout<<"一个xml文档被创建,写入"<<nRel<<"个字节"<<endl;
    }
    //释放文档内节点动态申请的内存
    xmlFreeDoc(doc);
    return 1;
}
编译链接, 命令如下：
 
nmake TARGET_NAME=CreateXmlFile
然后执行可执行文件CreateXmlFile.exe，会生成一个xml文件CreatedXml.xml，打开后如下所示：
 
<?xml version="1.0"?>
<root>
    <newNode1>newNode1 content</newNode1>
    <newNode2>newNode2 content</newNode2>
    <newNode3>newNode3 content</newNode3>
    <node2 attribute="yes">NODE CONTENT</node2>
    <son>
       <grandson>This is a grandson node</grandson>
    </son>
</root>
最好使用类似XMLSPY这样的工具打开，因为这些工具可以自动整理xml文件的栅格，否则很有可能是没有任何换行的一个xml文件，可读性较差。
3.2   解析xml文档
 解析一个xml文档，从中取出想要的信息，例如节点中包含的文字，或者某个节点的属性，其流程如下：
l         用xmlReadFile函数读出一个文档指针doc；
l         用xmlDocGetRootElement函数得到根节点curNode；
l         curNode->xmlChildrenNode就是根节点的子节点集合；
l         轮询子节点集合，找到所需的节点，用xmlNodeGetContent取出其内容；
l         用xmlHasProp查找含有某个属性的节点；
l         取出该节点的属性集合，用xmlGetProp取出其属性值；
l         用xmlFreeDoc函数关闭文档指针，并清除本文档中所有节点动态申请的内存。
注意：节点列表的指针依然是xmlNodePtr，属性列表的指针也是xmlAttrPtr，并没有xmlNodeList或者xmlAttrList这样的类型。看作列表的时候使用它们的next和prev链表指针来进行轮询。只有在Xpath中有xmlNodeSet这种类型，其使用方法前面已经介绍了。
文章出处：DIY部落(http://www.diybl.com/course/3_program/c++/cppjs/2008918/143342.html)

你可能感兴趣的:(xml,struct,null,文档,include,makefile)

PySide6 GUI 学习笔记——Python文件编译打包 Humbunklung PySide6 学习笔记 python
前面编写的软件工具都必须运行在Python环境中，且通过命令行的方式运行，通过Python打包工具，我们可以把.py文件封装成对应平台的运行文件，供用户执行。常见Python打包工具工具简介官网/文档地址py2exe将Python脚本转换为Windows可执行文件https://www.py2exe.orgcx_Freeze跨平台的Python打包工具，它可以将Python脚本打包为可执行文件或动
循环队列C语言实现 Helpsen 数据结构与算法 c语言开发语言后端
循环队列C语言实现特性：先进先出(FirstInFirstOut=FIFO)，取数从队列的开头取，存储从队列尾部存。第一个元素又称首元素,最后一个元素又称尾元素。Linux系统三大队列：消息队列：进程间通信的一种手段。工作队列：延后执行的一种手段。等待队列：随时随地让进程休眠并且让进程随时随地被唤醒。/*循环队列*/#include#include/*声明描述队列属性的结构体*/typedefst
构建一个查询分析系统 AWsggdrg 数据库 python
技术背景介绍在构建一个查询分析系统时，需要能够加载文档、使用聊天模型、生成嵌入、创建向量存储并执行检索。这些过程的目标是将用户输入的查询优化，以实现更为精准的检索结果。本文将通过一个端到端的示例展示如何使用查询分析提升检索结果的相关性。我们将着眼于如何对LangChain的YouTube视频进行检索，并通过查询分析解决原始用户问题直接传递给搜索引擎时可能出现的失败模式。核心原理解析查询分析的核心在
R语言的软件工程 BinaryBardC 包罗万象 golang 开发语言后端
R语言的软件工程1.引言随着数据科学的快速发展，R语言作为一种统计计算和图形绘制的编程语言，其在数据分析、可视化以及机器学习等领域的应用日益广泛。尽管R语言在数据处理上有其独特的优势，但要将其运用于大型项目和商业应用中，就需要遵循软件工程的原则。本篇文章将探讨R语言在软件工程中的应用，主要涵盖软件开发生命周期、代码规范、版本控制、测试和文档等方面。2.软件开发生命周期软件开发生命周期（SDLC）是
Spring boot技术文档灰色橡皮糖 spring boot java spring
SpringBoot技术文档简介SpringBoot是一个快速构建Java应用程序的框架，它基于SpringFramework，并通过自动配置和简化的开发流程来简化应用程序的开发。SpringBoot可以帮助开发者快速创建独立的、生产级别的Spring应用程序，并减少了开发者配置应用程序所需的时间和精力。SpringBoot最大的优势是提供了一种快速开发体验，可以实现零配置启动。文章目录Sprin
linux nginx配置不生效,Nginx配置虚拟主机不生效 cici xiang linux nginx配置不生效
今天安装Nginx时，创建虚拟主机配置，发现不生效，始终是读取Nginx的默认配置文件指定的站点目录，于是将配置文件逐行检查了一遍，发现影响虚拟主机的配置是否生效，受到以下两个因素影响：1、Nginx的配置文件中，在http模块必须指定包含虚拟主机配置文件路径，本次实例中虚拟主机配置文件在如下：http{sendfileon;keepalive_timeout65;include/etc/ngin
【RK3588 docker编译问题】 kaikai_1019 RK3588 docker docker 容器运维
问题集合问题1：编译lunch出现问题12:31:21Buildsandboxingdisabledduetonsjailerror.12:31:22Buildsandboxingdisabledduetonsjailerror.Infileincludedfrombuild/make/core/config.mk:313:Infileincludedfrombuild/make/core/env
mysql连接池 persist_gd 数据库
先建表createtableusers(idintnotnullauto_increment,namevarchar(50)notnull,primarykey(id))engine=innodbdefaultcharset=utf8;连接池importtimeimportpymysqlimportthreadingfromDBUtils.PooledDBimportPooledDB,Shared
LeetCode Top Interview 150 - Linked List everecursion leetcode 算法职场和发展开源 python 数据结构
Alinkedlistisalineardatastructureconsistingofaseriesofnodes,whereeachnodecontainsdataandapointertothenextnode(inasinglylinkedlist)orbothpointerstothenextnodeandthepreviousnode(inadoublylinkedlist).The
springboot3配置日志logback cq_run logback java spring boot
当前springboot版本为3.3.4之后版本与之前版本配置不同1.引入依赖org.springframework.bootspring-boot-starter-logging3.3.42.配置文件application.ymllogging:file:name:spring_log.logpath:./logsconfig:classpath:logback-spring.xmlsrc/ma
保护你的会话令牌博文视点信息安全技术 ESAPI OWASP Top10 web Web WEB 会话安全
保护你的会话令牌通常我们会采取以下的措施来保护会话。1．采用强算法生成SessionID正如我们前面用WebScrab分析的那样，会话ID必须具有随机性和不可预测性。一般来说，会话ID的长度至少为128位。下面我们就拿常见的应用服务器Tomcat来说明如何配置会话ID的长度和生成算法。首先我们找到{TOMCAT_HOME}\conf\context.xml，然后加入下面一段设置➊定义会话ID的长度
C# 解析 HTML 实战指南 code_shenbing C#c#html 开发语言
在网页开发和数据处理的场景中，经常需要从HTML文档里提取有用的信息。C#作为一门强大的编程语言，提供了丰富的工具和库来实现HTML的解析。这篇博客就带你深入了解如何使用C#高效地解析HTML。一、为什么要在C#中解析HTML在实际项目中，无论是进行网页数据采集、网页内容分析，还是开发网页爬虫，都离不开对HTML的解析。例如，电商平台可能需要从竞品网站上采集商品价格和库存信息；新闻聚合应用可能需要
SpringBoot应用自定义logback日志小二上酒8 spring boot logback java 数据库数据结构
概述默认情况下，SpringBoot内部使用logback作为系统日志实现的框架，将日志输出到控制台，不会写到日志文件。如果在application.properties或application.yml配置，这样只能配置简单的场景，保存路径、日志格式等。复杂的场景（区分info和error的日志、每天产生一个日志文件等）满足不了，只能自定义配置文件logback-spring.xml或者logba
springboot文档生产队队长 Spring All springboot
中英文文档https://www.cnblogs.com/wangxiaocong/p/10062872.html
应学短视频App数据库表设计文档 2401_89285805 数据库
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:||1|id|int|10|0|N|Y||||2|username|varchar|20|0|N|N||||3|password|varchar|20|0|N|N|||ROPTABLEIFEXISTSadmin;CREATETABLEadmin(idintNOTNULLAUTO_INCREMENT,usernamevarcha
【SpringBoot】【log】自定义logback日志配置 m0_74823561 spring boot logback java
前言：默认情况下，SpringBoot内部使用logback作为系统日志实现的框架，将日志输出到控制台，不会写到日志文件。如果在application.properties或application.yml配置，这样只能配置简单的场景，保存路径、日志格式等。复杂的场景（区分info和error的日志、每天产生一个日志文件等）满足不了，只能自定义配置文件logback-spring.xml。一、app
Nginx正向代理配置 KwokRoot Nginx Linux DevOps nginx 运维
Nginx正向代理默认只支持http协议，不支持https协议，需借助"ngx_http_proxy_connect_module"模块实现https正向代理，详情请参考：https://github.com/chobits/ngx_http_proxy_connect_module安装Nginx某些模块会用到的系统类库yuminstall-ydnfinstalllibxml2libxml2-de
足球俱乐部管理系统（11293） codercode2022 spring boot spring cloud 后端 hibernate 架构 laravel actionscript
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发
ZYNQ + Linux jerwey linux zynq
ZYNQLinux操作系统移植说明文档http://xilinx.eetrend.com/content/2019/100018437.html1，组成ZYNQ上面移植Linux操作系统包括四个部分，uboot,devicetree,kernel,ramdisk.其中uboot类似于bios，负责对设备进行简单的初始化，devicetree以树的形式对zynq相连的硬件设备进行描述，kernel是
C语言编程数据结构编程练习-顺序栈的操作墨楠。 #C 语言数据结构研习汇 C c语言数据结构开发语言
#define_CRT_SECURE_NO_WARNINGS#include#include#include#include#include#defineMAX_SIZE20//通过数组的方式创建顺序栈出栈，入栈等操作typedefintelementType;typedefstructstack{elementTypedata[MAX_SIZE];inttop;//栈顶intbottom;//栈
基于JAVA水果商城设计计算机毕业设计源码+数据库+lw文档+系统+部署柳下网络 java 开发语言 jvm
基于JAVA水果商城设计计算机毕业设计源码+数据库+lw文档+系统+部署基于JAVA水果商城设计计算机毕业设计源码+数据库+lw文档+系统+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址：https
旋转编码器驱动-标准库和HAL库末时清单片机 stm32 嵌入式硬件
一、标准库Encoder.c-标准库#include"stm32f10x.h"//Deviceheader#include"Delay.h"int8_tEncoder_Count;/***函数：旋转编码器初始化*参数：无*返回值：无*/voidEncoder_Init(void){/*开启时钟*/RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOB,ENABLE)
C语言中求余的作用 Ethan@LM c语言哈希算法开发语言
1.判断奇偶性求余运算常用于判断一个整数是否为偶数或奇数：偶数：n%2==0奇数：n%2!=0#includeintmain(){intnum=5;if(num%2==0){printf("%d是偶数\n",num);}else{printf("%d是奇数\n",num);}return0;}判断3的倍数：#includeintis_multiple_of_3(intn){returnn%3==0
OpenBayes 一周速览｜微软 Phi-4 发布，降低更多成本实现高效推理；Terra 时空数据集上线
公共资源速递5个数据集：Terra多模态时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集SentimentandEmotionAnalysisDataset情感情绪分析数据集4个教程：一键部署Phi-4Docling：文档解析神器一键部署QVQ-72B-preview铅笔素描风格文生图
使用多模态大模型转换 office 文档人工智能图像识别
背景介绍随着大模型的技术的不断发展，如何将各种office文档转换为markdown成为了一个刚需，包括微软在内的不少公司都给出了解决方案，但是都需要经过繁琐的步骤再本地或云端进行部署，有的对本地还有一定算力要求。现在各家的多模态大模型都在不断降价，1块钱都能处理几百张图片，不少提供商还每日提供免费额度，所以使用多模态大模型转换office文档成为一个廉价而简单的解决方案。技术方案这里介绍的是使用
React 19新特性探索：提升性能与开发者体验程序员
React作为最受欢迎的JavaScript库之一，不断推出新版本以应对日益复杂的应用需求。React19作为最新的版本，引入了一系列令人兴奋的新特性和改进，旨在进一步提升应用的性能、开发效率和用户体验。本文将深入探讨React19的新特性，包括异步操作管理、文档元数据和样式表支持、ServerComponents与服务器端渲染等，帮助开发者更好地理解和利用这些新特性来构建更强大、更高效的Reac
一篇文章掌握WebService服务、工作原理、核心组件、主流框架 java15655057970 服务器前端 linux
目录1、WebService定义解决问题：2、WebService的工作原理2.1实现一个完整的Web服务包括以下步骤2.2调用方式3、WebService的核心组件3.1XML3.2SOAP3.3WSDL3.4UDDI4、主流框架4.1AXIS(已淘汰)4.2XFire4.3CXF5、Soap协议详解1.Soap协议是什么2.认识Soap3.结论4.SOAP小总结6、WSDL详解1.types2
WebService——SOAP详解吴声子夜歌 Web Service WebService SOAP
目录SOAP1、概述2、语法2.1、组成部分2.2、语法规则2.3、基本结构3、Envelope元素3.1、xmlns:soap命名空间3.2、encodingStyle属性4、Header元素4.1、mustUnderstand属性4.2、actor属性4.3、encodingStyle属性5、Body元素6、Fault元素7、SOAPHTTPBinding7.1、Content-Type7.2
OpenBayes 一周速览｜微软 Phi-4 发布，降低更多成本实现高效推理；Terra 时空数据集上线
公共资源速递5个数据集：Terra多模态时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集SentimentandEmotionAnalysisDataset情感情绪分析数据集4个教程：一键部署Phi-4Docling：文档解析神器一键部署QVQ-72B-preview铅笔素描风格文生图
题海拾贝：力扣反转链表 <但凡. 题海拾贝 leetcode 链表算法数据结构
Hello大家好！很高兴我们又见面啦！给生活添点passion，开始今天的编程之路！我的博客：next==NULL){returnhead;}else{structListNode*n1=head;structListNode*n2=head->next;structListNode*n3=n2->next;n1->next=NULL;while(n3!=NULL){n2->next=n1;n1=
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方