mcgrady_tracy

libxml2 使用教程

本文整理自官方使用教程 http://xmlsoft.org/tutorial/index.html 。

示例文档story.xml如下：

[html]  view plain copy 
     
    
 <?xml version="1.0"?>  
 <story>  
   <storyinfo>  
     <author>John Fleck</author>  
     <datewritten>June 2, 2002</datewritten>  
     <keyword>example keyword</keyword>  
   </storyinfo>  
   <body>  
     <headline>This is the headline</headline>  
     <para>This is the body text.</para>  
   </body>  
 </story>  

1、解析xml文档
解析文档时只需要文档名和一个函数调用，再加上错误处理。下面代码查找keyword节点并打印节点下的文本内容，如下：

[cpp]  view plain copy 
     
    
 #include <stdio.h>  
 #include <string.h>  
 #include <stdlib.h>  
 #include <libxml/xmlmemory.h>  
 #include <libxml/parser.h>  
   
 /* 解析storyinfo节点，打印keyword节点的内容 */  
 void parseStory(xmlDocPtr doc, xmlNodePtr cur){  
     xmlChar* key;  
     cur=cur->xmlChildrenNode;  
     while(cur != NULL){  
         /* 找到keyword子节点 */  
         if(!xmlStrcmp(cur->name, (const xmlChar *)"keyword")){  
             key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);  
             printf("keyword: %s\n", key);  
             xmlFree(key);  
         }  
         cur=cur->next; /* 下一个子节点 */  
     }  
   
     return;  
 }  
   
 /* 解析文档 */  
 static void parseDoc(char *docname){  
     /* 定义文档和节点指针 */  
     xmlDocPtr doc;  
     xmlNodePtr cur;  
       
     /* 进行解析，如果没成功，显示一个错误并停止 */  
     doc = xmlParseFile(docname);  
     if(doc == NULL){  
         fprintf(stderr, "Document not parse successfully. \n");  
         return;  
     }  
   
     /* 获取文档根节点，若无内容则释放文档树并返回 */  
     cur = xmlDocGetRootElement(doc);  
     if(cur == NULL){  
         fprintf(stderr, "empty document\n");  
         xmlFreeDoc(doc);  
         return;  
     }  
   
     /* 确定根节点名是否为story，不是则返回 */  
     if(xmlStrcmp(cur->name, (const xmlChar *)"story")){  
         fprintf(stderr, "document of the wrong type, root node != story");  
         xmlFreeDoc(doc);  
         return;  
     }  
   
     /* 遍历文档树 */  
     cur = cur->xmlChildrenNode;  
     while(cur != NULL){  
         /* 找到storyinfo子节点 */  
         if(!xmlStrcmp(cur->name, (const xmlChar *)"storyinfo")){  
             parseStory(doc, cur); /* 解析storyinfo子节点 */  
         }  
         cur = cur->next; /* 下一个子节点 */  
     }  
   
     xmlFreeDoc(doc); /* 释放文档树 */  
     return;  
 }  
   
 int main(int argc, char **argv){  
     char *docname;  
     if(argc <= 1){  
         printf("Usage: %s docname\n", argv[0]);  
         return 0;  
     }  
     docname=argv[1];  
     parseDoc(docname);  
     return 1;  
 }  

    解析XML文档的基本流程如下：
   （1）定义文档指针和节点指针。
   （2）调用xmlParseFile()解析文档。如果不成功，注册一个错误并停止。一个常见错误是不适当的编码。XML标准文档除了用默认的UTF-8或UTF-16外，还可显式指定用其它编码保存。如果文档是这样，libxml2将自动地为你转换到UTF-8。更多关于XML编码信息包含在XML标准中。
   （3）调用xmlDocGetRootElement()获取文档根节点，若无根节点则释放文档树并返回。
   （4）确认文档是正确的类型，通过检查根节点名称来判断。
   （5）检索节点的内容，这需要遍历文档树。对每个节点，遍历其子节点都需要一个循环。先用cur = cur->xmlChildrenNode获取第一个子节点，然后通过cur = cur->next不断向前遍历，直到cur==NULL。查找找指定节点时使用xmlStrcmp()函数，如果你指定的名称相同，就找到了你要的节点。通常把查找某个子节点的过程封装成函数。
   （6）获取节点中的内容。查找到指定节点后，调用xmlNodeListGetString()获取节点下的文本。注意在XML中，包含在节点中的文本是这个节点的子节点，因此获取的是cur->xmlChildrenNode中的字符串。xmlNodeListGetString()会为返回的字符串分配内存，因此记得要用xmlFree()来释放它。
   （7）调用xmlFreeDoc()释放文档树指针。
   2、使用XPath查询信息
   在xml文档中查询信息是一项核心工作。Libxml2支持使用XPath表达式来查找匹配的节点集。简而言之，XPath之于xml，好比SQL之于关系数据库。要在一个复杂的xml文档中查找所需的信息，XPath简直是必不可少的工具。下面代码查询所有keyword元素的内容。

[cpp]  view plain copy 
     
    
 #include <libxml/parser.h>  
 #include <libxml/xpath.h>  
   
 /* 解析文档 */  
 xmlDocPtr getdoc(char *docname){  
     xmlDocPtr doc;  
     doc = xmlParseFile(docname);  
     if(doc == NULL){  
         fprintf(stderr, "Document not parsed successfully. \n");  
         return NULL;  
     }  
   
     return doc;  
 }  
   
 /* 查询节点集 */  
 xmlXPathObjectPtr getnodeset(xmlDocPtr doc, xmlChar *xpath){  
     xmlXPathContextPtr context;  
     xmlXPathObjectPtr result; /* 存储查询结果 */  
   
     /* 创建一个xpath上下文 */  
     context = xmlXPathNewContext(doc);  
     if(context == NULL){  
         printf("Error in xmlXPathNewContext\n");  
         return NULL;  
     }  
     /* 查询XPath表达式 */  
     result = xmlXPathEvalExpression(xpath, context);  
     xmlXPathFreeContext(context); /* 释放上下文指针 */  
     if(result == NULL){  
         printf("Error in xmlXPathEvalExpression\n");  
         return NULL;  
     }  
     /* 检查结果集是否为空 */  
     if(xmlXPathNodeSetIsEmpty(result->nodesetval)){  
         xmlXPathFreeObject(result); /* 如为这空就释放 */  
         printf("No result\n");  
         return NULL;  
     }  
     return result;  
 }  
   
 int main(int argc, char ** argv){  
     char *docname;  
     xmlDocPtr doc;  
     /* 查找所有keyword元素，而不管它们在文档中的位置 */  
     xmlChar *xpath=(xmlChar*)"//keyword";  
     xmlNodeSetPtr nodeset;  
     xmlXPathObjectPtr result;  
     int i;  
     xmlChar *keyword;  
   
     if(argc <= 1){  
         printf("Usage: %s docname\n", argv[0]);  
         return(0);  
     }  
   
     docname = argv[1];  
     doc = getdoc(docname);  
     result = getnodeset(doc, xpath);  
     if(result){  
         /* 得到keyword节点集 */  
         nodeset = result->nodesetval;  
         for(i=0; i < nodeset->nodeNr; i++){ /* 打印每个节点中的内容 */  
             keyword = xmlNodeListGetString(doc, nodeset->nodeTab[i]->xmlChildrenNode, 1);  
             printf("keyword: %s\n", keyword);  
             xmlFree(keyword);  
         }  
         xmlXPathFreeObject(result); /* 释放结果集 */  
     }  
   
     xmlFreeDoc(doc); /* 释放文档树 */  
     xmlCleanupParser(); /* 清除库内存 */  
     return(1);  
 }  

    可以在story.xml中多插入几个keyword元素，然后运行一下本程序看看效果。使用XPath查询信息的基本流程如下：
   （1）调用xmlXPathNewContext()给文档树创建一个上下文指针。
   （2）调用xmlXPathEvalExpression()，传入XPath表达式和上下文指针，返回一个xmlXPathObjectPtr结果集指针。nodesetval对象包含keyword节点个数(nodeNr)和节点列表(nodeTab)。在使用之前要和xmlXPathNodeSetIsEmpty()检查nodesetval节点列表是否为空。
   （3）遍历节点列表nodeTab，用xmlNodeListGetString()获取每个keyword节点的内容。
   （4）用xmlXPathFreeObject()释放查询结果，用xmlFreeDoc()释放文档树。
   更多关于Xpath的内容可以参考XPath官方规范http://www.w3.org/TR/xpath/。XPath语法的介绍，可参考w3school上的教程http://www.w3school.com.cn/xpath/index.asp，或者http://w3schools.com/xpath/default.asp。只有掌握XPath，才能掌握使用大型XML文件获取信息的方法，否则每寻找一个节点都要从根节点找起，很耗时耗力。
   3、修改xml文档
   这与上面的过程类似，首先遍历文档树，找到要插入（或删除）的节点处，然后插入（或删除）相关的内容。下面代码在storyinfo节点下插入一个keyword元素。

[cpp]  view plain copy 
     
    
 #include <stdio.h>  
 #include <string.h>  
 #include <stdlib.h>  
 #include <libxml/xmlmemory.h>  
 #include <libxml/parser.h>  
   
 void  
 parseStory(xmlDocPtr doc, xmlNodePtr cur, const xmlChar* keyword) {  
     /* 在当前节点下插入一个keyword子节点 */  
     xmlNewTextChild(cur, NULL, (const xmlChar*)"keyword", keyword);  
     return;  
 }  
   
 xmlDocPtr  
 parseDoc(char *docname, char *keyword) {  
   
     xmlDocPtr doc;  
     xmlNodePtr cur;  
   
     doc = xmlParseFile(docname);  
       
     if (doc == NULL ) {  
         fprintf(stderr,"Document not parsed successfully. \n");  
         return (NULL);  
     }  
       
     cur = xmlDocGetRootElement(doc);  
       
     if (cur == NULL) {  
         fprintf(stderr,"empty document\n");  
         xmlFreeDoc(doc);  
         return (NULL);  
     }  
       
     if (xmlStrcmp(cur->name, (const xmlChar *) "story")) {  
         fprintf(stderr,"document of the wrong type, root node != story");  
         xmlFreeDoc(doc);  
         return (NULL);  
     }  
       
     cur = cur->xmlChildrenNode;  
     while (cur != NULL) {  
         if ((!xmlStrcmp(cur->name, (const xmlChar *)"storyinfo"))){  
             parseStory (doc, cur, (const xmlChar*)keyword);  
         }  
            
     cur = cur->next;  
     }  
     return(doc);  
 }  
   
 int  
 main(int argc, char **argv) {  
   
     char *docname;  
     char *keyword;  
     xmlDocPtr doc;  
   
     if (argc <= 2) {  
         printf("Usage: %s docname, keyword\n", argv[0]);  
         return(0);  
     }  
   
     docname = argv[1];  
     keyword = argv[2];  
     doc = parseDoc(docname, keyword);  
     if (doc != NULL) {  
         xmlSaveFormatFile(docname, doc, 0);  
         xmlFreeDoc(doc);  
     }  
       
     return (1);  
 }  

这里xmlNewTextChild函数在当前节点指针上添加一个子元素。如果希望元素有名字空间，则可以在这里加上。添加完后，就要用xmlSaveFormatFile()把修改后的文档写入到文件。我们这里使用原来doc文档指针，因此会覆盖原来的文件。第三个参数如果设置为1，则输出的文档会自动缩进。
若要删除某个节点，可以使用以下代码：

[cpp]  view plain copy 
     
    
 if(!xmlStrcmp(cur->name, BAD_CAST "keyword")){  
     xmlNodePtr tempNode;  
     tempNode = cur->next;  
     xmlUnlinkNode(cur);  
     xmlFreeNode(cur);  
     cur = tempNode;  
     continue;  
 }  

注意libxml2并没有xmlDelNode或者xmlRemoveNode之类的函数。我们需要将当前节点从文档中断链（unlink），文档就不会再包含这个子节点。这样做需要使用一个临时变量来存储断链节点的后续节点，并记得要手动删除断链节点的内存。
若要给节点添加属性，可以这样：

[cpp]  view plain copy 
     
    
 xmlDocPtr  
 parseDoc(char *docname, char *uri) {  
     xmlDocPtr doc;  
     xmlNodePtr cur;  
     xmlNodePtr newnode;  
     xmlAttrPtr newattr;  
   
     doc = xmlParseFile(docname);      
     if (doc == NULL ) {  
         fprintf(stderr,"Document not parsed successfully. \n");  
         return (NULL);  
     }  
       
     cur = xmlDocGetRootElement(doc);      
     if (cur == NULL) {  
         fprintf(stderr,"empty document\n");  
         xmlFreeDoc(doc);  
         return (NULL);  
     }  
       
     if (xmlStrcmp(cur->name, (const xmlChar *) "story")) {  
         fprintf(stderr,"document of the wrong type, root node != story");  
         xmlFreeDoc(doc);  
         return (NULL);  
     }  
       
     newnode = xmlNewTextChild(cur, NULL, "reference", NULL);  
     newattr = xmlNewProp(newnode, "uri", uri);  
     return(doc);  
 }  

我们用xmlAttrPtr声明一个属性指针。在找到story元素后，用xmlNewTextChild()新建一个reference子元素，用xmlNewProp()给这个子元素新建一个uri属性。文档修改完后要用xmlSaveFormatFile()写入到磁盘。
查询属性的过程类似。如下：

[cpp]  view plain copy 
     
    
 void  
 getReference(xmlDocPtr doc, xmlNodePtr cur) {  
     xmlChar *uri;  
     cur = cur->xmlChildrenNode;  
     while (cur != NULL) {  
         if ((!xmlStrcmp(cur->name, (const xmlChar *)"reference"))) {  
             uri = xmlGetProp(cur, "uri");  
             printf("uri: %s\n", uri);  
             xmlFree(uri);  
         }  
         cur = cur->next;  
     }  
     return;  
 }  

    关键函数为xmlGetProp()，用来获取节点中的指定属性。注意如果你使用DTD为属性声明一个固定的或默认的值，则该函数也查找这些值。
   4、创建xml文档
   有了上面的基础，创建一个xml文档显得非常简单，就是一个不断插入节点的过程。其流程如下：
   （1）用xmlNewDoc函数创建一个文档指针doc；
   （2）用xmlNewNode函数创建一个节点指针root_node；
   （3）用xmlDocSetRootElement将root_node设置为doc的根结点；
   （4）用xmlAddChild()给root_node添加一系列的子节点，并设置子节点的内容和属性；
   （5）用xmlSaveFile将xml文档存入文件；
   （6）用xmlFreeDoc函数关闭文档指针，并清除本文档中所有节点动态申请的内存。
   下面代码创建一个xml文档：

[cpp]  view plain copy 
     
    
 #include <stdio.h>  
 #include <iostream>  
 #include <libxml/parser.h>  
 #include <libxml/tree.h>  
 using namespace std;  
   
 int main(int argc, char* argv[]){  
     //定义文档和节点指针  
     xmlDocPtr doc=xmlNewDoc(BAD_CAST"1.0");  
     xmlNodePtr root_node=xmlNewNode(NULL,BAD_CAST"root");  
     //设置根节点  
     xmlDocSetRootElement(doc,root_node);  
     //在根节点中直接创建节点  
     xmlNewTextChild(root_node, NULL, BAD_CAST"newNode1", BAD_CAST"newNode1 content");  
     xmlNewTextChild(root_node, NULL, BAD_CAST"newNode2", BAD_CAST"newNode2 content");  
     xmlNewTextChild(root_node, NULL, BAD_CAST"newNode3", BAD_CAST"newNode3 content");  
     //创建一个节点，设置其内容和属性，然后加入根结点  
     xmlNodePtr node=xmlNewNode(NULL, BAD_CAST"node2");  
     xmlNodePtr content=xmlNewText(BAD_CAST"NODE CONTENT");  
     xmlAddChild(root_node,node);  
     xmlAddChild(node,content);  
     xmlNewProp(node,BAD_CAST"attribute",BAD_CAST"yes");  
     //创建一个儿子和孙子节点  
     node=xmlNewNode(NULL,BAD_CAST"son");  
     xmlAddChild(root_node,node);  
     xmlNodePtr grandson=xmlNewNode(NULL,BAD_CAST"grandson");  
     xmlAddChild(node,grandson);  
     xmlAddChild(grandson,xmlNewText(BAD_CAST"This is a grandson node"));  
     //存储xml文档  
     int nRel=xmlSaveFile("CreatedXml.xml",doc);  
     if(nRel!=-1){  
         cout<<"一个xml文档被创建，写入"<<nRel<<"个字节"<<endl;  
     }  
     //释放文档内节点动态申请的内存  
     xmlFreeDoc(doc);  
     return 1;  
 }  

编译并运行这个程序，将创建CreatedXml.xml文档，内容如下：

[html]  view plain copy 
     
    
 <root>  
     <newNode1>newNode1 content</newNode1>  
     <newNode2>newNode2 content</newNode2>  
     <newNode3>newNode3 content</newNode3>  
     <node2 attribute="yes">NODE CONTENT</node2>  
     <son>  
         <grandson>This is a grandson node</grandson>  
     </son>  
 </root>  

    注意，有多种方式可以添加子节点。第一是用xmlNewTextChild直接添加一个文本子节点；第二是先创建新节点，然后用xmlAddChild将新节点加入上层节点。
   5、编码转换
   数据编码兼容性问题是很多开发人员都会遇到的一大难题，特别是在使用libxml时。libxml内部使用UTF-8格式存储和操作数据。你的应用程序数据如果使用其他格式的编码，例如ISO-8859-1编码，则在传给libxml之前必须转换成UTF-8格式。如果你的应用输出想用非UTF-8格式的编码，也需要进行转换。
   Libxml2本身只支持把UTF-8, UTF-16和ISO-8859-1格式的外部数据转换成内部使用的UTF-8格式，以及处理完后输出成这些格式的数据。对其他的字符编码，需要使用libiconv（当然你也可以使用其他的国际化库，例如ICU）。当前libiconv支持150多种不同的字符编码，libiconv的实现尽量保证支持所有我们听过的编码格式。在使用libxml之前，一般是通过libiconv把数据先转换UTF-8格式。在使用libxml处理完之后，再通过libiconv把数据输出成你要的编码格式。
   一个常见的错误是一份代码的不同部分的数据使用不同的编码格式。例如内部数据使用ISO-8859-1格式的应用程序，联合使用libxml，而它的内部数据格式为UTF-8。这样应用程序在运行不同的代码段时要不同地对待内部数据，这有可能导致解析数据出现错误。
   例子1：使用Libxml内建的编码处理器
   下面的例子创建一个简单的文档，添加从命令行得到的数据到文档根元素，并以合适的编码格式输出到stdout。对提供的数据我们使用ISO-8859-1编码，处理过程为从ISO-8859-1到UTF-8，再到ISO-8859-1。命令行上输入的字符串从ISO-8859-1格式转换成UTF-8格式，以供libxml使用，输出时又重新转换成ISO-8859-1格式。

[cpp]  view plain copy 
     
    
 #include <string.h>  
 #include <libxml/parser.h>  
   
 /* 对指定编码格式的外部数据，转换成libxml使用UTF-8格式 */  
 unsigned char*  
 convert(unsigned char *in, char *encoding){  
     unsigned char *out;  
     int ret,size,out_size,temp;  
     /* 定义一个编码处理器指针 */  
     xmlCharEncodingHandlerPtr handler;  
   
     size = (int)strlen((const char*)in)+1; /* 输入数据长度 */  
     out_size = size*2-1; /* 输出数据长度 */  
     out = (unsigned char*)malloc((size_t)out_size); /* 存放输出数据 */  
   
     if (out) {  
         /* 查找内建的编码处理器 */  
         handler = xmlFindCharEncodingHandler(encoding);  
         if(!handler) {  
             free(out);  
             out = NULL;  
         }  
     }  
     if(out) {  
         temp=size-1;  
         /* 对输入数据进行编码转换 */  
         ret = handler->input(out, &out_size, in, &temp);  
         if(ret || temp-size+1) { /* 转换不成功 */  
             if (ret) { /* 转换失败 */  
                 printf("conversion wasn't successful.\n");  
             } else { /* 只转换了一部分数据 */  
                 printf("conversion wasn't successful. converted: %i octets.\n",temp);  
             }  
             free(out);  
             out = NULL;  
         }else { /* 转换成功 */  
             out = (unsigned char*)realloc(out,out_size+1);  
             out[out_size]=0; /* 输出的末尾加上null终止符 */  
                           
         }  
     } else {  
         printf("no mem\n");  
     }  
     return (out);  
 }     
   
 int  
 main(int argc, char **argv) {  
     unsigned char *content, *out;  
     xmlDocPtr doc;  
     xmlNodePtr rootnode;  
     char *encoding = "ISO-8859-1";  
       
     if (argc <= 1) {  
         printf("Usage: %s content\n", argv[0]);  
         return(0);  
     }  
   
     content = (unsigned char*)argv[1];  
     /* 转换成libxml2使用的UTF-8格式 */  
     out = convert(content, encoding);  
     doc = xmlNewDoc (BAD_CAST "1.0");  
     rootnode = xmlNewDocNode(doc, NULL, (const xmlChar*)"root", out);  
     xmlDocSetRootElement(doc, rootnode);  
     /* 以ISO-8859-1格式输出文档内容 */  
     xmlSaveFormatFileEnc("-", doc, encoding, 1);  
     return (1);  
 }  

编译运行这个程序，假设在命令行上提供的数据"zhou"是ISO-8859-1格式（我的系统中不是），则输出文档为：

[html]  view plain copy 
     
    
 <?xml version="1.0" encoding="ISO-8859-1"?>  
 <root>zhou</root>  

    编码转换的基本流程如下：
   （1）用xmlCharEncodingHandlerPtr定义一个编码处理器指针，用xmlFindCharEncodingHandler()查找libxml2中指定的编码处理器。libxml2内建只支持把UTF-8, UTF-16和ISO-8859-1格式的外部数据转换成内部使用的UTF-8格式。如果要转换其他格式的数据（如中文编码），则要使用独立的libiconv库给libxml2注册新编码处理器。
   （2）调用编码处理器的input()函数，把外部数据转换成libxml2使用的格式。
   （3）进行xml处理，处理完若要保存成非UTF-8格式的文档，使用xmlSaveFormatFileEnc()函数。若保存的编码格式libxml2不支持，则只能用libiconv把保存的文档转换成需要的编码格式。
   例子2：通过iconv库给Libxml注册新的编码处理器
   下面例子先编写GBK的编码处理器gbk_input()和gbk_output()，前者是GBK到UTF-8输入处理，后者是UTF-8到GBK输出处理，这两个处理器都要用到iconv转换函数。然后调用xmlNewCharEncodingHandler()注册输入输出处理器。对输入输出数据的编码转换由convertToUTF8From()和utf8ConvertTo()来完成，它们都是调用xmlFindCharEncodingHandler()查找已注册的处理器，然后在处理器上调用input()或output()对数据进行编码转换。

[cpp]  view plain copy 
     
    
 #include <string.h>  
 #include <iconv.h>  
 #include <libxml/encoding.h>  
 #include <libxml/xmlwriter.h>  
 #include <libxml/xmlreader.h>  
   
 /* 输入编码处理器：GBK到UTF-8 */  
 int gbk_input(unsigned char *out, int *outlen,   
         const unsigned char *in, int *inlen){  
   
     char *outbuf = (char *) out;  
     char *inbuf = (char *) in;  
     iconv_t iconv_from; /* gbk到utf-8的转换描述符 */  
     size_t len1, len2, rslt;  
     /* 注意一般不直接从int*到size_t*的转换 
        这在32位平台下是正常的，但到了64平台下size_t为64位， 
        那(size_t*)inlen将是一个未知的数据  
     */  
     len1 = *inlen;  
     len2 = *outlen;  
     /* 分配一个从GBK到UTF-8的转换描述符 */  
     iconv_from = iconv_open("utf-8","gbk");  
     /* 根据转换描述符，对数据进行编码转换 */  
     rslt = iconv(iconv_from, &inbuf, &len1, &outbuf, &len2);  
     if(rslt < 0){  
         return rslt;  
     }  
     iconv_close(iconv_from); /* 释放描述符 */  
     *outlen = ((unsigned char *) outbuf - out);  
     *inlen = ((unsigned char *) inbuf - in);  
     return *outlen;  
 }  
   
 /* 输出编码处理器：UTF-8到GBK */  
 int gbk_output(unsigned char *out, int *outlen,   
                 const unsigned char *in, int *inlen){  
   
     char *outbuf = (char *) out;  
     char *inbuf = (char *) in;  
     iconv_t iconv_to; /* utf-8到gbk的转换描述符 */  
     size_t len1, len2, rslt;  
     /* 注意一般不直接从int*到size_t*的转换 
        这在32位平台下是正常的，但到了64平台下size_t为64位， 
        那(size_t*)inlen将是一个未知的数据  
     */  
     len1 = *inlen;  
     len2 = *outlen;  
     /* 分配一个从UTF-8到GBK的转换描述符 */  
     iconv_to=iconv_open("gbk","utf-8");  
     /* 根据转换描述符，对数据进行编码转换 */  
     rslt = iconv(iconv_to, &inbuf, &len1, &outbuf, &len2);  
     if(rslt < 0){  
         return rslt;  
     }  
     iconv_close(iconv_to); /* 释放描述符 */  
     *outlen = ((unsigned char *) outbuf - out);  
     *inlen = ((unsigned char *) inbuf - in);  
     return *outlen;  
 }  
   
 /** 
  * convertToUTF8From: 
  * 把encoding编码的输入数据in转换成utf-8格式返回 
  * 出错则返回NULL 
  */  
 xmlChar *convertToUTF8From(const char *in, const char *encoding){  
     xmlChar *out;  
     int ret;  
     int size;  
     int out_size;  
     int temp;  
     xmlCharEncodingHandlerPtr handler;  
     if (in == 0)  
         return 0;  
     /* 查找内建的编码处理器 */  
     handler = xmlFindCharEncodingHandler(encoding);  
     if (!handler) {  
         printf("convertToUTF8From: no encoding handler found for '%s'\n",  
                encoding ? encoding : "");  
         return 0;  
     }  
     size = (int)strlen(in) + 1;  /* 输入数据长度 */  
     out_size = size*2 - 1;  /* 输出数据长度 */  
     /* 存放输出数据 */  
     out = (unsigned char *) xmlMalloc((size_t) out_size);  
     memset(out, 0, out_size);  
   
     if(out != NULL) {  
         temp = size - 1;  
         /* 对输入数据进行编码转换，成功后返回0 */  
         ret = handler->input(out, &out_size, (const xmlChar *) in, &temp);  
         if(ret || temp - size + 1) {  /* 转换不成功 */  
             if(ret){  /* 转换失败 */  
                 printf("convertToUTF8From: conversion wasn't successful.\n");  
             }else{  /* 只转换了一部分数据 */  
                 printf("convertToUTF8From: conversion wasn't successful. converted: %i octets.\n", temp);  
             }  
             xmlFree(out); /* 释放输出缓冲区 */  
             out = 0;  
         }else{  /* 转换成功，在输出末尾加上null终止符 */  
             out = (unsigned char *) xmlRealloc(out, out_size + 1);  
             out[out_size] = 0;  
         }  
     } else {  
         printf("convertToUTF8From: no mem\n");  
     }  
     return out;  
 }  
   
 /** 
  * utf8ConvertTo: 
  * 把utf-8的数据转换成encoding编码返回 
  * 出错则返回NULL 
  */  
 char *utf8ConvertTo(xmlChar *in, const char *encoding){  
     char *out;  
     int ret;  
     int size;  
     int out_size;  
     int temp;  
     xmlCharEncodingHandlerPtr handler;  
   
     if (in == 0)  
         return 0;  
   
     handler = xmlFindCharEncodingHandler(encoding);  
   
     if (!handler) {  
         printf("utf8ConvertTo: no encoding handler found for '%s'\n",  
                encoding ? encoding : "");  
         return 0;  
     }  
   
     size = (int) strlen((char*)in) + 1;  /* 输入数据长度 */  
     out_size = size * 2 - 1;  /* 输出数据长度 */  
     out = (char *) malloc((size_t) out_size);  /* 存放输出数据 */  
     memset(out,0,out_size);  
     if(out != NULL) {  
         temp = size - 1;  
         /* 对输入数据进行编码转换，成功后返回0 */  
         ret = handler->output((xmlChar*)out, &out_size, (const xmlChar *) in, &temp);  
         if(ret || temp - size + 1){  
             if(ret){  
                 printf("utf8ConvertTo: conversion wasn't successful.\n");  
             }else{  
                 printf("utf8ConvertTo: conversion wasn't successful. converted: %i octets.\n", temp);  
             }  
             free(out);  
             out = 0;  
         }else{  
             out = (char *) realloc(out, out_size + 1);  
             out[out_size] = 0;  /* 末尾加上null终止符 */  
         }  
     }else{  
         printf("utf8ConvertTo: no mem\n");  
     }  
   
     return out;  
 }  
   
 int main(int argc, char **argv){  
     const char *content;  
     xmlChar *out;  
     xmlDocPtr doc;  
     xmlNodePtr rootnode;  
       
     if (argc <= 1) {  
         printf("Usage: %s content\n", argv[0]);  
         return(0);  
     }  
     content = (const char*)argv[1];  
   
     /* 添加gbk编码支持 */  
     xmlNewCharEncodingHandler("gbk", gbk_input, gbk_output);  
     /* 添加gb2312编码支持：仍然可以使用GBK的输入输出处理器 */  
     xmlNewCharEncodingHandler("gb2312", gbk_input, gbk_output);  
   
     /* 输入的GBK数据转换成libxml2使用的UTF-8格式 */  
     out = convertToUTF8From(content, "gbk");  
     /* 创建xml文档 */  
     doc = xmlNewDoc(BAD_CAST "1.0");  
     rootnode = xmlNewDocNode(doc, NULL, (const xmlChar*)"root", out);  
     xmlDocSetRootElement(doc, rootnode);  
     /* 以gb2312格式保存文档内容："-"表示输出到终端 */  
     xmlSaveFormatFileEnc("-", doc, "gb2312", 1);  
       
     xmlCleanupCharEncodingHandlers()；/* 释放编码处理器资源 */  
     return (1);  
 }  

    这个例子在32位与64位Linux平台下测试通过。iconv库是Linux默认自带的组件，因此在Linux中使用libxml非常方便。我们先建立utf-8编码与gbk编码的转换接口，并将接口插入到libxml2库中，这样xml库就支持对gb2312和gbk编码的支持了。当然，这个转换不会自动完成，我们需要使用从libxml库中查找特定编码的接口，libxml支持一些基本的编码接口，如ISO-8859-1，UTF-16等编码，但不支持gbk，所以在上述代码中，我们定义了gbk_input，与gbk_output两个接口，这两个接口的原型声明是libxml库的标准声明，即xmlCharEncodingInputFunc和xmlCharEncodingOutputFunc。在使用完libxml库之后，我们需要释放libxml库的转换资源。
   例子3：直接使用iconv库进行转换
   下面例子直接使用iconv函数对输入输出进行编码转换，而不是通过注册编码处理器的方式。

[cpp]  view plain copy 
     
    
 #include <stdio.h>  
 #include <string.h>  
 #include <iconv.h>  
 #include <libxml/parser.h>  
 #include <libxml/tree.h>  
   
 /* 代码转换:从一种编码转为另一种编码 */  
 int encoding_convert(const char *from_charset, const char *to_charset,   
             char *inbuf, int inlen,   
             char* outbuf, int outlen){  
   
     iconv_t cd;  
     size_t len1, len2, rslt;  
   
     /* 注意一般不直接从int*到size_t*的转换 
        这在32位平台下是正常的，但到了64平台下size_t为64位， 
        那(size_t*)inlen将是一个未知的数据  
     */  
     len1 = inlen;  
     len2 = outlen;  
     /* 分配一个转换描述符 */  
     cd = iconv_open(to_charset,from_charset);  
     if(cd == 0)  
        return -1;  
     memset(outbuf,0,len2);   
     /* 执行编码转换 */  
     rslt=iconv(cd, &inbuf, &len1, &outbuf, &len2);  
     if(rslt== -1)  
         return -1;    
   
     iconv_close(cd); /* 释放描述符 */  
     return 0;    
   
 }  
   
 /* GB2312转换为UTF-8  
  * 成功则返回一个动态分配的char*变量，需要在使用完毕后手动free，失败返回NULL 
  */  
 char *gb2312_utf8(char *inbuf){  
     int nOutLen = 2*strlen(inbuf)-1;  
     char *szOut=(char*)xmlMalloc(nOutLen);  
     if(-1 == encoding_convert("gb2312","uft-8",inbuf,strlen(inbuf),szOut,nOutLen)){  
         xmlFree(szOut);  
         szOut=NULL;  
     }  
     return szOut;  
 }  
   
 /* UTF-8转换为GB2312 
  * 成功则返回一个动态分配的char*变量，需要在使用完毕后手动free，失败返回NULL 
  */  
 char *utf8_gb2312(char *inbuf){  
     int nOutLen = 2* strlen(inbuf)-1;  
     char *szOut=(char*)xmlMalloc(nOutLen);  
     if(-1 == encoding_convert("utf-8","gb2312",inbuf,strlen(inbuf),szOut,nOutLen)){  
         xmlFree(szOut);  
         szOut=NULL;  
     }  
     return szOut;  
 }  
   
 int main(int argc, char **argv){  
     /* 定义文档节点和指针 */  
     xmlDocPtr doc = xmlNewDoc(BAD_CAST "1.0");  
     xmlNodePtr root_node=xmlNewNode(NULL, BAD_CAST "root");  
     /* 设置根节点 */  
     xmlDocSetRootElement(doc, root_node);  
   
     /* 一个中文字符串转换为UTF-8字符串，然后写入 */  
     char *szOut=gb2312_utf8("节点1的内容");  
     /* 在根节点中直接创建节点 */  
     xmlNewTextChild(root_node, NULL, BAD_CAST "newNode1", BAD_CAST "newNode1 content");  
     xmlNewTextChild(root_node, NULL, BAD_CAST "newNode2", BAD_CAST "newNode2 content");  
     xmlNewTextChild(root_node, NULL, BAD_CAST "newNode3", BAD_CAST "newNode3 content");  
     xmlNewChild(root_node, NULL, BAD_CAST "node1",BAD_CAST szOut);  
     xmlFree(szOut);  
   
     /* 创建一个节点，设置其内容和属性，然后加入根结点 */  
     xmlNodePtr node = xmlNewNode(NULL,BAD_CAST "node2");  
     xmlNodePtr content = xmlNewText(BAD_CAST "NODE CONTENT");  
     xmlAddChild(root_node,node);  
     xmlAddChild(node,content);  
     szOut = gb2312_utf8("属性值");  
     xmlNewProp(node,BAD_CAST "attribute",BAD_CAST szOut);  
     xmlFree(szOut);  
   
     /* 创建一个中文节点 */  
     szOut = gb2312_utf8("中文节点");  
     xmlNewChild(root_node, NULL, BAD_CAST szOut,BAD_CAST "content of chinese node");  
     xmlFree(szOut);  
   
     /* 存储xml文档 */  
     int nRel = xmlSaveFormatFileEnc("CreatedXml_cn.xml",doc,"GB2312",1);  
     if (nRel != -1){  
         printf("一个xml文档被创建,写入%d个字节", nRel);  
     }  
   
     xmlFreeDoc(doc);  
     return 1;  
 }  

这个例子中，当把中文数据写入到XML节点时，使用gb2312_utf8()直接转换成UTF-8格式，这种直接通过iconv转换的方式更高效。编译并运行程序，输出文档如下：

[html]  view plain copy 
     
    
 <?xml version="1.0" encoding="GB2312"?>  
 <root>  
     <newNode1>newNode1 content</newNode1>  
     <newNode2>newNode2 content</newNode2>  
     <newNode3>newNode3 content</newNode3>  
     <node1>节点1的内容</node1>  
     <node2 attribute="属性值">NODE CONTENT</node2>  
     <中文节点>content of chinese node</中文节点>  
 </root>     

     6、一个真实的例子
   内容整理自 http://xmlsoft.org/example.html 。
   下面是一个真实的例子。应用程序数据的内容不使用DOM树，而是使用内部数据结构来保存。这是一个基于XML存储结构的数据库，它保存了与Gnome相关的任务。如下：

[html]  view plain copy 
     
    
 <?xml version="1.0"?>  
 <gjob:Helping xmlns:gjob="http://www.gnome.org/some-location">  
   <gjob:Jobs>  
   
     <gjob:Job>  
       <gjob:Project ID="3"/>  
       <gjob:Application>GBackup</gjob:Application>  
       <gjob:Category>Development</gjob:Category>  
   
       <gjob:Update>  
         <gjob:Status>Open</gjob:Status>  
         <gjob:Modified>Mon, 07 Jun 1999 20:27:45 -0400 MET DST</gjob:Modified>  
         <gjob:Salary>USD 0.00</gjob:Salary>  
       </gjob:Update>  
   
       <gjob:Developers>  
         <gjob:Developer>  
         </gjob:Developer>  
       </gjob:Developers>  
   
       <gjob:Contact>  
         <gjob:Person>Nathan Clemons</gjob:Person>  
         <gjob:Email>nathan@windsofstorm.net</gjob:Email>  
         <gjob:Company>  
         </gjob:Company>  
         <gjob:Organisation>  
         </gjob:Organisation>  
         <gjob:Webpage>  
         </gjob:Webpage>  
         <gjob:Snailmail>  
         </gjob:Snailmail>  
         <gjob:Phone>  
         </gjob:Phone>  
       </gjob:Contact>  
   
       <gjob:Requirements>  
       The program should be released as free software, under the GPL.  
       </gjob:Requirements>  
   
       <gjob:Skills>  
       </gjob:Skills>  
   
       <gjob:Details>  
       A GNOME based system that will allow a superuser to configure   
       compressed and uncompressed files and/or file systems to be backed   
       up with a supported media in the system.  This should be able to   
       perform via find commands generating a list of files that are passed   
       to tar, dd, cpio, cp, gzip, etc., to be directed to the tape machine   
       or via operations performed on the filesystem itself. Email   
       notification and GUI status display very important.  
       </gjob:Details>  
   
     </gjob:Job>  
   
   </gjob:Jobs>  
 </gjob:Helping>  

把XML文件加载到一个内部DOM树中只是调用几个函数的问题，而遍历整个树来收集数据，并生成内部结构则更困难，也更容易出错。
对输入结构的定义法则是非常宽松的。属性的顺序无关紧要（XML规范清楚地说明了这一点），不要依赖于一个节点的子节点顺序通常是一个好的主意，除非这样做真的使事情变得更困难了。下面是解析person信息的一段代码：

[cpp]  view plain copy 
     
    
 /* 
  * 一个person记录 
  */  
 typedef struct person {  
     char *name;  
     char *email;  
     char *company;  
     char *organisation;  
     char *smail;  
     char *webPage;  
     char *phone;  
 } person, *personPtr;  
   
 /* 
  * 解析person的代码 
  */  
 personPtr parsePerson(xmlDocPtr doc, xmlNsPtr ns, xmlNodePtr cur) {  
     personPtr ret = NULL;  
   
 DEBUG("parsePerson\n");  
     /* 
      * 为结构分配内存 
      */  
     ret = (personPtr) malloc(sizeof(person));  
     if (ret == NULL) {  
         fprintf(stderr,"out of memory\n");  
         return(NULL);  
     }  
     memset(ret, 0, sizeof(person));  
   
     /* 我们不关心顶层的元素名是什么 */  
     cur = cur->xmlChildrenNode;  
     while (cur != NULL) {  
         if ((!strcmp(cur->name, "Person")) && (cur->ns == ns))  
             ret->name = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);  
         if ((!strcmp(cur->name, "Email")) && (cur->ns == ns))  
             ret->email = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);  
         cur = cur->next;  
     }  
   
     return(ret);  
 }  

    下面是要注意的一些事项：
   （1）通常一个递归的解析风格是更方便的：XML数据天然地遵循重复式地构造，并且是高度结构化的。
   （2）两个参数是xmlDocPtr和xmlNsPtr类型，即指向XML文档和应用程序保留的命名空间的指针。文档信息非常广泛，为你的应用程序数据集定义一个命名空间并测试元素和属性是否属性这个空间是一个好的编程实践。这只需一个简单的相等测试（cur->ns == ns）。
   （3）为了查询文本和属性值，你可以使用函数xmlNodeListGetString()来获取所有文本，和由DOM输出生成的引用节点，并生成一个单一的文本字符串。
   下面是解析另外一个结构的代码片段：

[cpp]  view plain copy 
     
    
 #include <libxml/tree.h>  
 /* 
  * 一个Job的描述 
  */  
 typedef struct job {  
     char *projectID;  
     char *application;  
     char *category;  
     personPtr contact;  
     int nbDevelopers;  
     personPtr developers[100]; /* using dynamic alloc is left as an exercise */  
 } job, *jobPtr;  
   
 /* 
  * 解析Job的代码 
  */  
 jobPtr parseJob(xmlDocPtr doc, xmlNsPtr ns, xmlNodePtr cur) {  
     jobPtr ret = NULL;  
   
 DEBUG("parseJob\n");  
     /* 
      * 为结构分配内存 
      */  
     ret = (jobPtr) malloc(sizeof(job));  
     if (ret == NULL) {  
         fprintf(stderr,"out of memory\n");  
         return(NULL);  
     }  
     memset(ret, 0, sizeof(job));  
   
     /* 我们不关心顶层元素名是什么 */  
     cur = cur->xmlChildrenNode;  
     while (cur != NULL) {  
           
         if ((!strcmp(cur->name, "Project")) && (cur->ns == ns)) {  
             ret->projectID = xmlGetProp(cur, "ID");  
             if (ret->projectID == NULL) {  
                 fprintf(stderr, "Project has no ID\n");  
             }  
         }  
         if ((!strcmp(cur->name, "Application")) && (cur->ns == ns))  
             ret->application = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);  
         if ((!strcmp(cur->name, "Category")) && (cur->ns == ns))  
             ret->category = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);  
         if ((!strcmp(cur->name, "Contact")) && (cur->ns == ns))  
             ret->contact = parsePerson(doc, ns, cur);  
         cur = cur->next;  
     }  
   
     return(ret);  
 }  

一旦你会使用libxml2，编写这种类型的代码是非常简单的，也很无趣。最终，你可以写一个拥有C数据结构和一组XML文档例子或一个XML DTD的桩模块，并生成在C数据和XML存储之间导入和导出数据的代码。

    7、详细代码示例
   对Libxml2更详细的使用介绍，可参考官方的详细代码示例http://xmlsoft.org/examples/index.html。上面提供了Libxml2各个组件怎么使用的详细代码示例，包括以下部分：
   xmlWriter: 测试xmlWriter的各个API，包括写入到文件、写入到内存缓冲区、写入到新的文档或子树、字符串编码转换、对输出文档进行序列化。
   InputOutput: 演示使用xmlRegisterInputCallbacks来建立一个客户I/O层，这被用在XInclude方法上下文中，以显示怎样构建动态文档。还演示使用xmlDocDumpMemory来输出文档到字符缓冲区中。
   Parsing: 演示使用xmlReadMemory()读取XML文档，xmlFreeDoc()释放文档树；使用xmlCreatePushParserCtxt()和xmlParseChunk()一块一块地读取XML文档到文档树中。演示为XML文档创建一个解析上下文，然后解析并验证这个文档；创建一个文档树，检查并验证结果，最后用xmlFreeDoc()释放文档树。演示使用xmlReadFile()读取XML文档并用xmlFreeDoc()释放它。
   Tree: 演示怎样创建文档和节点，并把数据dump到标准输出或文件中。演示使用xmlDocGetRootElement()获取根元素，然后遍历文档并打印各个元素名。
    XPath: 演示怎样计算XPath表达式，并在XPath上下文注册名称空间，打印结果节点集。演示怎么加载一个文档、用XPath定位到某个子元素、修改这个元素并保存结果。这包含了加载/编辑/保存的一个完整来回。
   xmlReader: 演示使用xmlReaderForFile()解析XML文档，并dump出节点的信息。演示在用xmlReaderForFile()解析时验证文档的内容，激活各种选项，诸如实体替换、DTD属性不一致等。演示使用xmlTextReaderPreservePattern()提取XML文档中某一部分的子文档。演示重用xmlReader对象来解析多个XML文档。

你可能感兴趣的:(libxml2 使用教程)

是时候反思下 Web 前端了
我以往写的技术类文章，绝大部分是问题反思、方法论之类的，极少有某个具体技术或工具的介绍与使用教程——除非是我创造的。眼看着曾经经常针对前端领域问题进行有价值思考与讨论的前辈、大佬、同行们接连退隐或沉默，这块儿的高价值新产出内容越来越少。因此，我打算自告奋勇地正式接下「对前端领域问题进行思考并尽量产出高价值内容」这个生态位的接力棒。需要特别说明的是，「前端领域」不局限于以HTML、CSS、JavaS
Godot-GameTemplate 使用教程姬彭霖Hortense
Godot-GameTemplate使用教程Godot-GameTemplateTemplatewithallnecessarystufftakencare,justcreateyourgamesmainfeatures.项目地址:https://gitcode.com/gh_mirrors/go/Godot-GameTemplate项目介绍Godot-GameTemplate是一个为Godot游
Python Poetry 使用教程蓬玮剑
PythonPoetry使用教程poetry简化Python包的打包与依赖关系管理工作而设计的一种解决方案或工具项目地址:https://gitcode.com/gh_mirrors/po/poetry1.项目目录结构及介绍PythonPoetry是一个现代化的包管理和依赖关系解决工具。其仓库的目录结构通常包括以下部分：.├──pyproject.toml#项目配置文件，定义包信息及依赖└──po
如何使用 Postman 在线版？新手教程一个幽默的程序员 Postman postman 测试工具
除了桌面应用程序外，Postman还提供了在线版本，可以通过任何Web浏览器访问。那么该如何使用Postman的在线版呢？Postman在线版使用教程
如何使用 Postman 网页版？一个幽默的程序员 Postman postman 测试工具
Postman也支持网页版访问，让用户能够从任何网页浏览器中访问该工具。在本篇文章中，我们将详细介绍如何使用Postman的网页版。Postman网页版使用教程(2025最新)
【ffuf 详细使用教程】 D-river security 网络安全安全 web安全 http 网络协议
ffuf详细使用教程一、ffuf核心功能与安装验证1.功能概述2.安装验证二、目录/文件爆破（基础与进阶）1.基础命令2.过滤与优化3.递归扫描三、子域名枚举（高效实战）1.基础命令2.多级子域名爆破3.结果优化四、参数模糊测试（漏洞探测）1.GET参数模糊2.POST数据模糊3.JSON参数模糊五、实战案例1.目标：example.com2.发现漏洞示例六、高级技巧与优化1.代理与日志分析2.结
rdl.ink 全面使用教程：网页截图、渲染与应用场景解析 oliver.chau 前端开发前端
✅一、什么是rdl.ink？rdl.ink是一个轻量级的在线网页截图工具，它通过简单的URL参数调用方式，为你渲染任意网页的截图，并支持生成静态图片链接，适合用于：网站预览图生成分享社交媒体缩略图自动化网页截图服务用于博客/文章引用API接口集成截图功能它完全基于URL构造，不需要注册账号，也不需要安装插件，开箱即用、完全免费。二、主要功能介绍功能说明网页截图输入网址即可生成高清截图裁剪模式（mo
Amazon EKS Blueprints for CDK 使用教程毛宝锋
AmazonEKSBlueprintsforCDK使用教程cdk-eks-blueprints-patternsPatternsrepositoryfortheAmazonEKSBluepintsforCDK项目地址:https://gitcode.com/gh_mirrors/cd/cdk-eks-blueprints-patterns1.项目介绍AmazonEKSBlueprintsforCD
CAD使用教程：怎么在手机上插入CAD图块? cad
电脑上的建筑、水暖电软件里，有专业的图库功能，可以插入各类设备图块，那手机上怎么插入图块呢？1、打开浩辰CAD看图王移动版，点击工具箱里面的「插入图块」功能；2、点击「插入图块」功能后，可以看到两个选择：“我的图块库”和“当前图纸”；3、点击「+添加图块」按钮，然后按照需要将图块添加到我的图块库里面（需要添加什么图块勾选一下即可）；4、然后在图纸上点击需要插入的位置，下方可以设置图块的比例及角度，
JMeter 使用教程：从零开始构建性能测试我梦见你梦见我° jmeter
一、什么是JMeter？ApacheJMeter是一款开源的、基于Java的性能测试工具，主要用于测试系统在高并发场景下的稳定性、响应时间、吞吐量和资源利用率。它支持多种协议（HTTP、FTP、TCP、SOAP、JDBC等），可模拟数千个用户并发请求，是性能测试和负载测试的首选工具。二、安装与配置1.下载与安装访问JMeter官网，下载最新版本（例如JMeter5.6）。解压后直接运行bin目录下
Trae使用教程，帮助您快速上手这款编程神器。云上的阿七云计算
Trae是一款由字节跳动推出的AI驱动集成开发环境（IDE），旨在通过智能代码补全、多模态交互以及对整个代码库的上下文分析等功能，帮助开发者更高效地编写代码。其强大的AI能力能够理解开发者的需求并提供精准的代码生成和修改建议。目前，Trae提供免费版本，集成了Claude-3.5-Sonnet和GPT-4o等主流大模型。rae使用教程，帮助您快速上手这款编程神器。一、安装Trae访问官网：前往Tr
STM32F1基于HAL库的学习记录实用使用教程分享(五、PWM驱动舵机、呼吸灯) 藤樂. STM32学习 stm32 学习数据库
往期内容STM32F1基于HAL库的学习记录实用使用教程分享(一、GPIO_Output)STM32F1基于HAL库的学习记录实用使用教程分享(二、GPIO_Input按键)STM32F1基于HAL库的学习记录实用使用教程分享(三、外部中断按键)STM32F1基于HAL库的学习记录实用使用教程分享(四、OLEDIIC驱动软件IIC硬件IIC)文章目录往期内容前言一、PWMPWM如何控制LED亮度？
STM32 Cube MX 软件使用教程和技巧(纯干货分享~~！) 立量嵌入式IDE stm32 单片机嵌入式硬件
以下是关于STM32CubeMX的详细使用教程和一些实用技巧，帮助您快速上手并高效开发STM32项目：一、STM32CubeMX简介功能：ST官方推出的图形化配置工具，用于生成STM32微控制器的初始化代码（基于HAL库/LL库），支持引脚分配、时钟树配置、外设初始化等。优势：减少底层代码编写时间，避免手动配置寄存器，兼容多种IDE（Keil、IAR、STM32CubeIDE等）。二、基础使用教程
YOLOV11|YOLO12改进系列指南魔鬼面具 YOLO
基于Ultralytics的YOLO11|YOLO12改进目前自带的一些改进方案(持续更新)为了感谢各位对本项目的支持,本项目的赠品是yolov5-PAGCP通道剪枝算法.具体使用教程专栏改进汇总YOLO11系列二次创新系列ultralytics/cfg/models/11/yolo11-RevCol.yaml使用(ICLR2023)ReversibleColumnNetworks对yolo11主
python flask 使用教程快速搭建一个 Web 应用莫忘初心丶 python flask 前端
目录一、Flask简介二、Flask安装三、创建一个简单的Flask应用四、Flask路由与视图五、接收和处理用户输入六、模板引擎Jinja2七、Flask与数据库八、总结一、Flask简介Flask是一个轻量级的PythonWeb框架，旨在帮助开发者快速搭建Web应用。相比于Django等重量级框架，Flask更加简洁和灵活，非常适合用于小型Web项目的开发，甚至可以用于构建RESTfulAPI
aws s3 java使用教程_在 Amazon S3 对象上执行操作 - 适用于 Java 的 AWS 开发工具包 weixin_42510731 aws s3 java使用教程
本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。在AmazonS3对象上执行操作AmazonS3对象表示一个文件或数据集合。每个对象必须驻留在一个存储桶中。注意上传对象使用AmazonS3客户端的putObject方法，并为其提供存储桶名称、键名称和要上传的文件。存储桶必须存在，否则将出现错误。导入importcom.amazonaws.AmazonServiceExc
anythingLLM 使用教程惟贤箬溪穷玩Ai AIGC 人工智能
一、anythingLLM简介anythingLLM是一款灵活且功能强大的语言模型，它基于先进的深度学习架构构建，旨在为用户提供多样化的自然语言处理服务。其设计理念注重通用性和可扩展性，能够适应多种领域和任务，无论是文本生成、智能问答，还是翻译、摘要提取等，都能展现出出色的性能。与同类模型相比，anythingLLM具有训练数据丰富、模型优化程度高的优势，能够生成更符合逻辑、更具实用性的文本内容。
lingo使用笔记(仅入门) 发篇博客骗自己笔记
lingo使用教程㈠，大致描述（平白无趣的科普）Lingo是一款用于线性规划、整数规划和非线性规划的优化软件。以下是一些常见的Lingo语法和写法的笔记，帮助你快速上手。1.基本结构Lingo模型通常由以下几个部分组成：集合定义：定义模型中使用的集合。数据输入：定义模型中的参数和数据。变量定义：定义决策变量。目标函数：定义优化目标。约束条件：定义模型的约束条件。求解命令：告诉Lingo进行求解。2
AI学习教程DeepSeek使用教程合集免费下载 oneboxai 学习
1.DeepSeek本地部署2.Deepseek搭建个人知识库3.DeepSeek提示词详解4.Deepseek使用技巧大全5.DeepSeek提示词大全6.DeepSeek保姆级新手教程7.DeepSeek各类应用8.Deepseek写小说9.DeepSeekV3部署教程10.DeepseekwordExcel11.Deepseek科研论文12.Deepseek开发游戏13.大模型通用一-A1指
fork客户端mac使用教程 xtyzmnchen fork
1:安装fork:https://git-fork.com/2:登录账户,gitlab或者github账户3:克隆:复制服务器地址clone到本地4:gitfetch：相当于是从远程获取最新版本到本地，不会自动mergegitfetchoriginmastergitlog-pmaster..origin/mastergitmergeorigin/master以上命令的含义：首先从远程的origin
Vscode niuhe 插件使用教程 - xorm 代码生成诗意地回家 niuhe 插件 vscode ide 编辑器
官方教程已经上线,请访问:http://niuhe.zuxing.net本文相关项目:vue3-element-admin基于niuhe插件的管理后台模板niuhe-mdbookniuhe插件示例项目在日常开发中，新增数据库表时通常需要编写大量重复的增删改查代码。为提高开发效率，niuhe插件0.3.4版本新增Xorm基础代码生成功能，可自动生成：数据库表对应的Golang模型结构体基础CURD操
ollama 基本使用教程海上彼尚 AI ai 前端
目录1.安装OllamamacOS或LinuxWindows(WSL2)2.基础命令启动与停止更新Ollama3.模型管理下载预训练模型运行模型查看已安装模型删除模型从Modelfile创建自定义模型4.高级功能服务器模式与API多会话管理环境变量配置5.常见问题与技巧加速模型下载查看日志模型参数调整模型导出与分享Ollama是一个开源的大型语言模型服务工具，能够帮助用户在本地运行大模型。通过简单
VScode使用教程晓码bigdata C++python vscode 编辑器
VScode使用教程1VScode概览1.1特性1.2VScode下载安装1.3VScode基本使用1.4vsCode安装插件的3种方式1.5不能联网的电脑vscode安装插件3种方式1.6vsCode调试代码（3种模式）2VScode编写c++代码2.1怎么编写c++代码2.2出现了c++自带库无法识别的情况，是因为没配置好编译器gcc路径2.3使用gcc编译器编译c++程序报错找不到std3V
React Material Components Web 使用教程计煦能Leanne
ReactMaterialComponentsWeb使用教程react-mdc-webMaterialDesignComponentsforReact项目地址:https://gitcode.com/gh_mirrors/re/react-mdc-web项目介绍ReactMaterialComponentsWeb（简称react-mdc-web）是一个基于Google的MaterialDesign
美团Leaf分布式ID生成器使用教程：号段模式与Snowflake模式详解 Cloud_. 分布式
引言在分布式系统中，生成全局唯一ID是核心需求之一。美团开源的Leaf提供了两种分布式ID生成方案：号段模式（高可用、依赖数据库）和Snowflake模式（高性能、去中心化）。本文将手把手教你如何配置和使用这两种模式，并解析其核心机制。一、Leaf号段模式使用教程1.环境准备数据库：MySQL5.7+Java环境：JDK1.8+Leaf源码：从GitHub克隆Leaf仓库（推荐使用feature/
开源的 AntDesignVue 表单设计器使用教程低代码研究员 FormCreate 开源 FormCreate vue.js 表单设计器 ant-design-vue
FcDesigner版是一款基于Vue3.0的低代码可视化表单设计器工具，通过数据驱动表单渲染。可以通过拖拽的方式快速创建表单，提高开发者对表单的开发效率，节省开发者的时间。并广泛应用于在政务系统、OA系统、ERP系统、电商系统、流程管理等领域。源码地址:Github|Gitee|文档|在线演示本项目采用Vue3.0和AntDesignVue进行页面构建，内置多语言解决方案，支持二次扩展开发，支持
Golang Gin框架 go中 websocket使用 gorilla/websocket使用教程莫忘初心丶 golang gin websocket
前言公司新项目需要用websockt做及时通讯，golang语言，看了下websocket的库，选用使用人数比较多的gorilla/websocket框架介绍Gin框架是一个用Go语言编写的轻量级Web框架，而gorilla/websocket是Go语言中用于处理WebSocket的库。结合这两者可以实现在Gin应用中添加WebSocket功能。以下是一个简单的例子，演示了如何在Gin应用中使用g
对接马来西亚、印度、韩国、越南等全球金融数据示例 CryptoPP 金融 python windows
Python对接StockTV全球金融数据API的封装实现及使用教程：importrequestsimportwebsocketsimportasynciofromtypingimportDict,List,Optional,UnionfromdatetimeimportdatetimeclassStockTVClient:"""StockTV全球金融数据API客户端支持股票、外汇、期货、加密货币
OmniParser V2 安装与使用教程 Leaton Lee OmniParser V2 人工智能 deepseek
1.环境准备操作系统：支持Windows/macOS/Linux。Python版本：确保已安装Python3.7或更高版本。包管理工具：使用pip（Python自带）。安装环境：condacreate-n"omni"python==3.12condaactivateomnipipinstall-rrequirements.txt确保您已将V2权重下载到weights文件夹中（确保标题权重文件夹名为
Spring Boot 整合 Redis 使用教程小小鸭程序员 spring java spring boot mysql redis
Redis是一种高性能的键值存储数据库，常用于缓存、会话管理和消息队列等场景。SpringBoot通过SpringDataRedis提供了简洁的整合方式。1.环境准备1.1添加依赖在pom.xml中添加Redis依赖（SpringBoot3.x）：org.springframework.bootspring-boot-starter-data-redisredis.clientsjedis2.配置
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring