解决 TinyXML中文乱码的问题

在使用TinyXML 时,发现中文支持不好,

找来找去,发现下面文章对我有很大帮助,按照其中的函数进行转换后,可以处理中文

 

我是在SetAttribute() 函数之前使用的

SetAttribute(const char* name,const char * _value)

 

首先得到了一个CString 类型的变量 strItem

然后

char *pBuf = strItem.GetBuffer();

GBKToUTF8(pBuf);

SetAttribute("Title",pBuf);

 

即可。

 

 

http://blog.csdn.net/wj253209529/archive/2009/09/28/4607040.aspx

 

乱码是由于GB2312与UTF8之间转换不当造成的,tinyxml在处理UTF8本身没有问题,当你打开一个UTF8的文档,可以在加载的时候指定UTF8的方式,或者文档声明处指明的编码格式,tinyxml会按照相应的编码格式加载,但很多时候当我们输出或写入中文字段时会出现乱码,无论在内存,还是打印出来的内容.这是因为我们的软件通常是GB2312编码,而读取或写入的内容是UTF8,自然就会出错.可以借助以下的两个函数来实现转换:

void UTF8ToGBK( char *&szOut )
{
 unsigned short *wszGBK;
 char *szGBK;
 //长度
 int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
 wszGBK = new unsigned short[len+1];
 memset(wszGBK, 0, len * 2 + 2);
 MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);

 //长度
 len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
 szGBK = new char[len+1];
 memset(szGBK, 0, len + 1);
 WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);

 //szOut = szGBK; //这样得到的szOut不正确,因为此句意义是将szGBK的首地址赋给szOut,当delete []szGBK执行后szGBK的内

                             //存空间将被释放,此时将得不到szOut的内容

 memset(szOut,'/0',strlen(szGBK)+1); //改将szGBK的内容赋给szOut ,这样即使szGBK被释放也能得到正确的值
 memcpy(szOut,szGBK,strlen(szGBK));


 delete []szGBK;
 delete []wszGBK;
}

void GBKToUTF8(char* &szOut)
{
 char* strGBK = szOut;

 int len=MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, NULL,0);
 unsigned short * wszUtf8 = new unsigned short[len+1];
 memset(wszUtf8, 0, len * 2 + 2);
 MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, (LPWSTR)wszUtf8, len);

 len = WideCharToMultiByte(CP_UTF8, 0, (LPWSTR)wszUtf8, -1, NULL, 0, NULL, NULL);
 char *szUtf8=new char[len + 1];
 memset(szUtf8, 0, len + 1);
 WideCharToMultiByte (CP_UTF8, 0, (LPWSTR)wszUtf8, -1, szUtf8, len, NULL,NULL);

 //szOut = szUtf8;
 memset(szOut,'/0',strlen(szUtf8)+1);
 memcpy(szOut,szUtf8,strlen(szUtf8));

 delete[] szUtf8;
 delete[] wszUtf8;
}

 

 

 

==========================

 

 

你可能感兴趣的:(解决 TinyXML中文乱码的问题)