在使用TinyXML 时,发现中文支持不好,
找来找去,发现下面文章对我有很大帮助,按照其中的函数进行转换后,可以处理中文
我是在SetAttribute() 函数之前使用的
SetAttribute(const char* name,const char * _value)
首先得到了一个CString 类型的变量 strItem
然后
char *pBuf = strItem.GetBuffer();
GBKToUTF8(pBuf);
SetAttribute("Title",pBuf);
即可。
http://blog.csdn.net/wj253209529/archive/2009/09/28/4607040.aspx
乱码是由于GB2312与UTF8之间转换不当造成的,tinyxml在处理UTF8本身没有问题,当你打开一个UTF8的文档,可以在加载的时候指定UTF8的方式,或者文档声明处指明的编码格式,tinyxml会按照相应的编码格式加载,但很多时候当我们输出或写入中文字段时会出现乱码,无论在内存,还是打印出来的内容.这是因为我们的软件通常是GB2312编码,而读取或写入的内容是UTF8,自然就会出错.可以借助以下的两个函数来实现转换:
void UTF8ToGBK( char *&szOut )
{
unsigned short *wszGBK;
char *szGBK;
//长度
int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
wszGBK = new unsigned short[len+1];
memset(wszGBK, 0, len * 2 + 2);
MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);
//长度
len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
szGBK = new char[len+1];
memset(szGBK, 0, len + 1);
WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);
//szOut = szGBK; //这样得到的szOut不正确,因为此句意义是将szGBK的首地址赋给szOut,当delete []szGBK执行后szGBK的内
//存空间将被释放,此时将得不到szOut的内容
memset(szOut,'/0',strlen(szGBK)+1); //改将szGBK的内容赋给szOut ,这样即使szGBK被释放也能得到正确的值
memcpy(szOut,szGBK,strlen(szGBK));
delete []szGBK;
delete []wszGBK;
}
void GBKToUTF8(char* &szOut)
{
char* strGBK = szOut;
int len=MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, NULL,0);
unsigned short * wszUtf8 = new unsigned short[len+1];
memset(wszUtf8, 0, len * 2 + 2);
MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, (LPWSTR)wszUtf8, len);
len = WideCharToMultiByte(CP_UTF8, 0, (LPWSTR)wszUtf8, -1, NULL, 0, NULL, NULL);
char *szUtf8=new char[len + 1];
memset(szUtf8, 0, len + 1);
WideCharToMultiByte (CP_UTF8, 0, (LPWSTR)wszUtf8, -1, szUtf8, len, NULL,NULL);
//szOut = szUtf8;
memset(szOut,'/0',strlen(szUtf8)+1);
memcpy(szOut,szUtf8,strlen(szUtf8));
delete[] szUtf8;
delete[] wszUtf8;
}
==========================