部分参考:
百度百科
http://blog.csdn.net/leitianjun/article/details/5605410
注意:
这两个函数是由Windows提供的转换函数,不具有通用性
C语言提供的转换函数为mbstowcs()/wcstombs()
一、函数简单介绍
涉及到的头文件:
函数所在头文件:windows.h
#include <windows.h>
wchar_t类型所需头文件:wchar.h
#include <wchar.h>
( 1 ) MultiByteToWideChar()
函数功能:该函数映射一个字符串到一个宽字符(unicode)的字符串。由该函数映射的字符串没必要是多字节字符组。
函数原型:
int MultiByteToWideChar(
UINT CodePage, DWORD dwFlags, LPCSTR lpMultiByteStr, int cchMultiByte, LPWSTR lpWideCharStr, int cchWideChar );参数:
1> CodePage:指定执行转换的多字节字符所使用的字符集
这个参数可以为系统已安装或有效的任何字符集所给定的值。你也可以指定其为下面的任意一值:
Value | Description |
---|---|
CP_ACP | ANSI code page |
CP_MACCP | Not supported |
CP_OEMCP | OEM code page |
CP_SYMBOL | Not supported |
CP_THREAD_ACP | Not supported |
CP_UTF7 | UTF-7 code page |
CP_UTF8 | UTF-8 code page |
如果函数运行成功,并且cchWideChar不为0,返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数;
如果函数运行成功,并且cchMultiByte为0,返回值是待转换字符串的缓冲区所需求的宽字符数大小。(此种情况用来获取转换所需的wchar_t的个数)
如果函数运行失败,返回值为零。
若想获得更多错误信息,请调用GetLastError()函数。它可以返回下面所列错误代码:
ERROR_INSUFFICIENT_BUFFER; ERROR_INVALID_FLAGS; ERROR_INVALID_PARAMETER; ERROR_NO_UNICODE_TRANSLATION。函数功能:该函数映射一个unicode字符串到一个多字节字符串。
函数原型:
int WideCharToMultiByte(
UINT CodePage, DWORD dwFlags, LPCWSTR lpWideCharStr, int cchWideChar, LPSTR lpMultiByteStr, int cchMultiByte, LPCSTR lpDefaultChar, LPBOOL pfUsedDefaultChar );参数:
与MultiByteToWideChar()函数中的参数类似,但是多了两个参数:
lpDefaultChar和pfUsedDefaultChar:只有当WideCharToMultiByte函数遇到一个宽字节字符,而该字符在uCodePage参数标识的代码页中并没有它的表示法时,WideCharToMultiByte函数才使用这两个参数。(通常都取值为NULL)
1> 如果宽字节字符不能被转换,该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL(这是大多数情况下的参数值),那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的,因为问号是个通配符。
2> pfUsedDefaultChar参数指向一个布尔变量,如果Unicode字符串中至少有一个字符不能转换成等价多字节字符,那么函数就将该变量置为TRUE。如果所有字符均被成功地转换,那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后,可以测试该变量。
返回值:
如果函数运行成功,并且cchMultiByte不为零,返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数;
如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所必需的字节数。(此种情况用来获取转换所需Char的个数)
如果函数运行失败,返回值为零。
若想获得更多错误信息,请调用GetLastError函数。它可以返回下面所列错误代码:
ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS; ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。二、使用方法
( 1 ) 将多字节字符串转为宽字符串:
1) 调用MultiByteToWideChar()函数,设置cchWideChar参数为0(用以获取转换所需的接收缓冲区大小);
2) 获取输入缓存的大小,作为cchMultiByte的值;(这样做是为了节省空间,也可以给cchMultiByte取值-1(字符串需要以空字符结尾,否则会出错))
3) 分配足够的内存块,用于存放转换后的Unicode字符串;
该内存块的大小由前面对cchWideChar()函数的返回值来决定;(也可以用别的方法,但该方法更节省内存)
4) 再次调用MultiByteToWideChar()函数,这次将缓存的地址作为lpWideCharStr,参数来传递,并传递第一次调用MultiByteToWideChar()函数时的返回值作为cchWideChar参数的值;
5) 使用转换后的字符串;
6) 释放接收缓冲区占用的内存块;
示例代码:
void main() { char sBuf[25]={0}; strcpy(sBuf, "我最棒"); //获取输入缓存大小 int sBufSize=strlen(sBuf); //获取输出缓存大小 //VC++ 默认使用ANSI,故取第一个参数为CP_ACP DWORD dBufSize=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, NULL, 0); printf("需要wchar_t%u个\n", dBufSize); wchar_t * dBuf=new wchar_t[dBufSize]; wmemset(dBuf, 0, dBufSize); //进行转换 int nRet=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, dBuf, dBufSize); if(nRet<=0) { cout<<"转换失败"<<endl; DWORD dwErr=GetLastError(); switch(dwErr) { case ERROR_INSUFFICIENT_BUFFER: printf("ERROR_INSUFFICIENT_BUFFER\n"); break; case ERROR_INVALID_FLAGS: printf("ERROR_INVALID_FLAGS\n"); break; case ERROR_INVALID_PARAMETER: printf("ERROR_INVALID_PARAMETER\n"); break; case ERROR_NO_UNICODE_TRANSLATION: printf("ERROR_NO_UNICODE_TRANSLATION\n"); break; } } else { cout<<"转换成功"<<endl; cout<<dBuf; } delete(dBuf); }注意:两次调用MultiCharToWideChar()时,形参cchMultiByte的取值需要相同,否则可能会出现接收缓存不足之类的错误,从而导致转换失败!
( 2 ) 从宽字节转为窄字节字符串
步骤与(1)类似,故不赘述
代码示例如下:
//从宽字符串转换窄字符串 wchar_t sBuf[25]={0}; wcscpy(sBuf, L"我最棒"); //获取转换所需的目标缓存大小 DWORD dBufSize=WideCharToMultiByte(CP_OEMCP, 0, sBuf, -1, NULL,0,NULL, FALSE); //分配目标缓存 char *dBuf = new char[dBufSize]; memset(dBuf, 0, dBufSize); //转换 int nRet=WideCharToMultiByte(CP_OEMCP, 0, sBuf, -1, dBuf, dBufSize, NULL, FALSE); if(nRet<=0) { printf("转换失败\n"); } else { printf("转换成功\nAfter Convert: %s\n", dBuf); } delete []dBuf;
三、MultiByteToWideChar()函数乱码的问题
有的朋友可能已经发现,在标准的WinCE4.2或WinCE5.0 SDK模拟器下,这个函数都无法正常工作,其转换之后的字符全是乱码!
及时更改MultiByteToWideChar()参数也依然如此。不过这个不是代码问题,其结症在于所定制的操作系统.如果我们定制的操作系统默认语言不是中文,也会出现这种情况。
由于标准的SDK默认语言为英文,所以肯定会出现这个问题。而这个问题的解决,不能在简单地更改控制面板的"区域选项"的"默认语言",而是要在系统定制的时候,选择默认语言为"中文"。系统定制时选择默认语言的位置于: Platform -> Setting... -> locale -> default language ,选择"中文",然后编译即可。