浅析C++中String到WString的转换

今天心情不好,但是生活还要继续。
那就谈一谈wstring、string以及二者的转换吧!

W顾名思义就是Width的缩写,即所谓的“宽”。

首先看一下wstring和string分别如何定义的:

typedef basic_string<char, char_traits<char>, allocator<char> >string;

typedef basic_string<wchar_t, char_traits<wchar_t>, allocator<wchar_t> >wstring;

从上面的代码可以看出,二者的区别就是在于wchar_t和char的区别:
wchar_t是Unicode字符的数据类型,它实际定义在

wchar_t *szTest=L"This is a Unicode string."

先介绍几个函数吧!
MultiByteToWideChar
作用:该函数映射一个字符串到一个宽字符(unicode)的字符串。由该函数映射的字符串没必要是多字节字符组。
语法:

int MultiByteToWideChar(
  _In_      UINT   CodePage,
  _In_      DWORD  dwFlags,
  _In_      LPCSTR lpMultiByteStr,
  _In_      int    cbMultiByte,
  _Out_opt_ LPWSTR lpWideCharStr,
  _In_      int    cchWideChar
);

参数:
CodePage:指定执行转换的字符集,这个参数可以为系统已安装或有效的任何字符集所给定的值。你也可以指定其为下面的任意一值:
CP_UTF8:使用UTF-8转换。

dwFlags:一组位标记用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。

lpMultiByteStr:指向将被转换字符串的字符。

cchMultiByte:指定由参数lpMultiByteStr指向的字符串中字节的个数。如果lpMultiByteStr指定的字符串以空字符终止,可以设置为-1(如果字符串不是以空字符中止,设置为-1可能失败,可能成功),此参数设置为0函数将失败。

lpWideCharStr:指向接收被转换字符串的缓冲区。

cchWideChar:指定由参数lpWideCharStr指向的缓冲区的宽字符个数。若此值为零,函数返回缓冲区所必需的宽字符数,在这种情况下,lpWideCharStr中的缓冲区不被使用。

返回值:如果函数运行成功,并且cchWideChar不为零,返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数

str.c_str()
语法:

const value_type *c_str( ) const;

作用:为名为的字符串中的 C 样式版本的指针。指针值。调用非为 Const 函数后包括无效,析构函数,在对象的 basic_string 的类。

因此呢,我们就可以得到由string转wstring的函数StringToWString

std::wstring StringToWString(const std::string& str) {
    int num = MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, NULL, 0);
    wchar_t *wide = new wchar_t[num];
    MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, wide, num);
    std::wstring w_str(wide);
    delete[] wide;
    return w_str;
}

你可能感兴趣的:(C++)