c++处理中文字符

目前在使用c++处理docx文档,在处理中文字符时遇到了中文乱码的问题,所以参考https://www.cnblogs.com/ranjiewen/p/5770639.html解决了这个问题

主要是因为英文字符是单字节存储char,而中文字符是双字节存储wchar,所以需要将char转化为wchar

wchar_t* convert(const char str[])
{
	size_t size = strlen(str);
	wchar_t *buffer = new wchar_t[size];
	DWORD dsize = MultiByteToWideChar(CP_UTF8, 0, str, size, NULL, 0);
	MultiByteToWideChar(CP_UTF8, 0, str, size, buffer, dsize);
	buffer[dsize] = L'\0';
	return buffer;
}

特别注意:需要在字符结尾添加结束符L'\0',否则就会出现乱码。

你可能感兴趣的:(c/c++小知识,c++,中文字符)