windows字符和字符串处理
Windows定义的Unicode数据类型有:
WCHAR Unicode字符
PWSTR 指向Unicode字符串的指针
PCWSTR 指向一个恒定的Unicode字符串的指针
相对应的ANSI数据类型有:
CHAR ANSI字符
PSTR 指向ANSI字符串的指针
PCSTR 指向一个恒定的ANSI字符串的指针
通用的字符数据类型:
TCHAR
PTSTR
PCTSTR
其中TCHAR的定义位于类TChar.h中,需要定义宏_UNICODE才能调用unicode数据类型。 PTSTR,PCTST的定义位于 Windows.h头文件中,需要定义宏UNICODE才能调用unicode数据类型。因此当同时调用windows.h和TChar.h文件且需要用 到unicode编码时,需要同时定义宏_UNICODE和宏UNICODE。
注:
1.为了程序的兼容性,一般调用通用字符类型。并且建议最好使用操作系统函数,而不要使用C运行期字符串函数。这将有助于稍稍提高你的应用程序的运行性能。
2.当将字符串地址附值给TCHAR指针变量时需要的格式为
TCHAR* pszError = _TEXT("error");
因为如果不加_TEXT,默认“"error"为ANSI编码.
3. 当为用户提供dll链接库时需要定义一套既适合unicode又适合ANSI的代码。一般是在ANSI的函数中将ANSI的参数转换为UNICODE的参 数再调用UNICODE的函数。如windows提供的函数CreateWindowExA和CreateWindowExW。另外Windows还定义 了一个宏CreateWindowEx,其定义如下:
#ifdef unicode
#define CreateWindowEx CreateWindowExW
#else
#define CreateWindowEx CreateWindowExA
#endif
4. 当计算字符个数时应该调用sizeof(szBuffer)/sizeof(TCHAR),而不是sizeof(szBuffer),分配内存时应该调用 malloc(nCharacters *sizeof(TCHAR)), 而不是调用malloc(nCharacters )。
5._countof宏可获得字符串的字符数,sizeof可获得字符串的字节数。
1. 为了兼容性可以调用以下函数来处理字符:
lstrcat 将一个字符串置于另一个字符串的结尾处
lstrcmp 对两个字符串进行区分大小写的比较
lstrcmpi 对两个字符串进行不区分大小写的比较
lstrcpy 将一个字符串拷贝到内存中的另一个位置
lstrlen 返回字符串的长度(按字符数来计量)
PTSTR CharLower(PTSTR pszString)
PTSTR CharUpper(PTSTR pszString)
DWORD CharLowerBuff(PTSTR pszString,DWORD cchString)
DWORD CharUpperBuff(PTSTR pszString,DWORD cchString)
BOOL IsCharAlpha(TCHAR ch);
BOOL IsCharAlphaNumeric(TCHAR ch)
BOOL IsCharLower(TCHAR ch)
BOOL IsCharUpper(TCHAR ch)
sprintf(PTSTR, PTSTR, PTSTR)
注: (1).CharLower,CharUpper,CharLowerBuff,CharUpperBuff这几个函数还可以用来处理一个字符,方法如下:TCHAR cLowerCaseChar= CharLower((PTSTR)szString[0])
(2).CharUpper 和CharUpperBuff的区别是charUpperBuff用于处理缓冲区的数据(该缓冲区不必以0结尾)
2其他函数:
DWORD IsTextUnicode(CONST PVOID pvBuffer,int cb, PINT pResult);(此函数用于判断文本文件的编码类型)
int WideCharToMultiByte(UINT uCodePage, DWORD dwFlags,PCWSTR pWideCharStr,
int cchWideChar,PSTR pMultiByteStr,int cchMultiByte,PCSTR pDefaultChar,PBOOL pfUDC)
int MultiByteToWideChar(UINT uCodePage, DWORD dwFlags,PSTR pMultiByteStr,
int cchMultiByte,,PCWSTR pWideCharStr,int cchWideChar)
函数MultiByteToWideChar的使用方法:
1) 调用MultiByteToWideChar函数,为pWideCharStr参数传递NULL,为cchWideChar参数传递0。
2) 分配足够的内存块,用于存放转换后的Unicode字符串。该内存块的大小由前面对MultiByteToWideChar的调用返回。
3) 再次调用MultiByteToWideChar,这次将缓存的地址作为pWideCharStr参数来传递,并传递第一次调用MultiByteToWideChar时返回的 缓存大小,作为cchWideChar参数。
4) 使用转换后的字符串。
5) 释放Unicode字符串占用的内存块。
3.安全字符串函数
C运行库中现有的字符串处理函数(如_tcscpy宏后面的那些函数)已被标记废弃不用。如果使用了这些函数,编译器就会发出警告。
取而代之的是安全字符串函数,例如:
errno_t strcpy_s( char *strDestination, size_t numberOfElements, const char *strSource );
errno_t strcat_s( char *strDestination, size_t numberOfElements, const char *strSource );
这些安全的字符串函数在将一个可写的缓冲区作为参数传递时,必须同时提供他的大小。这个值应该是一个字符数。通过对缓冲区使用_countof宏(在stdlib.h中定义),我们很容易计算出这个值。
ps:1.使用上面这些安全的字符串函数的时候必须包含头文件StrSafe.h。同时String.h也会自动被包含进来。
2.必须包含其他所有文件之后才包含StrSafe.h。
参考来源:<