在用VC做开发的时候,对于一些字符串,会经常调用一般_t、_T、T(),其实这些东西都和Unicode有关系。比如说,AfxMessageBox(_T("Error! Fail to connect the database!"));这里用到了一个_T(),不使用_T()有时候编译会报错。
Windows操作系统使用Unicode作为默认的文本编码格式。Unicode定义了对大于8位的字符编码的支持。Windows使用UTF-16格式,称为宽字符编码,UTF-16编码以16位无符号整数为单位,每个字符占用两个字节。许多Windows函数都定义了两个入口点:Unicode版本入口函数以W字符结尾,表示的是针对宽字符的;ANSI字符入口点函数则以A结尾。比如说,对于CreateMutex()存在CreateMutexW()和CreateMutexA()。编译的时候根据是否定义了Unicode进行适当的函数调用。Windows内部使用的是宽字符,ANSI入口点实际上只是在宽字符版本函数调用之外加上包装,进行适当的字符串转换。
16位字符类型为wchar_t,可以代替char类型。WCHAR是定义宽字符的等价形式,在源代码中字符串都被解释成8位的ANSI字符,所以需要将其指定为宽字符,可以使用L说明符或者宏TEXT()来指定。
wchar_t str1[]=L”some text”;WCHAR st2[]=TEXT(“moretext”);
在定义了Unicode的情况下,TEXT()宏很有用,它会将字符串转换为宽字符格式;在未定义Unicode的情况下,它让字符串保留8位ANSI文本格式。TCHAR类型与之类似,定义了Unicode时,解析为wchar_t,否则解析成char。
有些函数也会根据是否定义了Unicode而采用不同的解析方式的宏。比如说,主函数_tmain()在定义UNICODE的情况下,解析为wmain(),否则解析为main();_tprintf()在定义了Unicode的情况下解析为wprintf(),否则解析成printf()。
其实在使用_tmain的时候,利用Goto Definition可以看到,在stdafx.h里面有这么一行,#include <tchar.h>,所以使用_tmain()的时候必须使用#include<tchar.h>,在头文件<tchar.h>里找到_tmain的宏定义,
#define _tmain main
经过预编译以后,_tmain就变成main了。main()是标准C++的函数入口。标准C++的程序入口点函数,默认字符编码格式ANSI函数原型为:
int main();
int main(int argc, char* argv[]);
_tmain()是windows提供的对Unicode字符集和ANSI字符集进行自动转换用的程序入口点函数,其原型为int _tmain(int argc, TCHAR *argv[])。
当程序当前的字符集为Unicode时,int _tmain(int argc, TCHAR *argv[])会被翻译成
int wmain(int argc, wchar_t *argv[]);当程序当前的字符集为ANSI时,int_tmain(int argc, TCHAR *argv[])会被翻译成int main(int argc, char *argv[])。