关于这两个函数的区别,可以参考《Windows 核心编程(第五版)》的第六章"线程基础",这篇文章的思想多数来源于此,我只是作了一些整理。
线程对于初学者还说可能觉得很高深,这可以理解。对于某些有经验的程序员来说,可能觉得又太简单,我觉得如果认为线程很简单的人,都是没有理解线程,线程里面涉及的东西太多,包括内存,初始化,线程同步等。我打算以QA的形式来写这篇文章。
A:好了,一直用APICreateThread来创建线程的同志们要注意了,你可能会说我一直用这个API来创建线程,工作刚刚的,一点问题都没有。如果真是这样的话,我只能说是你运气太好了。在_beginthreadex的内部,它调用了CreateThread来创建线程,Windows始终用CreateThread来创建线程。在调用CreateThread之前,beginthreadex它做了很多初始化的工作,所以它比CreateThread创建的线程更加安全。
A:这里就有一定的历史原因了,标准C语言的库在是1970年左右发明的,而在那时候,线程的概念尚未出现在任何一个操作系统上。但是,线程毕竟是出现了,让我们来看看下面这个例子,来说明以前的CRT为什么不支持多线程:
BOOL fFailure = (system("NOTEPAD.EXE README.TXT") == -1); if (fFailure) { switch (errno) { case E2BIG: // Argument list or environment too big break; case ENOENT: // Command interpreter cannot be found break; case ENOEXEC: // Command interpreter has bad format break; case ENOMEM: // Insufficient memory to run command break; } }
假如代码是这种情况,当执行到"system"这个函数之后,if之前,操作系统把当时CPU时钟周期分配给另一个线程,而在另一个线程中正好使用了会设置errno(这是C语言的一个全局变量)的CRT函数,于是问题就出现了。
所以早期的CRT函数是没有考虑到多线程的,在多线程中还会出问题的CRT函数还有:strtok, _wcstok,strerror, _strerror, tmpnam, tmpfile, asctime, etc.为了保证C和C+多线程应用程序正常运行,必须创建一个数据结构,并使之与使用了C/C+运行库函数的每个线程相关联,然后在调用CRT函数时,那些函数必须知道去查找主调线程的数据块,从而避免影响到其他线程。
那么,当系统创建线程时,它怎么知道要分配这个数据块,又应该如何分配,它不知道,它也不知道你所调用的函数是否是线程安全,所以说,我们在创建新线程时,一定不要调用操作系统的CreateThread(WindowsAPI)函数,相反,我们始终应当调用CRT函数_beginthreadex,原型如下:unsigned long _beginthreadex ( void *security, unsigned stack_size, unsigned (*start_address)(void *), void *arglist, unsigned initflag, unsigned *thrdaddr );
typedef unsigned (__stdcall * PTHREAD_START) (void *); #define chBEGINTHREADEX(psa, cbStack, pfnStartAddr, \ pvParam, fdwCreate, pdwThreadID) \ ((HANDLE) _beginthreadex( \ (void *) (psa), \ (unsigned) (cbStack), \ (PTHREAD_START) (pfnStartAddr),\ (void *) (pvParam),\ (unsigned) (fdwCreate), \ (unsigned *) (pdwThreadID)))
Q:为什么说_beginthreadex就要比CreateThread更好,你是怎么知道的?
A:由于Microsoft已经为CRT函数提供了源码,我们可以看到_beginthreadex到底比CreateThread多做了些什么事情,源码在ProgramFiles\Microsoft Visual Studio8\VC\crt\src\Threadex.c中,可以找到_beginthreadex的实现,这里是它的实现:
_beginthreadex的源码
_MCRTIMP uintptr_t __cdecl _beginthreadex ( void *security, unsigned stacksize, unsigned (__CLR_OR_STD_CALL * initialcode) (void *), void * argument, unsigned createflag, unsigned *thrdaddr ) { _ptiddata ptd; uintptr_t thdl; unsigned long err = 0L; unsigned dummyid; _VALIDATE_RETURN(initialcode != NULL, EINVAL, 0); __set_flsgetvalue(); if ( (ptd = (_ptiddata)_calloc_crt(1, sizeof(struct _tiddata))) == NULL ) goto error_return; _initptd(ptd, _getptd()->ptlocinfo); ptd->_initaddr = (void *) initialcode; ptd->_initarg = argument; ptd->_thandle = (uintptr_t)(-1); #if defined (_M_CEE) || defined (MRTDLL) if(!_getdomain(&(ptd->__initDomain))) { goto error_return; } #endif if ( thrdaddr == NULL ) thrdaddr = &dummyid; if ( (thdl = (uintptr_t) CreateThread( (LPSECURITY_ATTRIBUTES)security, stacksize, _threadstartex, (LPVOID)ptd, createflag, (LPDWORD)thrdaddr)) == (uintptr_t)0 ) { err = GetLastError(); goto error_return; } return(thdl); error_return: _free_crt(ptd); if ( err != 0L ) _dosmaperr(err); return( (uintptr_t)0 ); }
我们要明确几点:
1)每个线程都有自己的专用的_tiddata内存块,它是从C/C++的堆是分配出来的。
2)传给_beginthreadex的线程处理函数地址(线程的回调函数地址)是存在_tiddata内存块中的。
3)_beginthreadex内部的确调用了CreateThread来创建线程,这(CreateThread)是操作系统创建线程的唯一方式。
4)退出线程时调用_endthreadex,它内部调用了APIExitThread,它会释放创建线程在堆上分配的内存_tiddata。
Q:我要怎么终止线程?
A:与_beginthreadex相对应的退出线程的函数是_endthreadex,CreateThread 对应ExitThread,一般情况下我们不要调用这两个函数来终止线程,最好是让线程走完它的线程处理函数,让它自生自灭。如果要调用的话,最好调用_endthreadex,但一般不推荐。
OK,目前为止你应该对谁更好些的问题有了深入的了解,但是为什么调用CreateThread的程序仍然可以经年累月的正常运行呢?当线程调用一个需要tiddata结构的CRT函数时(大多数CRT函数是线程安全的,并不需要该结构),首先CRT函数试图获取线程的数据块的地址(通过调用TlsGetValue),然后,如果返回NULL,说明调用线程没有相关联的tiddata块,那么CRT函数马上为调用线程分配并初始化一个tiddata块,并将该内存块关联到线程(通过TlsSetValue),这样,该CRT函数以及其他CRT函数都可以使用该线程的tiddata块了(此即所谓"前人栽树后人乘凉"了,_)。
当然,如果说你的线程运行的时候一直没有问题是几乎不可能的。事实上,的确有一些问题需要说说。如果线程使用了CRT的signal函数,整个进程都会被中止,因为结构化异常处理体尚未准备好。同样,如果不调用_endthreadex来中止线程就会造成内存泄漏,如果使用_beginthreadex,当然会容易想到_endthreadex,但如果你习惯了使用CreateThread,是否还会想起_endthreadex,我表示极大的怀疑,而且CreateThread/_endthreadex的组合怎么看怎么让人别扭。
不要忘记开始的问题,接下来让我们再来看看效率问题。CRT库的多线程版本在某些函数里面放置了同步原语,比如malloc,为了保证堆不会被同时调用的malloc函数破坏,这不可避免地会对效率造成影响,C/C++的哲学我们不应忘记,"决不为自己没有用到的付出代价",自然,我们无权要求单线程程序为多线程程序付出它们不该付出的代价,所以,开头的问题也有了答案。
上面所说的都是静态链接的CRT库,而CRT库的动态链接版本则被编写得更加通用,以便能够被任何运行的程序和DLL共享。正是基于这个原因,这个版本的库只存在多线程版本。因为CRT库是以DLL形式提供的,程序和DLL不需要包含CRT库的任何代码,自然尺寸也就更小。同时,如果Microsoft修正了CRT库DLL中的Bug,程序也就自然受益了。
首先,如果你调用_beginthreadex,你会获得线程的句柄,句柄当然需要关闭,但_endthreadex并没有这么做。通常是调用_beginthreadex的线程(很可能是主线程)来调用CloseHandle关闭不再需要的新线程的句柄。其次,如果你使用CRT函数,你只需要使用_beginthreadex即可。如果不使用,那么你可以只使用CreateThread。同样,如果只有一个线程(主线程)使用CRT,你也可以使用CreateThread;如果新创建的线程不使用CRT,那么你也不需要_beginthreadex和多线程CRT。