有了信号处理程序和线程,多个控制线程在同一时间可能潜在地调用同一个函数。
如果一个函数在同一时刻可以被多个线程安全地调用,就称该函数是线程安全的。在Single UNIX Specification中定义的所有函数,除了表12-5中列出的函数以外,其他函数都保证是线程安全的。另外,ctermid和tmpnam函数在参数传入空指针时并不能保证是线程安全的。类似地,wcrtomb和wcsrtombs函数如果参数mbstate_t传入的是空指针的话,也不能保证它们是线程安全的。
表12-5 POSIX.1中不能保证线程安全的函数(此表摘自第三版)
支持线程安全函数的操作系统实现会在<unistd.h>中定义符号_POSIX_THREAD_SAFE_FUNCTIONS。应用程序可以在sysconf函数中传入_SC_THREAD_SAFE_FUNCTIONS参数,以在运行时检查是否支持线程安全函数。所有遵循XSI的实现要求必须支持线程安全函数。
操作系统实现支持线程安全函数这一特性时,对POSIX.1中的一些非线程安全函数,它会提供可替代的线程安全版本,表12-6列出了这些函数的线程安全版本。很多函数并不是线程安全的,因为他们返回的数据是存放在静态的内存缓冲区中。通过修改接口,要求调用者自己提供缓冲区可以使函数变为线程安全的。
表12-6 替代的线程安全函数(此表摘自第三版)
表12-6中列出的函数的命名方式与他们的非线程安全版本的名字相似,只不过在名字最后加了_r,以表明这个版本是可重入的。
如果一个函数对多个线程来说是可重入的,则说这个函数是线程安全的,但这并不能说明对信号处理程序来说该函数也是可重入的。如果函数对异步信号处理程序的重入是安全的,那么就可以说函数是异步-信号安全的。
除了表12-6中列出的函数,POSIX.1还提供了以线程安全的方式管理FILE对象的方法。可以使用flockfile和ftrylockfile获取与给定FILE对象关联的锁。这个锁是递归的,当占有这把锁的时候,还可以再次获取该锁,这并不会导致死锁。虽然这种锁的具体实现并无规定,但要求所有操作FILE对象的标准I/O例程表现得就像它们内部调用了flockfile和funlockfile一样。
#include <stdio.h> int ftrylockfile(FILE *fp); 返回值:若成功则返回0,否则返回非0值 void flockfile(FILE *fp); void funlockfile(FILE *fp);
虽然标准的I/O例程从它们各自的内部数据结构这一角度出发,可能是以线程安全的方式实现的,但有时把锁开放给应用程序仍然是非常有用的。这允许应用程序把多个对标准I/O函数的调用组合成原子序列。当然,在处理多个FILE对象时,需要注意可能出现的死锁,并且需要对所有的锁仔细地排序。
如果标准I/O例程都获取它们各自的锁,那么在做一次一个字符的I/O操作时性能就会出现严重的下降。在这种情况下,需要对每一个字符的读或写操作进行获取锁和释放锁的动作。为了避免这种开销,出现了不加锁版本的基于字符的标准I/O例程。
#include <stdio.h> int getchar_unlocked(void); int getc_unlocked(FILE *fp); 两者的返回值都是:若成功则返回一个字符,若已到达文件结尾或出错则返回EOF int putchar_unlocked(int c); int putc_unlocked(int c, FILE *fp); 两者的返回值都是:若成功则返回c,若出错则返回EOF
除非被flockfile(或ftrylockfile)和funlockfile的调用包围,否则尽量不要调用这四个函数,因为它们会导致不可预期的结果(即由多个控制线程非同步地访问数据所引起的种种问题)。
一旦对FILE对象进行加锁,就可以在释放锁之前对这些函数进行多次调用。这样就可以在多次的数据读写上分摊总的加解锁的开销。
实例
程序清单12-3显示了getenv(http://www.cnblogs.com/nufangrensheng/p/3508319.html)一个可能的实现。因为所有调用getenv的线程返回的字符串都存放在同一个静态缓冲区中,所以这个版本不是可重入的。如果两个线程同时调用这个函数,就会看到不一致的结果。
程序清单12-3 getenv的非可重入版本
#include <limits.h> #include <signal.h> static char envbuf[ARG_MAX]; extern char **environ; char * getenv(const char *name); { int i, len; len = strlen(name); for(i = 0; environ[i] != NULL; i++) { if((strncmp(name, environ[i], len) == 0) && (environ[i][len] == '=')) { strcpy(envbuf, &environ[i][len+1]); return(envbuf); } } return(NULL); }
程序清单12-4给出了getenv的可重入版本,这个版本命名为getenv_r。它使用pthread_once函数来确保每个进程只调用一次thread_init函数。
程序清单12-4 getenv的可重入(线程安全)版本
#include <string.h> #include <errno.h> #include <pthread.h> #include <stdlib.h> extern char **environ; pthread_mutex_t env_mutex; static pthread_once_t init_done = PTHREAD_ONCE_INIT; static void thread_init(void) { pthread_mutexattr_t attr; pthread_mutexattr_init(&attr); pthread_mutexattr_settype(&attr, PTHREAD_MUTEX_RECURSIVE); pthread_mutex_init(&env_mutex, &attr); pthread_mutexattr_destroy(&attr); } int getenv_r(const char *name, char *buf, int buflen) { int i, len, olen; pthread_once(&init_done, thread_init); len = strlen(name); pthread_mutex_lock(&env_mutex); for(i = 0; environ[i][len] != NULL; i++) { if((strncmp(name, environ[i], len) == 0) && (environ[i][len] == '=')) { olen = strlen(&environ[i][len+1]); if(olen >= buflen) { pthread_mutex_unlock(&env_mutex); return(ENOSPC); } strcpy(buf, &environ[i][len+1]); pthread_mutex_unlock(&env_mutex); return(0); } } pthread_mutex_unlock(&env_mutex); return(ENOENT); }
要使getenv_r可重入,需要改变接口,调用者必须自己提供缓冲区,这样每个线程可以使用各自不同的缓冲区从而避免其他线程的干扰。但是注意这还不足以使getenv_r成为线程安全的,要使getenv_r成为线程安全的,需要在搜索请求的字符串时保护环境不被修改。我们可以使用互斥量,通过getenv_r和putenv函数对环境列表的访问进行序列化。
可以使用读写锁,从而允许对getenv_r的多次并发访问,但并发性的增强可能并不会在很大程度上改善程序的性能。这里面有两个原因:首先,环境列表通常不会很长,所以扫描列表时并不需要长时间地占有互斥量;其次,对getenv和putenv的调用不是频繁发生的,所以改善它们的性能并不会对程序的整体性能产生很大的影响。
即使把getenv_r变成线程安全的,也并不意味着它对信号处理程序是可重入的。如果使用的是非递归的互斥量,当线程从信号处理程序中调用getenv_r时,就有可能出现死锁。如果信号处理程序在线程执行getenv_r时中断了该线程,由于这时已经占有加锁的env_mutex,这样其他线程试图对这个互斥量的加锁就会被阻塞,最终导致线程进入死锁状态。所以,必须使用递归互斥量阻止其他线程改变当前正在查看的数据结构,同时还要阻止来自信号处理程序的死锁。问题是pthread函数并不保证是异步信号安全的,所以不能把pthread函数用于其他函数,让该函数成为异步信号安全的。
本篇博文内容摘自《UNIX环境高级编程》(第二版),仅作个人学习记录所用。关于本书可参考:http://www.apuebook.com/。