在 Linux 中,每个进程都拥有两个位向量,这两个位向量共同决定了进程将如何处理信号:
pending
位向量,它包含了那些内核发送给进程,但还没有被进程处理掉的信号。blocked
位向量,它包含了那些被进程屏蔽掉的信号。 当内核发送一个信号给进程时,它将会修改进程的pending
位向量,譬如说,当内核发送一个SIGINT
信号给进程,那么它会将进程的pending[SIGINT]
的值设置成 1:
同样地,当进程屏蔽掉一个信号时,那么它会修改blocked
位向量。那么信号屏蔽是什么意思呢?当进程屏蔽掉一个信号之后,内核仍然可以发送这个信号给进程(保存在进程的pending
位向量中),但进程不会接收并处理这个信号。只有当进程解除了对这个信号的屏蔽之后,进程才会接收并处理这个信号。
让我们从内核的角度看,大概是这样的:当内核执行 context switch 切换到某个进程的时候,它会检查进程的pending
和blocked
位向量。如果发现进程还有信号未处理,同时这个信号没有被进程屏蔽,那么内核就会让进程接收并处理这个信号。用伪代码可以这样表示:
for (int i = 0; i < pending.size(); ++i)
{
if (pending[i] & (~blocked[i]))
{
// 将这个信号从 pending 位向量中清除
pending[i] = 0;
// 让进程接收并处理这个信号
// ...
break;
}
}
譬如说,下面的程序一开始就屏蔽了SIGINT
信号,所以即使内核发送SIGINT
信号给这个程序,这个信号也不会得到处理。而当程序解除了对SIGINT
的屏蔽之后,这个SIGINT
信号才会得到处理:
#include
#include
#include
void sigint_handler(int sig)
{
const char *message = "handle SIGINT signal\n";
write(STDOUT_FILENO, message, strlen(message));
}
int main()
{
signal(SIGINT, sigint_handler);
sigset_t mask, prev_mask;
sigemptyset(&mask);
sigaddset(&mask, SIGINT);
// 屏蔽掉 SIGINT 信号
sigprocmask(SIG_BLOCK, &mask, &prev_mask);
// 假设此时接收到 SIGINT 信号
sleep(10);
// 解除对 SIGINT 的屏蔽之后,进程会开始处理 SIGINT 信号
sigprocmask(SIG_SETMASK, &prev_mask, NULL);
return 0;
}
通常来说,信号中断有两种情况:
上面这两种情况都会带来并发安全的问题,因此在编写信号 handler 时,需要考虑到并发安全的问题。譬如说,由于信号 handler 会中断主程序的执行,如果信号 handler 与主程序共享全局变量,就可能带来并发安全的问题。
信号 handler 与主程序共享全局变量是很常见的。譬如说,当进程在接收到SIGINT
时,为了优雅地退出程序,这时可以使用一个全局变量记录是否接收到SIGINT
信号。主程序每次进入循环时都会检查这个变量,如果发现进程接收到SIGINT
信号,就释放好资源并退出程序:
#include
#include
#include
#include
int quit = 0;
void sigint_handler(int sig) { quit = 1; }
int main()
{
char *buffer = malloc(1024 * sizeof(char));
signal(SIGINT, sigint_handler);
while (true)
{
if (quit)
{
free(buffer);
return 0;
}
// do something else
sleep(10);
}
return 0;
}
上面的代码并不是并发安全的,可能导致两个问题:
quit
的副本存储在寄存器中,每次访问quit
时就从寄存器中访问。那么即使信号 handler 修改了这个quit
在内存中的值,主程序也可能不知道。quit
的值,信号 handler 会改变quit
的值,而这两个操作都不保证是原子的。我们可以这样解决这两个问题:
quit
声明为volatile
变量。volatile
可以阻止编译器所做的优化,这样信号 handler 和主程序访问quit
时都会从主内存中访问。quit
的类型改成sig_atomic_t
,因为 Linux 保证对sig_atomic_t
变量的读写操作都是原子的(不会被信号中断)。也就是说,只需要改变一行代码:
volatile sig_atomic_t quit = 0;
前面我们说到,当进程在执行某个信号 handler 的过程中,可能会被另一个信号 handler 中断。这也会导致并发安全的问题。为了保证并发安全,在信号 handler 中,我们只能调用异步信号安全的函数,这类函数要不就是可重入的,要不就是不会被信号 handler 中断的。
可以使用man 7 signal
命令查看哪些系统调用是异步信号安全的。常见的函数,譬如printf()
和exit()
就不是异步信号安全的,所以在信号 handler 可以使用write()
来替代printf()
,使用_exit()
来替代exit()
。具体可以这样做:
void sig_safe_error(const char *msg)
{
write(STDERR_FILENO, msg, strlen(msg));
_exit(1);
}
void sig_safe_print(const char *msg)
{
write(STDOUT_FILENO, msg, strlen(msg));
}
void sigint_handler(int sig)
{
sig_safe_error("receive signal SIGINT");
}
int main()
{
signal(SIGINT, sigint_handler);
// ...
}
在 Linux 中处理信号是极为麻烦的事情,正如 Linux 标准指出的,当select()
、poll()
和epoll_wait()
被信号中断之后,它们是决不会重启的,所以说如果这些函数被信号中断,我们只好手动重启它们:
while (true) {
int n = epoll_wait(/** ... **/);
if (n == -1 && errno == EINTR) {
continue;
} else {
// ...
}
}
所幸的是 Linux 提供了signalfd()
函数,signalfd()
可以将接收到的信号,转化为文件描述符的可读事件,所以signalfd()
可以和 select/poll/epoll 配合使用,大大简化信号处理的难度。
下面的例子将signalfd()
与 epoll 配合使用,signalfd()
负责将接收到的SIGINT
和SIGHUP
转换为文件描述符的可读事件:
#include
#include
#include
#include
#include
#include
#include
#include
int main()
{
// 屏蔽信号 SIGINT 和 SIGHUP
sigset_t mask;
sigemptyset(&mask);
sigaddset(&mask, SIGINT);
sigaddset(&mask, SIGHUP);
sigprocmask(SIG_BLOCK, &mask, NULL);
int signal_fd = signalfd(-1, &mask, SFD_NONBLOCK | SFD_CLOEXEC);
int epoll_fd = epoll_create1(EPOLL_CLOEXEC);
struct epoll_event event;
memset(&event, 0, sizeof(event));
event.events = EPOLLIN;
event.data.fd = signal_fd;
epoll_ctl(epoll_fd, EPOLL_CTL_ADD, signal_fd, &event);
const int MAX_EVENTS = 64;
struct epoll_event events[MAX_EVENTS];
while (true)
{
int n = epoll_wait(epoll_fd, &events[0], MAX_EVENTS, 0);
for (int i = 0; i < n; ++i)
{
if (events[i].data.fd == signal_fd)
{
struct signalfd_siginfo info;
ssize_t bytes = read(signal_fd, &info, sizeof(info));
assert(bytes == sizeof(info));
if (info.ssi_signo == SIGINT)
{
printf("receive signal SIGINT\n");
}
else if (info.ssi_signo == SIGHUP)
{
printf("receive signal SIGHUP\n");
}
printf("Program quit!\n");
return 0;
}
}
}
return 0;
}
通常来说,我们可以使用signal()
为信号注册一个 handler,然而在编写跨平台代码时,则不应该使用signal()
,因为signal()
在不同平台会表现出不一致的行为。譬如说,在某些 Uninx 系统中,signal()
会出现这样的行为:
signal()
会自动将信号的 handler 重置成SIG_DFL
。read()
和write()
这类调用,如果它们被信号 handler 中断,是不会自动重启的。 如果考虑编写跨平台代码,所以我们的程序中应该使用sigaction()
来代替signal()
。当然,sigaction()
的使用比较复杂,所以我们提供了一个Signal()
,可以用来代替signal()
函数:
typedef void (*sighandler_t)(int);
sighandler_t Signal(int signum, sighandler_t handler)
{
struct sigaction action, old_action;
action.sa_handler = handler;
sigemptyset(&action.sa_mask); // Block sigs of type being handled
action.sa_flags = SA_RESTART; // Restart syscalls if possible
if (sigaction(signum, &action, &old_action) < 0)
{
perror("sigaction");
exit(-1);
}
return (old_action.sa_handler);
}
转自:
http://senlinzhan.github.io/2017/03/02/linux-signal/