在Linux中,进程信号是一种异步的事件通知机制,用于通知进程某个事件已经发生。它是进程间通信的一种方式,可以用来控制进程的行为。
当一个进程收到信号时,操作系统会中断该进程的正常控制流程,并执行相应的处理函数。进程收到信号后有三种处理方式:
忽略信号:进程可以选择忽略收到的信号,不进行任何操作。
执行默认处理函数:操作系统为每种信号都提供了默认的处理函数,进程收到信号后会自动执行默认处理函数。
自定义处理函数:进程可以注册自定义的处理函数来处理特定的信号,当收到该信号时,执行自定义的处理函数。
在Linux中,可以使用kill命令向进程发送信号。例如,使用kill -9命令可以向进程发送SIGKILL信号,强制结束进程。此外,还有其他一些信号可以用来控制进程的行为,例如SIGINT信号用于中断进程,SIGTERM信号用于请求进程正常退出等。
综上:信号是进程之间事件异步通知的一种方式,属于软中断。
在Linux中,可以通过终端按键产生信号。具体来说,用户在终端按下某些键时,终端驱动程序会发送信号给前台进程。常见的通过终端按键产生的信号包括:
SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump。
SIGINT:当用户按下Ctrl+C组合键时, 终端驱动程序会向前台进程发送SIGINT信号。默认情况下,SIGINT信号的处理动作是终止进程。
SIGQUIT:当用户按下Ctrl+\组合键时, 终端驱动程序会向前台进程发送SIGQUIT信号。默认情况下,SIGQUIT信号的处理动作是终止进程并且产生核心转储(Core Dump)。核心转储是将进程的用户空间内存数据全部保存到磁盘上,以供后续的调试和分析使用。
SIGTSTP:当用户按下Ctrl+Z组合键时, 终端驱动程序会向前台进程发送SIGTSTP信号。默认情况下,SIGTSTP信号的处理动作是停止进程的执行。
Core Dump
首先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部保存到磁盘上,文件名通常是core,这叫做CoreDump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug(事后调试)。一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。 首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K:$ulimit -c 1024
在Linux中,可以使用系统函数向进程发送信号。常用的系统函数包括:
kill命令是调用kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。raise函数可以给当前进程发送指定的信号(自己给自己发信号)。
kill():该函数用于向指定的进程发送信号。需要提供目标进程的进程ID(PID)和要发送的信号。如果进程ID为0,则表示向当前进程发送信号。
示例代码:
#include
#include
int main() {
int pid = 12345; // 目标进程的PID
int signal = SIGINT; // 要发送的信号
if (kill(pid, signal) == -1) {
perror("kill");
return 1;
}
printf("Signal sent to process %d\n", pid);
return 0;
}
raise():该函数用于向当前进程发送信号。需要提供要发送的信号。
示例代码:
#include
#include
int main() {
int signal = SIGINT; // 要发送的信号
if (raise(signal) == -1) {
perror("raise");
return 1;
}
printf("Signal sent to current process\n");
return 0;
}
SIGPIPE是一种由软件条件产生的信号,在“管道”中已经介绍过了。alarm函数 和SIGALRM信号也是由软件条件产生信号。
SIGPIPE是一种由软件条件产生的信号。 当进程在使用管道进行通信时,如果读端进程关闭了管道的读端,而写端进程还在向管道写入数据,那么写端进程就会收到SIGPIPE信号。收到SIGPIPE信号的进程可以选择忽略该信号,或者执行默认的终止操作。
SIGPIPE信号的产生通常是由于程序逻辑错误导致的,例如,在使用管道通信时没有正确地处理读端进程的关闭操作。为了避免SIGPIPE信号的产生,开发者需要确保在进程关闭读端之前,写端进程已经完成了数据的写入操作,或者采取其他措施来处理管道通信中的错误情况。
硬件异常产生信号是由硬件检测到异常情况并通知给操作系统的过程。 当程序执行了非法的操作,如除以0、访问无效的内存地址等,硬件会检测到这些异常并产生相应的信号。
在Linux中,硬件异常产生的信号主要包括:当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释 为SIGFPE信号发送给进程。再比如当前进程访问了非法内存地址,MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。
SIGFPE:浮点异常,当程序执行了浮点数异常操作时产生。例如,除以0或溢出。
SIGSEGV:段错误,当程序访问无效的内存地址时产生。例如,访问不属于自己进程的内存空间或未初始化的指针。
SIGBUS:总线错误,当程序访问总线错误时产生。这通常是由于硬件故障或内存问题引起的。
SIGILL:非法指令,当程序执行了非法的指令时产生。例如,尝试执行系统保留的特殊指令或未定义的指令。
综上:硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。
每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。 虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。 如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。
sigset_t
从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。
#include
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置位,表示 该信号集的有效信号包括系统支持的所有信号。
注意,在使用sigset_ t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种 信号,若包含则返回1,不包含则返回0,出错返回-1。
调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。
#include
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
//返回值:若成功则为0,若出错则为-1
如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则 更改进程的信号屏蔽字,参数how指示如何更改。 如果oset和set都是非空指针,则先将原来的信号 屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。 由于信号处理函数的代码是在用户空间的,处理过程比较复杂。
举例如下:用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。
#include
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);
sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回-1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体:
将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。sa_flags字段包含一些选项,这里都把sa_flags设为0,sa_sigaction是实时信号的处理函数。