【原创】SIGPIPE 信号处理整理


最近又遇到 SIGPIPE 问题,虽然这个问题是经典的老生常谈,但发现还是有些东西需要明确一下的。

如何处理 SIGPIPE 信号问题?应该在库里处理,还是在可执行程序里处理?

常见代码片段
// 写法一(简单粗暴,不判断出错情况)
#if defined(SIGPIPE) && !defined(_WIN32)
    (void) signal(SIGPIPE, SIG_IGN);
#endif

// 写法二(判断返回值情况)
#ifndef WIN32
    if (signal(SIGPIPE, SIG_IGN) == SIG_ERR)
        return 1;
#endif

// 写法三(使用 sigaction 替代 signal ,可以避免传统 signal 系统调用的问题)
    struct sigaction sa;
    sa.sa_handler = SIG_IGN;
    sigemptyset(&sa.sa_mask);
    sa.sa_flags = 0;
    if (sigaction(SIGPIPE, &sa, NULL) < 0)
    {
        perror("cannot ignore SIGPIPE");
        return -1;
    }

// 写法四(仅在 IOS 系统上支持 SO_NOSIGPIPE)
#if defined(SO_NOSIGPIPE) && !defined(MSG_NOSIGNAL)
    // We do not want SIGPIPE if writing to socket.
    const int value = 1;
    setsockopt(fd, SOL_SOCKET, SO_NOSIGPIPE, &value, sizeof(int));
#endif
注:关于传统 signal 系统调用的问题,可以参考《 Linux signal那些事儿

产生 SIGPIPE 的条件
      对一个已经收到 FIN 包的 socket 调用 read 方法,如果接收缓冲已空,则返回 0,这就是常说的“连接关闭”表示。
      对一个已经收到 FIN 包的 socket 第一次调用 write 方法时,如果发送缓冲没问题,则 write 调用会返回写入的数据量,同时进行数据发送。但是发送出去的报文会导致对端发回 RST 报文。因为对端的 socket 已经调用了 close 进行了完全关闭,已经处于既不发送,也不接收数据的状态。所以第二次调用 write 方法时(假设在收到 RST 之后)会生成 SIGPIPE 信号,导致进程退出(这就是为什么第二次 write 才能触发 SIGPIPE 的原因)。


民间描述:  
对一个对端已经关闭的 socket 调用两次 write,第二次 write 将会生成 SIGPIPE 信号,该信号默认结束进程。  

APUE 上的描述:  
如果在写到管道时读进程已经终止,则产生此信号(管道角度)。当类型为 SOCK_STREAM 的套接字已不再连接时,进程写到该套接字也产生此信号(socket 角度)。

SIGPIPE 的处理方式
为了避免进程退出,既可以对 SIGPIPE 信号进行捕获,也可以将其忽略,即为其设置 SIG_IGN 信号处理函数(在系统头文件 <signal.h> 中定义的常量):
signal(SIGPIPE, SIG_IGN);
这样,当第二次调用 write 方法时,会返回 -1,同时 errno 会被设置成 EPIPE ,程序便能知道对端已经关闭。

-=-=-=-
关于 signal() 函数的说明:
  • signal 函数由 ISO C 定义。因为 ISO C 不涉及多进程,进程组以及终端 I/O 等,所以它对信号的定义非常含糊,以至于对 UNIX 系统而言几乎毫无用处。
  • 因为 signal 的语义与系统实现有关,所以最好使用 sigaction 函数代替 signal 函数。
  • signal 函数的限制:不改变信号的处理方式,就不能确定信号的当前处理方式(因为需要通过 signal 函数的返回值来确定以前的处理配置);sigaction 函数则没有这个问题。
  • 基于 signal 函数实现的信号处理可能是不可靠的(在早期的 UNIX 版本中,进程每次接到信号进行处理时,(内核已经在投递前)将该信号的动作复位为默认值 SIG_DFL,所以从信号发生之后到在信号处理程序中再次调用 signal 函数之前这段时间中有一个时间窗口。若在这个窗口中再发生一次该信号,则会导致执行该信号的默认动作,可能导致进程的终止)
-=-=-=-

另外,还有其他方法来处理 SIGPIPE 信号:
设置 socket 在进行写操作时不产生 SIGPIPE 信号
int set = 1;
setsockopt(sd, SOL_SOCKET, SO_NOSIGPIPE, (void*)&set, sizeof(int));
这样做的好处在于:在某些情况 下我们并不需要一个全局的 SIGPIPE handler 。但是 SO_NOSIGPIPE 不具有可移植性,后续有说明。

-=-=-=-

查阅资料后找到了两个方法:
  • 使用 signal(SIGPIPE, SIG_IGN) 忽略 SIGPIPE 。经实验在 ios7 模拟器上虽然 xcode 还是会捕获 SIGPIPE,但是程序不会崩溃,继续后可以执行。但是在真机上依然会崩溃。
  • 使用 SO_NOSIGPIPE 。经实验在多个 ios 版本下都不再触发 SIGPIPE,完美解决问题。
SO_NOSIGPIPE 在 mac 中存在,可惜在 android 中不存在。请使用 MSG_NOSIGNAL 来代替
#if defined(__ANDROID__)
    #define SO_NOSIGPIPE MSG_NOSIGNAL
#endif

在我的系统上
[root@YOYO ~]# uname -a
Linux YOYO 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux
[root@YOYO ~]# 
[root@YOYO ~]# cat /etc/issue
CentOS release 6.4 (Final)
查看 man 手册,可以看到
[root@Betty ~]# man 2 send
...
       #include <sys/types.h>
       #include <sys/socket.h>

       ssize_t send(int sockfd, const void *buf, size_t len, int flags);
...
       MSG_NOSIGNAL (since Linux 2.2)
              Requests not to send SIGPIPE on errors on stream oriented sockets when the other end breaks the connection.  The EPIPE error is still returned.
              自从 Linux 2.2 开始提供对 MSG_NOSIGNAL 的支持。若设置该 flag 则 socket 远端读被关闭时,内核也不会发送 SIGPIPE 信号给当前进程。设置后,仍然可以得到 EPIPE 错误码。
...
       EPIPE  The local end has been shut down on a connection oriented socket.  In this case the process will also receive a SIGPIPE unless MSG_NOSIGNAL is set.
              面向连接的 socket 的本地端由于 “Broken Pipe” 关闭时,产生该错误码。该这种情况,如果进程没有设置 MSG_NOSIGNAL 则还会收到 SIGPIPE 信号。
...
====

一下内容取自 glib-2.35.4
 * @G_FILE_ERROR_PIPE: Broken pipe; there is no process reading from the
 *     other end of a pipe. Every library function that returns this
 *     error code also generates a `SIGPIPE' signal; this signal
 *     terminates the program if not handled or blocked. Thus, your
 *     program will never actually see this code unless it has handled
 *     or blocked `SIGPIPE'.
 *     Broken pipe 表明已经没有进程在 pipe 的远端进行读动作。
 *     每一个库函数都会返回 EPIPE 错误码,且同时产生一个 SIGPIPE 信号;
 *     该信号会终止当前程序,若当前程序没有针对该信号进行处理或者阻塞。
 *     所以,如果你的层序没有针对 SIGPIPE 进行处理或者阻塞动作,那么你的程序
 *     将永远看不到错误码 EPIPE (因为 SIGPIPE 默认会导致程序终止)。
...

#ifdef SIGPIPE
  /* There is no portable, thread-safe way to avoid having the process
   * be killed by SIGPIPE when calling send() or sendmsg(), so we are
   * forced to simply ignore the signal process-wide.
   * 当调用 send() 和 sendmsg() 时,不存在可移植,且线程安全的方式来避免进程
   * 被信号 SIGPIPE 杀掉,所以我们强制要求在系统范围内忽略简单的忽略该信号
   */
  signal (SIGPIPE, SIG_IGN);
#endif
...
/* Although we ignore SIGPIPE, gdb will still stop if the app receives
 * one, which can be confusing and annoying. So if possible, we want
 * to suppress the signal entirely.
 * 即使设置了忽略 SIGPIPE 信号,但是 gdb 仍旧会在 app 接收到该信号的时候停止
 * 而这将对调试产生困扰。所以如果可能,最好将该信号完全抹除
 */
#ifdef MSG_NOSIGNAL
#define G_SOCKET_DEFAULT_SEND_FLAGS MSG_NOSIGNAL
#else
#define G_SOCKET_DEFAULT_SEND_FLAGS 0
#endif

下面是 stackoverflow 上的一篇关于 SIGPIPE 的讨论:
http://stackoverflow.com/questions/108183/how-to-prevent-sigpipes-or-handle-them-properly



你可能感兴趣的:(SIGPIPE)