非阻塞式I/O

套接字的默认状态是阻塞的。可能阻塞套接字的调用可以分为下面4类:

  • 输入操作
    包括read, readv, recv, recvfrom和recvmsg共5个函数。
    如果某个进程对一个阻塞的TCP套接字调用这些函数,那么该套接字的接收缓冲区中没有数据可读,该进程将被投入睡眠,直到有一些数据达到。

    因为TCP是字节流协议,该进程的唤醒就是只要有一些数据到达,这些数据既可能是单个字节,也可以是一个完整的TCP分节中的数据。

    而对于UDP而言,因为UDP是数据报协议,直达有UDP数据报到达,进程才会被唤醒。

    所以对于非阻塞的套接字,如果输入操作不能被满足(对于TCP套接字即至少有一个字节的数据,UDP套接字即有一个完整的数据报可读),相应调用将立即返回一个EWOULDBLOCK错误。

  • 输出操作
    包括write, writev, send, sendto, sendmsg共5个函数。

    对于TCP套接字,内核将从应用进程的缓冲区到该套接字的发送缓冲区复制数据。对于阻塞的套接字,如果其发送缓冲区中没有空间,进程将被投入睡眠,直到有空间为止。对于一个非阻塞的TCP套接字,如果其发送缓冲区中没有空间,输出函数将立即返回一个EWOULDBLOCK错误。如果其发送缓冲区有一些空间,返回值将是内核能够复制到该缓冲区的字节数。这个字节数也称为不足计数。

    而对于UDP套接字,因为UDP套接字不存在真正的发送缓冲区,内核只是复制应用进程数据并把他们向下沿着协议栈传递,逐渐冠以UDP首部和IP首部。因此对于UDP套接字,输出函数不会因为TCP一样的原因而阻塞。但是可能会因为其他原因而阻塞。

  • 接受外来连接
    对于accept函数,如果对一个阻塞的套接字调用accept函数,并且尚无新的连接到达,调用进程将被投入睡眠。
    对于一个非阻塞的套接字调用accept函数,尚无新的连接到达,accept函数将立即返回一个EWOULDBLOCK错误。

    while(true)
    {
        int c_fd = accept(listen_fd, NULL, NULL);
        if (c_fd == -1)
        {
            if (errno != EWOULDBLOCK)   // 非阻塞accept的EWOULDBLOCK错误不处理
            {                               
                fprintf(stderr, "%s: %d: ", __FILE__, __LINE__); 
                perror("accept");
                break;             
            }                               
        }
    
        open_connection(c_fd);
    }
    
  • 发起外出连接
    对于connect函数。对于TCP套接字,connect函数一直要等到三路握手完成才返回,这意味着每个connect总会阻塞其调用进程至少一个到服务器的RTT时间。
    对于非阻塞的套接字调用connect,并且当连接不能立即建立(有些连接可以立即建立),那么连接的建立能照样发起(发送三路握手的第一个分组),不过会返回一个EINPROGRESS错误。

参考资料
《UNIX 网络编程》3th [美] W.Richard Stevens,Bill Fenner,Andrew M. Rudoff

你可能感兴趣的:(非阻塞式I/O)