《TCP IP网络编程》第十二章

第 12 章 I/O 复用

12.1 基于 I/O 复用的服务器端

多进程服务端的缺点和解决方法:

        为了构建并发服务器,只要有客户端连接请求就会创建新进程。这的确是实际操作中采用的一种方案,但并非十全十美,因为创建进程要付出很大的代价。这需要大量的运算和内存空间,由于每个进程都具有独立的内存空间,所以相互间的数据交换也要采用相对复杂的方法(IPC 属于相对复杂的通信方法)。

        I/O 复用技术可以解决这个问题。

理解复用:

        「复用」的含义:

为了提高物理设备的效率,只用最少的物理要素传递最多数据时使用的技术。

复用技术在服务器端的应用 :

        服务器端引入复用技术可以减少所需进程数。下图是多进程服务端的模型:

《TCP IP网络编程》第十二章_第1张图片

        下图是引入复用技术之后的模型: 

《TCP IP网络编程》第十二章_第2张图片

        从图上可以看出,引入复用技术之后,可以减少进程数。重要的是,无论连接多少客户端,提供服务的进程只有一个。         

12.2 理解 select 函数并实现服务端

        select 函数是最具代表性的实现复用服务器的方法。在 Windows 平台下也有同名函数,所以具有很好的移植性。

select 函数的功能和调用顺序:

        使用 select 函数时可以将多个文件描述符集中到一起统一监视,项目如下:

  • 是否存在套接字接收数据?
  • 无需阻塞传输数据的套接字有哪些?
  • 哪些套接字发生了异常?

术语:「事件」。当发生监视项对应情况时,称「发生了事件」。

        select 函数的使用方法与一般函数的区别很大,更准确的说,他很难使用。但是为了实现 I/O 复用服务器端,我们应该掌握 select 函数,并运用于套接字编程当中。认为「select 函数是 I/O 复用的全部内容」也并不为过。select 函数的调用过程如下图所示: 

《TCP IP网络编程》第十二章_第3张图片

设置文件描述符 :

        利用 select 函数可以同时监视多个文件描述符。当然,监视文件描述符可以视为监视套接字。此时首先需要将要监视的文件描述符集中在一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述 3 种监视项分成 3 类。

        利用 fd_set 数组变量执行此操作,如图所示,该数组是存有0和1的位数组。

《TCP IP网络编程》第十二章_第4张图片

        图中最左端的位表示文件描述符 0(所在位置)。如果该位设置为 1,则表示该文件描述符是监视对象。那么图中哪些文件描述符是监视对象呢?很明显,是描述符 1 和 3。在 fd_set 变量中注册或更改值的操作都由下列宏完成。

  • FD_ZERO(fd_set *fdset):将 fd_set 变量所指的位全部初始化成0
  • FD_SET(int fd,fd_set *fdset):在参数 fdset 指向的变量中注册文件描述符 fd 的信息
  • FD_CLR(int fd,fd_set *fdset):从参数 fdset 指向的变量中清除文件描述符 fd 的信息
  • FD_ISSET(int fd,fd_set *fdset):若参数 fdset 指向的变量中包含文件描述符 fd 的信息,则返回「真」

        上述函数中,FD_ISSET 用于验证 select 函数的调用结果,通过下图解释这些函数的功能:

 《TCP IP网络编程》第十二章_第5张图片

设置检查(监视)范围及超时 :

        下面是 select 函数的定义:

#include 
#include 

int select(int maxfd, fd_set *readset, fd_set *writeset,
           fd_set *exceptset, const struct timeval *timeout);
/*
成功时返回大于 0 的值,失败时返回 -1
maxfd: 监视对象文件描述符数量
readset: 将所有关注「是否存在待读取数据」的文件描述符注册到 fd_set 型变量,并传递其地址值。
writeset: 将所有关注「是否可传输无阻塞数据」的文件描述符注册到 fd_set 型变量,并传递其地址值。
exceptset: 将所有关注「是否发生异常」的文件描述符注册到 fd_set 型变量,并传递其地址值。
timeout: 调用 select 函数后,为防止陷入无限阻塞的状态,传递超时(time-out)信息
返回值: 发生错误时返回 -1,超时时返回0,。因发生关注的时间返回时,返回大于0的值,该值是发生事件的文件描述符数。
*/

        如上所述,select 函数用来验证 3 种监视的变化情况,根据监视项声明 3 个 fd_set 型变量,分别向其注册文件描述符信息,并把变量的地址值传递到上述函数的第二到第四个参数。但在此之前(调用 select 函数之前)需要决定下面两件事:

  1. 文件描述符的监视(检查)范围是?
  2. 如何设定 select 函数的超时时间?

        第一,文件描述符的监视范围和 select 的第一个参数有关。实际上,select 函数要求通过第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在 fd_set 变量中的文件描述符数。但每次新建文件描述符时,其值就会增加 1 ,故只需将最大的文件描述符值加 1 再传递给 select 函数即可。加 1 是因为文件描述符的值是从 0 开始的。

        第二,select 函数的超时时间与 select 函数的最后一个参数有关,其中 timeval 结构体定义如下:

struct timeval
{
    long tv_sec;
    long tv_usec;
};

        本来 select 函数只有在监视文件描述符发生变化时才返回。如果未发生变化,就会进入阻塞状态。指定超时时间就是为了防止这种情况的发生。通过上述结构体变量,将秒数填入 tv_sec 的成员,将微妙数填入 tv_usec 的成员,然后将结构体的地址值传递到 select 函数的最后一个参数。此时,即使文件描述符未发生变化,只要过了指定时间,也可以从函数中返回。不过这种情况下, select 函数返回 0 。因此,可以通过返回值了解原因。如果不想设置超时,则传递 NULL 参数。

调用 select 函数查看结果:

        select 返回正整数时,怎样获知哪些文件描述符发生了变化?向 select 函数的第二到第四个参数传递的 fd_set 变量中将产生如图所示的变化:

《TCP IP网络编程》第十二章_第6张图片

        由图可知,select 函数调用完成后,向其传递的 fd_set 变量将发生变化。原来为 1 的所有位将变成 0,但是发生了变化的文件描述符除外。因此,可以认为值仍为 1 的位置上的文件描述符发生了变化。 

select 函数调用示例:

#include 
#include 
#include 
#include 
#define BUF_SIZE 30

int main(int argc, char *argv[])
{
    fd_set reads, temps;
    int result, str_len;
    char buf[BUF_SIZE];
    struct timeval timeout;

    FD_ZERO(&reads);   // 初始化变量,清空读取文件描述符集合
    FD_SET(0, &reads); // 将标准输入文件描述符0添加到读取文件描述符集合中,用于后续监视输入

    /*
    timeout.tv_sec=5;
    timeout.tv_usec=5000;
    */

    while (1)
    {
        temps = reads; // 为了防止调用select函数后,位的内容改变,先提前存一下当前的读取文件描述符集合
        timeout.tv_sec = 5; // 设置超时时间为5秒
        timeout.tv_usec = 0;

        // 调用select函数来等待文件描述符的变化
        // 参数1:要监视的文件描述符的最大值加1
        // 参数2:读取文件描述符集合的指针,用于监视其中文件描述符的变化
        // 参数3:写文件描述符集合的指针,这里传递0表示不监视写事件
        // 参数4:异常文件描述符集合的指针,这里传递0表示不监视异常事件
        // 参数5:超时时间,如果在指定时间内没有任何文件描述符的变化,select会返回
        result = select(1, &temps, 0, 0, &timeout);

        if (result == -1)
        {
            puts("select error!"); // 如果select返回-1,表示发生错误
            break;
        }
        else if (result == 0)
        {
            puts("Time-out!"); // 如果select返回0,表示超时,即在指定时间内没有输入
        }
        else
        {
            if (FD_ISSET(0, &temps)) // 验证发生变化的值是否是标准输入端(文件描述符0)
            {
                str_len = read(0, buf, BUF_SIZE); // 从标准输入中读取数据
                buf[str_len] = 0; // 在数据末尾添加null终止符,将字符数组转换成字符串
                printf("message from console: %s", buf); // 将用户输入的数据打印出来
            }
        }
    }
    return 0;
}

运行结果:

《TCP IP网络编程》第十二章_第7张图片

         可以看出,如果运行后在标准输入流输入数据,就会在标准输出流输出数据,但是如果 5 秒没有输入数据,就提示超时。

实现 I/O 复用服务器端:

        下面通过 select 函数实现 I/O 复用服务器端。下面是基于 I/O 复用的回声服务器端:

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

#define BUF_SIZE 100

// 错误处理函数声明
void error_handling(char *message);

int main(int argc, char *argv[])
{
    int serv_sock, clnt_sock;
    struct sockaddr_in serv_adr, clnt_adr;
    struct timeval timeout;
    fd_set reads, cpy_reads;

    socklen_t adr_sz;
    int fd_max, str_len, fd_num, i;
    char buf[BUF_SIZE];

    // 检查命令行参数是否正确,确保传入端口号
    if (argc != 2)
    {
        printf("Usage : %s \n", argv[0]);
        exit(1);
    }

    // 创建服务器套接字
    serv_sock = socket(PF_INET, SOCK_STREAM, 0);

    // 初始化服务器地址结构
    memset(&serv_adr, 0, sizeof(serv_adr));
    serv_adr.sin_family = AF_INET;
    serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
    serv_adr.sin_port = htons(atoi(argv[1]));

    // 绑定服务器套接字到指定端口
    if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)
        error_handling("bind() error");

    // 开始监听连接请求
    if (listen(serv_sock, 5) == -1)
        error_handling("listen() error");

    // 初始化文件描述符集合,并将服务器套接字添加到集合中
    FD_ZERO(&reads);
    FD_SET(serv_sock, &reads); // 注册服务端套接字
    fd_max = serv_sock; // 初始时,最大文件描述符为服务器套接字

    while (1)
    {
        cpy_reads = reads; // 复制原始的文件描述符集合,因为select会修改它

        // 设置超时时间为5秒 5000微秒
        timeout.tv_sec = 5;
        timeout.tv_usec = 5000;

        // 调用select函数开始监视文件描述符的变化
        fd_num = select(fd_max + 1, &cpy_reads, 0, 0, &timeout);

        // 如果select函数返回-1,表示发生错误,跳出循环
        if (fd_num == -1)
            break;

        // 如果select函数返回0,表示超时,即在指定时间内没有任何文件描述符的变化,继续下一次循环
        if (fd_num == 0)
            continue;

        // 遍历文件描述符集合,查找发生变化的文件描述符
        for (i = 0; i < fd_max + 1; i++)
        {
            // 如果文件描述符i在cpy_reads集合中发生变化
            if (FD_ISSET(i, &cpy_reads))
            {
                // 如果是服务器套接字,表示有新的客户端连接请求
                if (i == serv_sock)
                {
                    adr_sz = sizeof(clnt_adr);
                    clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &adr_sz);

                    // 注册新的客户端套接字
                    FD_SET(clnt_sock, &reads);
                    // 更新最大文件描述符的值,以确保下一次select正确工作
                    if (fd_max < clnt_sock)
                        fd_max = clnt_sock;

                    printf("Connected client: %d \n", clnt_sock);
                }
                else // 不是服务器套接字,即客户端套接字有数据到达
                {
                    // 从客户端套接字i读取数据
                    str_len = read(i, buf, BUF_SIZE);
                    // 如果读取到的数据长度为0,表示客户端关闭连接
                    if (str_len == 0)
                    {
                        // 从文件描述符集合中移除该套接字,并关闭连接
                        FD_CLR(i, &reads);
                        close(i);
                        printf("Closed client: %d \n", i);
                    }
                    else
                    {
                        // 将读取到的数据回传给客户端
                        write(i, buf, str_len);
                    }
                }
            }
        }
    }

    // 关闭服务器套接字
    close(serv_sock);
    return 0;
}

// 错误处理函数的定义
void error_handling(char *message)
{
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

        配合客户端运行结果:

《TCP IP网络编程》第十二章_第8张图片

         从图上可以看出,虽然只用了一个进程,但是却实现了可以和多个客户端进行通信,这都是利用了 select 的特点。


习题:

1、请解释复用技术的通用含义,并说明何为 I/O 复用。

        复用技术的通用含义是指在某种情况下,利用一种机制或方法同时处理多个任务或请求,从而提高系统的效率和资源利用率。这种技术允许一个进程或线程同时监视多个事件,并在事件发生时进行相应的处理,而不需要为每个事件创建单独的处理线程或进程。

        I/O复用是一种特定的复用技术,用于处理输入/输出(I/O)操作。在传统的阻塞I/O中,一个进程在执行I/O操作时会被阻塞,直到操作完成才能继续执行。这意味着一个进程在处理一个I/O操作时会停止响应其他的请求。而I/O复用允许一个进程同时监视多个I/O事件,比如监视多个文件描述符是否有数据可读或可写,或者监视多个套接字是否有连接请求。当有一个或多个I/O事件就绪时,进程可以立即进行相应的处理,而不会被阻塞。

2、多进程并发服务器的缺点有哪些?如何在 I/O 复用服务器中弥补?

        多进程需要进行大量的运算和大量的内存空间。在 I/O 复用服务器中通过 select 函数监视文件描述符,通过判断变化的文件描述符,来得知变化的套接字是哪个,从而实时应答来自多个客户端的请求。

3、select 函数的观察对象中应包含服务端套接字(监听套接字),那么应将其包含到哪一类监听对象集合?请说明原因

        应该包含到「是否存在待读取数据」。因为服务端套接字主要用于监听新的客户端连接请求,而监听新的连接请求本质上是一个读取事件。

你可能感兴趣的:(《TCPIP网络编程》,网络,tcp/ip,服务器,网络编程,linux)