【Linux后端开发】poll/epoll多路转接IO服务器

目录

一、poll原理

二、poll实现多路转接IO服务器

三、epoll函数接口

四、epoll的工作原理

五、epoll实现多路转接IO服务器


一、poll原理

poll函数接口

#include 
int poll(struct pollfd *fds, nfds_t nfds, int timeout);

// pollfd结构
struct pollfd 
{
    int fd;         /* file descriptor */
    short events;   /* requested events */
    short revents;  /* returned events */
}
  • fds是一个poll函数监听的结构列表,每一个元素,包含了三部分内容:文件描述符、监听事件的集合、返回的事件集合
  • nfds表示fds数组的长度
  • timeout表示poll函数的超时时间,单位是毫秒:①timeout > 0 ,timeout时间以内阻塞等待,否则非阻塞返回一次;②timeout == 0,非阻塞等待;③timeout < 0,阻塞等待
events和revents的取值
事件 描述 是否可作为输入 是否可作为输出
POLLIN 数据(普通数据、优先数据)可读
POLLRDNORM 普通数据可读
POLLRDBAND 优先级带数据可读(Linux不支持)
POLLPRI 高优先级数据可读,如TCP带外数据
POLLOUT 数据(普通数据、优先数据)可写  是
POLLWRNORM 普通数据可写
POLLWRBAND 优先级带数据可写
POLLRDHUP TCP连续被对方关闭或对方关闭了写操作,它由GNU引入
POLLERR 错误
POLLHUP 挂起。比如通道的写端被关闭后,读端描述符上将收到POLLHUP事件
POLLVNAL 文件描述符没有打开
  • 返回值小于0,表示出错
  • 返回值等于0,表示poll函数等待超时
  • 返回值大于0,表示poll用于监听的文件描述符就绪而返回

poll的优点

poll多路转接的提出是为了解决select存在的部分缺陷,不同于select使用三个位图结构来表示三个fd_set的方式,poll使用一个pollfd的指针实现:

  • pollfd结构包含了要监视的event和发生的event,不再使用select“参数-值”传递的方式,接口使用比select方便,不需要每次调用都重新设置需要关心的fd
  • events参数:用户告诉内核你需要帮我监视哪些fd
  • revents参数:内核告诉用户哪些正在监视的fd已经就绪了
  • poll并没有最大数量限制(但是最大数量限制是由系统能接受的最大数量决定,监视的fd数量过大时性能也会下降)

poll的缺点

poll中监听的文件描述符增多时:

  • 和select一样,poll返回后,需要轮询所有pollfd来获取就绪的描述符
  • 每次调用poll都需要把大把的pollfd结构从用户态拷贝到内核中
  • 同时连接的大量客户端在一时刻可能只有很少的处于就绪状态,因此随着监听的文件描述符数量的增长,其效率也会线性下降

二、poll实现多路转接IO服务器

Log.hpp、Sock.hpp、main.cc与select中的多路转接是一样的:【Linux后端服务器开发】select多路转接IO服务器_命运on-9的博客-CSDN博客

PollServer.hpp

#pragma once

#include 
#include 
#include 
#include 

#include "Sock.hpp"

using namespace std;

static const int g_defaultport = 8080;
static const int g_num = 2024;
static const int g_defaultfd = -1;

using func_t = function;

class PollServer
{
public:
    PollServer(func_t f, int port = g_defaultport)
        : _func(f), _port(port), _listensock(-1), _rfds(nullptr)
    {}

    void Init()
    {
        _listensock = Sock::Socket();
        Sock::Bind(_listensock, _port);
        Sock::Listen(_listensock);

        _rfds = new struct pollfd[g_num];
        for (int i = 0; i < g_num; ++i)
            Reset_Item(i);
        _rfds[0].fd = _listensock;
        _rfds[0].events = POLLIN;
    }

    void Reset_Item(int i)
    {
        _rfds[i].fd = g_defaultfd;
        _rfds[i].events = 0;
        _rfds[i].revents = 0;
    }

    void Print_Rfds()
    {
        cout << "rfd list: ";
        for (int i = 0; i < g_num; ++i)
            if (_rfds[i].fd != g_defaultfd)
                cout << _rfds[i].fd << " ";
        cout << endl;
    }

    void Accepter(int listensock)
    {
        Log_Message(DEBUG, "Accepter in");

        string clientip;
        uint16_t clientport = 0;
        int sock = Sock::Accept(listensock, &clientip, &clientport);
        if (sock < 0)
            return;
        Log_Message(NORMAL, "accept success [%s: %d]", clientip.c_str(), clientport);

        int i = 0;
        for (; i < g_num; ++i)
        {
            if (_rfds[i].fd != g_defaultfd)
                continue;
            else
                break;
        }
        if (i == g_num)
        {
            Log_Message(WARNING, "server is full, please wait");
            close(sock);
        }
        else
        {
            _rfds[i].fd = sock;
            _rfds[i].events = POLLIN;
            _rfds[i].revents = 0;
        }

        Print_Rfds();
        Log_Message(DEBUG, "Accepter out");
    }

    void Recver(int pos)
    {
        Log_Message(DEBUG, "in Recver");

        // 1. 读取request
        char buffer[1024];
        ssize_t s = recv(_rfds[pos].fd, buffer, sizeof(buffer) - 1, 0);
        if (s > 0)
        {
            buffer[s] = 0;
            Log_Message(NORMAL, "client# %s", buffer);
        }
        else if (s == 0)
        {
            close(_rfds[pos].fd);
            Reset_Item(pos);
            Log_Message(NORMAL, "client quit");
            return;
        }
        else
        {
            close(_rfds[pos].fd);
            Reset_Item(pos);
            Log_Message(ERROR, "client quit: %s", strerror(errno));
            return;
        }

        // 2. 处理request
        string response = _func(buffer);

        // 3. 返回response
        write(_rfds[pos].fd, response.c_str(), response.size());

        Log_Message(DEBUG, "out Recver");
    }

    void Handler_Read_Event()
    {
        for (int i = 0; i < g_num; ++i)
        {
            // 过滤掉非法的fd
            if (_rfds[i].fd == g_defaultfd)
                continue;
            if (!(_rfds[i].events & POLLIN))
                continue;

            if (_rfds[i].fd == _listensock && (_rfds[i].revents & POLLIN))
                Accepter(_listensock);
            else if (_rfds[i].revents & POLLIN)
                Recver(i);
        }
    }

    void Start()
    {
        int timeout = -1;
        while (1)
        {
            int n = poll(_rfds, g_num, timeout);
            switch (n)
            {
            case 0:
                Log_Message(NORMAL, "timeout ...");
                break;
            case -1:
                Log_Message(WARNING, "poll error, code:%d, err string: %s", errno, strerror(errno));
                break;
            default:
                Log_Message(NORMAL, "have event ready!");
                Handler_Read_Event();
                break;
            }
        }
    }

    ~PollServer()
    {
        if (_listensock < 0)
            close(_listensock);
        if (_rfds)
            delete[] _rfds;
    }

private:
    int _port;
    int _listensock;
    struct pollfd* _rfds;
    func_t _func;
};

三、epoll函数接口

epoll的官方说法是为了处理大批量句柄而做了改进的poll,但是在底层原理的设计上,epoll与poll有着天差地别的区别(老婆与老婆饼的关系),epoll的设计远远优于poll。

它是在2.5.44内核中被引进的(epoll(4) is a new API introduced in Linux kernel 2.5.44),几乎弥补了前两种多路转接接口(select、poll)的所有缺陷,被公认为Linux2.6之后性能最好的多路I/O就绪通知方法。

epoll_create

int epoll_create(int size);

创建一个epoll模型,自从2.6.8之后size参数是被忽略的,用完之后必须调用close关闭。

epoll_ctl

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

epoll的事件注册函数,它不同于select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。

第一个参数是epoll_create()的返回值(epoll模型),第二个参数表示动作(用三个宏表示),第三个参数是需要监听的fd,第四个参数是告诉内核需要监听什么事。

第二个参数的取值:①EPOLL_CTL_ADD,注册新的fd到epfd中;②EPOLL_CTL_MOD,修改已经注册的fd监听事件;③EPOLL_CTL_DEL,从epfd中删除一个fd。

epoll_wait

int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

收集在epoll监听的事件中已经发生的事件:

  • 参数events是分配好的epoll_event结构体
  • epoll将会把发生的事件赋值到events数组中(events不可以是空指针,内核只负责把数据复制到这个events数组中,不会去帮助我们在用户态中分配内存)
  • maxevents参数是告知内核这个events多大,这个maxevents的值不能大于创建的epoll_create()时的size
  • 参数timeout是超时时间(ms,0会立即返回,-1是阻塞等待)
  • 如果函数调用成功,返回I/O已经准备好的文件描述符数目,如返回0表示已超时,返回值小于0表示报错

struct epoll_event结构

typedef union epoll_data
{
  void *ptr;
  int fd;
  uint32_t u32;
  uint64_t u64;
} epoll_data_t;

struct epoll_event
{
  uint32_t events;	    /* Epoll events */
  epoll_data_t data;	/* User data variable */
} __EPOLL_PACKED;

events可以是以下几个宏的集合:

  • EPOLLIN:表示对应的文件描述符可以读(包括对端socket的正常关闭)
  • EPOLLOUT:表示对应的文件描述符可以写
  • EPOLLPRI:表示对应的文件描述符有紧急的数据可读(表示有外带数据到来)
  • EPOLLERR:表示对应的文件描述符发生错误
  • EPOLLHUP:表示对应的文件描述符被挂掉
  • EPOLLET:将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的
  • EPOLLONESHOP:只监听一次事件,当监听完这次事件后,如果如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里

四、epoll的工作原理

【Linux后端开发】poll/epoll多路转接IO服务器_第1张图片

  1. 通过epoll_create()创建epoll模型
  2. 通过epoll_ctl()将需要监视的文件描述符告诉OS,由OS维护红黑树进行监视
  3. 当数据从硬件层传入网卡驱动再写入操作系统中监视的文件缓冲区,会通过每个文件的回调机制将受监视的fd节点传入就绪队列中
  4. 上层直接对就绪队列进行事件处理,而不用对所有监视进行遍历

什么是事件就绪?底层的IO条件满足了,可以进行某种IO行为了,即事件就绪。

select / poll / epoll  ---->   IO事件的通知机制(等)

事件的通知有什么策略呢?LT工作模式和ET工作模式

关于事件的通知,这里有一个取快递的示例:

假设你网购了一些东西,快递到了,这时快递员张三就把快递送到你家楼下,打电话通知你让你下去取快递,你不下去他就一直给你打,直到你去将你的所有快递取完了他才离开。

之后你又网购了一些东西,快递到了,这时换了一个快递员变成李四了,他也将快递送到了你家楼下,但是他不会一直给你打电话,只要你接了电话他就离开了,也不管你有没有下来取快递。

这两种不同的通知策略,对应的就是LT水平触发模式和ET边缘触发模式,张三是LT,李四是ET。

epoll如何进行事件通知呢?通过文件的回调机制将红黑树中的就绪节点添加到就绪队列中

  • LT水平触发:只要就绪队列中的数据没有处理完,epoll就会一直通知用户
  • ET边缘触发:只要epoll将数据放入就绪队列里了,无论用户有没有将就绪队列里的数据读完,epoll就不再通知用户,除非底层的数据变化(数据增多),才会再次进行通知

epoll默认的是LT工作模式,我们也可以设置events将其改为ET模式。

为什么ET模式必须是非阻塞读取呢?

ET模式   --->   底层只有数据从无到有、从有到多变化的时候,才会进行通知上层   --->   只会通知一次   --->   倒逼程序员将本轮就绪的数据全部读取完   --->   你怎么知道你把就绪的数据全部读取完毕了呢?循环读取,直到读取不到数据了   --->   一般的fd,是阻塞式读取,但是ET模式下,必须是非阻塞读取,防止最后一次因读取不到数据而阻塞

为什么ET模式更高效?因为ET高效不仅体现在通知机制上,还会倒逼程序一次把就绪数据读取完,TCP通信时让接收方可以给发送方提供一个更大的窗口大小,即让对端更新出一个更大的滑动窗口,提高网络通信的数据吞吐量。

所以TCP中PSH标志的作用?让底层就绪事件,再次通知给上层。

五、epoll实现多路转接IO服务器

Log.hpp、Sock.hpp、main.cc与poll版本的一样

EpollServer.hpp

#pragma once

#include 
#include 
#include 
#include 
#include 

#include "Sock.hpp"

using namespace std;

static const int g_defaultport = 8080;
static const int g_size = 2024;
static const int g_defaultvalue = -1;
static const int g_defaultnum = 64;

using func_t = function;

class EpollServer
{
public:
    EpollServer(func_t f, uint16_t port = g_defaultport, int num = g_defaultnum)
        : _func(f), _num(num), _revs(nullptr), _port(port), _listensock(g_defaultvalue), _epfd(g_defaultvalue)
    {}

    void Init()
    {
        // 1. 创建socket
        _listensock = Sock::Socket();
        Sock::Bind(_listensock, _port);
        Sock::Listen(_listensock);

        // 2. 创建epoll模型
        _epfd = epoll_create(g_size);
        if (_epfd < 0)
        {
            Log_Message(FATAL, "epoll create error: %s", strerror(errno));
            exit(EPOLL_CREATE_ERR);
        }

        // 3. 添加listensock到epoll中
        struct epoll_event ev;
        ev.events = EPOLLIN;
        ev.data.fd = _listensock;
        epoll_ctl(_epfd, EPOLL_CTL_ADD, _listensock, &ev);

        // 4. 申请就绪事件的空间
        _revs = new struct epoll_event[_num];

        Log_Message(NORMAL, "init server success");
    }

    void Handler_Event(int ready_num)
    {
        Log_Message(DEBUG, "Handler_Event in");

        // 遍历就绪队列
        for (int i = 0; i < ready_num; ++i)
        {
            uint32_t events = _revs[i].events;
            int sock = _revs[i].data.fd;

            if (sock == _listensock && (events & EPOLLIN))
            {
                // _listensock事件就绪,建立新连接
                string clientip;
                uint16_t clientport;
                int fd = Sock::Accept(sock, &clientip, &clientport);
                if (fd < 0)
                {
                    Log_Message(WARNING, "accept error");
                    continue;
                }

                // 获取fd成功,可以直接读取吗?不可以,放入epoll
                struct epoll_event ev;
                ev.events = EPOLLIN;
                ev.data.fd = fd;
                epoll_ctl(_epfd, EPOLL_CTL_ADD, fd, &ev);
            }
            else if (events & EPOLLIN)
            {
                // 普通事件就绪
                char buffer[1024];
                int n = recv(sock, buffer, sizeof(buffer), 0);
                if (n > 0)
                {
                    buffer[n] = 0;
                    Log_Message(NORMAL, "client say# %s", buffer);

                    // TODO
                    string response = response = _func(buffer);
                    send(sock, response.c_str(), response.size(), 0);
                }
                else if (n == 0)
                {
                    // 先从epoll移除,再close fd
                    epoll_ctl(_epfd, EPOLL_CTL_DEL, sock, nullptr);
                    close(sock);
                    Log_Message(NORMAL, "client quit");
                }
                else
                {
                    epoll_ctl(_epfd, EPOLL_CTL_DEL, sock, nullptr);
                    close(sock);
                    Log_Message(ERROR, "recv error, code: %d, errstring: %s", errno, strerror(errno));
                }
            }
        }

        Log_Message(DEBUG, "Handler_Event out");
    }

    void Start()
    {
        int timeout = -1;
        while (1)
        {
            int n = epoll_wait(_epfd, _revs, _num, timeout);
            switch (n)
            {
            case 0:
                Log_Message(NORMAL, "timeout ...");
                break;
            case -1:
                Log_Message(WARNING, "epoll_wait failed, code: %d, err string: %s", errno, strerror(errno));
                break;
            default:
                Log_Message(NORMAL, "have event ready");
                Handler_Event(n);
                break;
            }
        }
    }

private:
    uint16_t _port;
    int _listensock;
    int _epfd;                      // epoll模型
    struct epoll_event* _revs;      // 就绪队列
    int _num;
    func_t _func;
};

你可能感兴趣的:(Linux后端服务器开发,服务器,linux,网络,poll,epoll,多路转接)