.SacaJawea

多路转接 | select，poll，epoll的区别以及各自的应用实现

文章目录

- 前言
- select函数介绍
- - tcp多路转接代码实现
- poll函数介绍
- - poll函数 vs poll系统调用
  - tcp多路转接代码实现
- epoll函数介绍
- - epoll原理
  - epoll_item vs epitem
  - ET && LT
  - tcp多路转接代码实现

前言

IO可以分为两个步骤，等待+实际的读写。

等待是指等待文件的某一事件就绪，如果文件始终没有就绪，IO就要阻塞
实际的读写就是IO最重要的操作了，这部分所占的比重越大，IO效率越高效

比如调用read时，指定套接字文件始终没有数据可以读取（读事件没有就绪），那么read将一直阻塞，直到数据的到来

多路转接是一种高效的IO方式，可以同时监听多个套接字文件，但是不是一个一个的阻塞等待，而是等待多个文件，当有文件就绪时，立即进行IO操作。这样就可以使IO的等待时间重叠，提高效率，减少CPU的空闲时间。常见的多路转接技术有select，poll，epoll，它们都是系统调用接口，具体实现被系统封装与隐藏了。

select函数介绍

select是一个多路复用（转接）输入/输出模型，它可以让程序监听多个套接字，在其中的一个或多个套接字准备好读写或者发送异常时通知程序

select函数原型如下：

#include 
int select(int nfds, fd_set *readfds, fd_set *writefds,
           fd_set *exceptfds, struct timeval *timeout)

nfds：表示要监听的文件描述符最大值，如果要监听的文件描述符最大值为n，那么就要设置nfds为n + 1，表示要监听文件描述符处于[0, n + 1)间的左闭右开区间
readfds：指向一个fd_set结构体，用于存储监听的读事件文件描述符集合
writefds：指向一个fd_set结构体，用于存储监听的写事件文件描述符集合
exceptfds：指向一个fd_set结构体，用于存储发生异常的文件描述符集合
timeout：指向一个timeval结构体，用于设置select的超时时间
- 如果为NULL，表示无限等待（阻塞式），只有监听的文件描述符集合中有一个或多个发生了事件，select才会返回，否则一直阻塞
- 如果为0秒0微秒，表示不等待（非阻塞式），不论文件描述符集合中是否发生了事件，select都直接返回
- 如果大于0秒0微妙，表示等待指定的时间，监听的文件描述符集合中有一个或多个发生了事件或者超过了指定时间，select才会返回

select出错返回-1，并设置errno。返回0表示没有事件发生。有事件发生时，返回值表示发生事件的文件描述符数量

设置了超时时间，select就会返回在这段时间内，发生事件的文件描述符数量吗？ 答案是不一定，发生了一个或多个事件，select可能也会返回。所以select可能提前返回，并且发生事件的文件描述符数量是不确定的，可能为1，可能大于1。我们要用FD_ISSET宏对每个文件描述符进行判断并处理

至于说fd_set结构体，这是一个long int类型（长度与操作系统和编译器有关，32位及以前的系统，长度为4字节，64位系统，长度为8字节。可以用sizeof检查你的平台上long int的大小）的数组。用来存放文件描述符，每一比特位表示一个文件描述符，1/0表示该文件描述符的某一事件是否发生的状态。有以下4个宏可以处理fd_set结构体

FD_ZERO(fd_set* fdset)：清除fdset的所有位（置0）
FD_SET(int fd, fd_set* fdset)：将fd添加到fdset中
FD_CLR(int fd, fd_set* fdset)：将fd从fdset中清除
FD_ISSET(int fd, fd_set* fdset)：检查fd是否在fdset集合中，如果在返回非0值，不在返回0

可以直接位操作fd_set，但推荐使用宏来操作fd_set，因为fd_set的内部实现因平台而异，直接位操作不仅破坏其封装性和可移植性，还可能引发错误

关于最后一个参数timeout，它是struct timeval类型的指针，以下是struct timeval结构体成员的具体信息

// tv_sec表示秒，tv_usec表示微秒
struct timeval {
	time_t      tv_sec;     /* seconds */
	suseconds_t tv_usec;    /* microseconds */
};

tcp多路转接代码实现

使用tcp协议的四个步骤：socket，bind，listen，accept。为提高IO效率，使用select函数，

如果监听套接字暂时没有与其他主机建立tcp连接，监听套接字文件会处于LISTEN状态
如果有主机三次握手成功了，监听套接字会从LISTEN状态变为READABLE状态，表示新连接的到来
并且将该连接从半连接队列中删除，加入全连接队列

所以select可以根据监听套接字文件的状态变化，检测是否有读事件发生：如果文件从LISTEN->READABLE，就表示发生了读事件。除了LISTEN和READABLE状态，还有一些常见状态

WRITABLE：表示文件可写入
EXECUTABLE：表示文件可执行
CLOSED：表示文件已关闭
ERROR：表示文件发生错误

select根据文件的状态，来判断是否有读事件，写事件或者异常事件发生，以返回发生事件的数量

#include "Socket.hpp"
#include 

void usage(char *process_name)
{
    cout << "usage: " << process_name << " port"
         << endl;
}

// 历史套接字数组和它的长度，长度为1024，表示可以同时运行的套接字数量
// 其实select只能同时监听1024个套接字
int fd_array[sizeof(fd_set) * 8] = {0};
int arr_num = (sizeof(fd_array) / sizeof(fd_array[0]));
// 数组初始值
#define DFL -1
#define BUF_SIZE 1024

// select监听到了事件的发生，调用HandlerEvent处理事件
void HandlerEvent(int listen_sock, fd_set& readfds)
{
    for (int i = 0; i < arr_num; ++i)
    {
        // 跳过默认值，寻找需要监听的套接字
        if (fd_array[i] == DFL)
            continue;
        // 如果发生了读事件
        if (FD_ISSET(fd_array[i], &readfds))
        {
            if (fd_array[i] == listen_sock)
            {
                // 有新连接了，判断是否能获取该连接
                int j = 0;
                for (j = 0; j < arr_num; ++j)
                {
                    if (fd_array[j] == DFL)
                        break;
                }
                if (j == arr_num)
                {
                    cerr << "当前队列已满"  << endl;
                }
                else
                {
                    // 处理事件
                    uint16_t peer_port;
                    string peer_ip;
                    int server_sock = tcpSock::Accept(listen_sock, &peer_ip, &peer_port);
                    if (server_sock < 0)
                    {
                        cerr << errno << ": " << strerror(errno) << endl;
                        // accept失败，暂时不管这个连接了
                        continue;
                    }
                    // 将其添加到历史数组中
                    fd_array[j] = server_sock;
                    cout << peer_ip << "[" << peer_port << "] 连接..." << endl;
                }
            } // end of if (fd_array[i] == listen_sock)
            else
            {
                // 创建读缓冲区
                char read_buffer[BUF_SIZE] = {0};
                // 普通IO事件就绪，此时读取不会阻塞
                int ret = recv(fd_array[i], (void*)&read_buffer, sizeof(read_buffer) - 1, 0);
                // 读取出错
                if (ret < 0)
                {
                    cerr << errno << ": " << strerror(errno) << endl;
                    // 注意，程序不要直接退出，应该关闭该服务套接字
                    close(fd_array[i]);
                    fd_array[i] = DFL;
                }
                // 对端关闭
                else if (0 == ret)
                {
                    cout << "peer close..." << endl;
                    close(fd_array[i]);
                    fd_array[i] = DFL;
                }
                // 读取成功
                else
                {   
                    read_buffer[ret] = '\0';
                    // 这里需要对读取的信息进行处理，暂时用打印替代
                    cout << read_buffer;
                }
            }
        }
    }
}

int main(int argc, char *argv[])
{
    // 判断调用者是否传入了端口号
    if (argc != 2)
    {
        usage(argv[0]);
        exit(-1);
    }
    // 创建套接字
    int listen_sock = tcpSock::Socket();
    // 将用户传入的端口绑定到套接字上
    tcpSock::Bind(listen_sock, atoi(argv[1]));
    // 使监听套接字处于监听状态
    tcpSock::Listen(listen_sock);
    // 初始化历史套接字数组
    for (int i = 0; i < arr_num; ++i)
    {
        fd_array[i] = DFL;
    }

    // 默认将listen套接字设置进fd数组
    fd_array[0] = listen_sock;

    // 不断地检测事件的发生
    while (true)
    {
        fd_set readfds = {0};
        int max_fd = DFL;
        // 添加读事件监听集
        for (int i = 0; i < arr_num; ++i)
        {
            // 默认值不需要监听，直接跳过，找要监听的套接字
            if (fd_array[i] == DFL)
                continue;
            // 设置套接字到监听事件集中
            FD_SET(fd_array[i], &readfds);
            // 需要维护select的第一个参数
            if (fd_array[i] > max_fd)
                max_fd = fd_array[i];
        }
        // 设置超时时间为5秒
        struct timeval timeout = {5, 0};
        // 只关心读事件
        int n = select(max_fd + 1, &readfds, nullptr, nullptr, &timeout);
        switch (n)
        {
        case 0:
            cout << "没有事件发生，但超时了..." << endl;
            break;
        case -1:
            cerr << errno << ":" << strerror(errno) << endl;
            break;
        default:
            HandlerEvent(listen_sock, readfds);
            break;
        }
    }
    return 0;
}

poll函数介绍

poll也是一个用于实现多路转接的函数，其原型如下

#include 
int poll(struct pollfd *fds, nfds_t nfds, int timeout);

fds：struct pollfd类型的指针，可以想象成数组，存储了多个struct pollfd
nfds：表示fds的长度，需要监听的套接字数量，可以存在无效套接字
timeout：单位为毫秒，超时时间的设置
- 如果为-1，表示非阻塞等待。无论监听的描述符集合中是否有事件发生，都立即返回
- 如果为0，表示阻塞式等待。除非监听的描述符集合中有一个或多个事件发生，否则不会返回
- 如果大于0，表示在指定的时间内，如果监听的描述符集合中有一个或多个事件发生，或者超过了指定时间，poll才返回
函数执行成功，返回监听的描述符集合中，发生事件的描述符个数。如果超时且没有任何事件发生，就返回0。如果调用失败，poll返回-1，并设置errno

poll比select使用简单，select有两个主要问题

select监听的套接字有数量上限，最大为1024
由于事件集是一个输入输出参数，每次处理完事件，需要重新设置事件集。因为内核修改了上次的事件集，当需要监听的文件描述符数量增多时，重新设置事件集将会是极大的开销

poll就是为解决select的这两个问题而生的。这里有一个结构体：struct pollfd

// pollfd结构
struct pollfd {
	int   fd;         /* file descriptor */
	short events;     /* requested events */
	short revents;    /* returned events */
};

该结构体指明了需要监听的文件描述符，需要监听的事件（用户告诉内核），以及监听到的事件（内核告诉用户）。events和revents字段可以用以下常量来指定或测试不同类型的事件

POLLIN：普通或优先数据可读
POLLRDNORM：普通数据可读
POLLRDBAND：优先数据可读
POLLOUT：普通或优先数据可写
POLLWRNORM：普通数据可写
POLLWRBAND：优先数据可写
POLLERR：发生错误
POLLHUP：发生挂起

关于这些字段或者更多的字段，需要用到时可以上网查。

poll函数 vs poll系统调用

这一小节所谈论的poll是指poll系统调用

poll系统调用是用户向内核发起的一种请求，使用poll系统调用可以监听多个文件描述符的状态，等待其中一个或多个就绪或超时。poll系统调用会调用poll函数，poll函数是文件描述符所属的设备或对象提供的一种检查状态的接口，它通常是一个设备驱动程序中实现的函数。poll系统调用在执行过程中，会遍历fds数组中的每个元素，并且调用其对应文件描述符的poll函数来检查其状态，将结果保存在revents域中。如果没有任何文件描述符就绪，poll系统调用会将当前进程挂起到等待队列中，并进入休眠状态。当有设备发生IO事件时，内核会唤醒等待队列中的进程，并重新检查fds数组中的每个元素。

不同类型的文件描述符，如套接字，终端，管道，可能含有不同的poll函数实现。但poll函数主要有两个功能

一是返回文件描述符当前的状态，如可读，可写，异常等，用户根据其返回的状态进行相应的操作
二是将当前进程注册到设备或对象的等待队列中，并指定当文件描述符状态发生变化时，需要执行的回调函数。当设备或对象发生IO事件时，就可以唤醒等待队列中的进程并执行回调函数

所以poll系统调用是用户和内核的一种交互方式，而poll函数则是poll系统调用执行过程中所需的一个接口函数

tcp多路转接代码实现

#include "Socket.hpp"
#include 

void usage(char *process_name)
{
    cout << "usage: " << process_name << " port"
         << endl;
}

#define FDS_SIZE  1024
struct pollfd fds[FDS_SIZE] = {0};
nfds_t fds_count = 1;
#define DFL -1
#define BUF_SIZE 1024

// select监听到了事件的发生，调用HandlerEvent处理事件
void HandlerEvent(int listen_sock)
{
    for (int i = 0; i < fds_count; ++i)
    {
        // 跳过默认值，寻找需要监听的套接字
        if (fds[i].fd == DFL)
            continue;
        // 如果发生了读事件
        if (fds[i].revents & POLLIN)
        {
            // 有新连接了，判断是否能获取该连接
            if (fds[i].fd == listen_sock)
            {
                int j = 0;
                for (j = 0; j < fds_count; ++j)
                {
                    if (fds[i].fd == DFL)
                        break;
                }
                if (j == FDS_SIZE)
                {
                    cerr << "当前队列已满"  << endl;
                }
                else
                {
                    // 处理事件
                    uint16_t peer_port;
                    string peer_ip;
                    int server_sock = tcpSock::Accept(listen_sock, &peer_ip, &peer_port);
                    if (server_sock < 0)
                    {
                        cerr << errno << ": " << strerror(errno) << endl;
                        // accept失败，暂时不管这个连接了
                        continue;
                    }
                    // 将其添加到监听队列中
                    fds[j].fd = server_sock;
                    // 监听读事件
                    fds[j].events |= POLLIN;
                    fds[j].revents = 0;
                    ++fds_count;
                    cout << peer_ip << "[" << peer_port << "] 连接..." << endl;
                }
            } // end of if (fds[i].fd == listen_sock)

            else
            // 普通IO事件就绪，此时读取不会阻塞
            {
                // 创建读缓冲区
                char read_buffer[BUF_SIZE] = {0};
                // 读取数据
                int ret = recv(fds[i].fd, (void*)&read_buffer, sizeof(read_buffer) - 1, 0);
                // 读取出错
                if (ret < 0)
                {
                    cerr << errno << ": " << strerror(errno) << endl;
                    // 注意，程序不要直接退出，应该关闭该服务套接字
                    close(fds[i].fd);
                    fds[i].fd = DFL;
                }
                // 对端关闭
                else if (0 == ret)
                {
                    cout << "peer close..." << endl;
                    close(fds[i].fd);
                    fds[i].fd = DFL;
                }
                // 读取成功
                else
                {   
                    read_buffer[ret] = '\0';
                    // 这里需要对读取的信息进行处理，暂时用打印替代
                    cout << "收到了: " << read_buffer;
                }
            }
        }
    }
}

int main(int argc, char *argv[])
{
    // 判断调用者是否传入了端口号
    if (argc != 2)
    {
        usage(argv[0]);
        exit(-1);
    }
    // 创建套接字
    int listen_sock = tcpSock::Socket();
    // 将用户传入的端口绑定到套接字上
    tcpSock::Bind(listen_sock, atoi(argv[1]));
    // 使监听套接字处于监听状态
    tcpSock::Listen(listen_sock);

    // 默认将listen套接字设置进fd数组
    fds[0].fd = listen_sock;
    fds[0].events |= POLLIN;
    fds[0].revents = 0;
    fds_count = 1;

    // 初始化fds数组
    for (int i = 1; i < FDS_SIZE; ++i)
    {
        fds[i].fd = DFL;
        fds[i].events = 0;
        fds[i].revents = 0;
    }

    // 设置超时时间为2秒
    int timeout = 2000;
    
    // 不断地检测事件的发生
    while (true)
    {
        // 只关心读事件
        int n = poll(fds, FDS_SIZE, timeout);
        switch (n)
        {
        case 0:
            cout << "没有事件发生，但超时了..." << endl;
            break;
        case -1:
            cerr << errno << ":" << strerror(errno) << endl;
            break;
        default:
            HandlerEvent(listen_sock);
            break;
        }
    }
    return 0;
}

对比select，poll有以下的优点

poll没有了监听数量的限制，可以监听任意数量的套接字
poll用一组结构体数组表示要监听的文件与事件，而select用位图结构表示要监听的文件描述符集合，poll可以更详细的表示要监听的事件类型
poll只会修改每个结构体中的revents字段，而select会修改传入的位图参数，导致select每次都要重新设置位图

但是poll还是没有解决以下问题

poll仍需遍历整个文件描述符数组，并检测哪些文件发生了事件
poll仍是轮询检测地对文件进行监听，当文件描述符的数量增多时，不仅浪费cpu资源，还不能及时的响应事件的发生
poll仍需将文件描述符数组从用户态拷贝到内核态，这样的开销随着文件描述符数量的增加而线性增长

epoll函数介绍

epoll有三个主要接口：epoll_creat，epoll_ctl，epoll_wait

#include 
int epoll_create(int size);

epoll_create用于创建一个epoll对象，返回其描述符，失败返回-1并设置errno。关于其唯一参数size：自从Linux2.6版本之后，可以忽略该参数，但是要将其设置为大于0的值

#include 
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

对epoll描述符的控制接口，可以实现对epoll控制描述符的添加，删除，修改

epfd：表示epoll的文件描述符，由epoll_create返回
op：表示要执行的操作，可以是EPOLL_CTL_ADD（添加），EPOLL_CTL_MOD（修改），EPOLL_CTL_DEL(删除）
fd：表示要监听的文件描述符
event：表示一个指向struct epoll_event类型的结构体，它包含了两个字段
- events：是epoll要监听的具体事件，如EPOLLIN（可读），EPOLLOUT（可写）等等，使用epoll_ctl注册事件时，需具体明确告知
- data：是一个联合体，可以存储用户的数据，如指针，文件描述符，整数等，这个参数用来在epoll_wait返回事件时，传递参数或表示事件源
epoll_ctl成功返回0，失败返回-1并设置errno

以下是struct epoll_event的具体成员

typedef union epoll_data {
	void        *ptr;
	int          fd;
	uint32_t     u32;
	uint64_t     u64;
} epoll_data_t;

struct epoll_event {
	uint32_t     events;      /* Epoll events */
	epoll_data_t data;        /* User data variable */
};

events可以是下面几个宏的集合：

EPOLLIN：对应文件描述符可读
EPOLLOUT：对应文件描述符可写
EPOLLERR：对应文件描述符发生错误
EPOLLPRI : 表示对应的文件描述符有紧急的数据可读
EPOLLHUP : 表示对应的文件描述符被挂断
EPOLLONESHOT：只监听一次事件, 当监听完这次事件之后, 如果还需要继续监听这个socket的话, 需要再次把这个socket加入到EPOLL队列里

int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

收集在监控事件中发生的事件

epfd：由epoll_create返回的epoll文件描述符
events：指向struct epoll_event的指针，用来存储返回的事件
maxevents：表示用户期望捕获的事件个数，不能大于events数组大小
timeout：和poll一样，表示毫秒，具体看poll关于timeout的介绍
epoll_wait的返回值是待处理的事件，如果为0表示超时或者非阻塞时的返回。失败时返回-1并设置errno

epoll原理

select与poll对于事件的监听采用轮询检测的方式，而epoll不再使用这种低效且浪费资源的方式，转而使用回调函数。利用内核的事件通知机制，当监听的文件描述符发生状态变化时，通过回调函数将其加入到就绪链表中，然后用户可以通过就绪链表获取已经就绪的文件描述符

epoll在内核中主要涉及以下数据结构：

struct eventpoll：对应一个epoll实例（由epoll_create返回），包含了一个红黑树和一个就绪链表。红黑树用于存储所有被监听的文件描述符，就绪链表用于存储已经就绪的文件描述符
struct epitem：对应一个被监听的文件描述符，存储了epoll fd的相关信息。包含一个eppoll_entry结构体指针，epoll_entry结构体用于将epitem挂载到文件描述符对应的等待队列中
struct eppoll_entry：存储被监听文件描述符的等待队列信息，每个被监听的文件描述符都有一个等待队列，其存储了注册在该文件描述符的回调函数。当该文件描述符发生事件时，内核会调用这些回调函数。eppol_entry就是用来链接这些文件描述符和回调函数的
struct poll_table：表示轮询表，包含了一个函数指针_qproc和一个事件掩码_key，分别用来注册等待队列和返回可操作的事件。驱动程序不需要知道其内部细节，只需要将其作为参数传递给poll方法
ep_poll_callback：当某个被监听的文件描述符fd有事件发生，会触发该回调函数（也称唤醒函数），该函数会将对应的epitem加入到eventpoll对象的就绪链表中，并通过wake_up_locked唤醒正在睡眠的epoll_wait。该函数是在ep_insert函数中被注册到文件描述符的等待队列中的

epoll主要用三个结构来管理和存储fd：eventpoll，epitem，eppoll_entry。eventpoll是一个全局对象，对应一个epoll实例。其红黑树和双向链表分别用来存储所有注册到epoll的fd和所有就绪的fd。每个注册到epoll中的fd都有一个对应的epitem对象，它含有一个红黑树节点和一个双向链表节点，分别用来插入到eventpoll中的两个数据结构中，epitem包含了一个eppoll_entry的链表（其pwqlist结构就是用来链接eppoll_entry的）。eppoll_entry包含了等待队列头和等待队列节点（wait_queue_t），用来将fd挂载到设备驱动程序提供的等待队列上，并注册回调函数。

关于红黑树与就绪链表：

红黑树是一颗平衡的二叉搜索树，用来存储所有被epoll监听的文件描述符和对应的事件（epitem）。每个epoll实例都有一颗红黑树，当用户调用epoll_ctl注册或删除文件描述符时，内核会对红黑树进行相关操作，以保证其平衡，从而提高查找效率
就绪链表是一个双向链表，用来存储已经发生事件的文件描述符和对应的事件（epitem）。每个epoll实例都有一个就绪链表，当socket收到数据包或发生其他事件时，内核会通过回调函数将对应的epitem插入到就绪队列中，然后唤醒等待在epoll_wait的用户进程，用户进程可以通过epoll_wait获取事件

eppoll_entry主要用于ep_insert和ep_remove两个函数中，eppoll_entry在函数中的作用是：在等待队列中添加和删除文件描述符

ep_insert的实现流程：
- 当用户调用epoll_ctl注册一个文件描述符时，内核会创建一个epitem对象，将其插入到eventpoll的红黑树中
- 然后内核会调用该文件驱动的poll函数，并传入一个poll_table参数，该参数用于建立__pollwait回调函数
- 该回调函数会调用poll_wait把当前进程注册到文件驱动的等待队列中，还会创建一个eppoll_entry结构（其中包含了epitem和ep_poll_callback的信息），将其插入到epitem->pwqlist中。
ep_remove的实现流程：
- 内核会先从eventpoll的红黑树中删除对应的epitem
- 在删除前会遍历epitem的pwqlist，对每个eppoll_entry节点，从文件的等待队列中删除它，并释放其内存
- 接着检查被删除epitem是否在eventpoll的等待队列中，如果在，则删除
- 最后释放epitem占用的资源，并减少文件描述符的引用计数

当设备发送IO事件时，设备驱动会遍历其等待队列头对应的链表，并调用每个节点上注册的回调函数

如果注册的回调函数是__poll_wait，那么__poll_wait会检查该节点是否对应了某个epoll实例中的epitem
- 如果不对应，那么__poll_wait什么都不会做
- 如果对应，那么__poll_wait会在epoll实例的红黑树中找到该epitem，将其加入就绪队列
如果注册的回调函数是ep_poll_callback，那么ep_poll_callback会将已产生事件与关系事件做对比，如果有交集，将对应epitem加入到就绪队列中

综上，__poll_wait和ep_poll_callback都有将epitem加入到就绪队列中的功能，不同的是：__poll_wait是在设备驱动中被调用，而ep_poll_callback是在epoll_wait中被调用。__poll_wait是在设备事件发生时被动添加epitem，而ep_poll_callback是在用户请求时主动检查并添加epitem

epoll_item vs epitem

struct epitem {
    struct rb_node rbn; /* 红黑树节点 */
    struct list_head rdllink; /* 双向链表节点 */
    struct epitem *next; /* 指向下一个epitem */
    struct epoll_filefd ffd; /* 文件描述符和文件指针 */
    struct eventpoll *ep; /* 所属的eventpoll指针 */
    struct epoll_event event; /* 事件类型和数据 */
};

struct epoll_item {
	struct rb_node rbn;
	struct list_head rdllink;
	int nwait;
	struct list_head pwqlist;
	struct epitem *epi;
};

epitem和epoll_item是两个不同的结构

epitem表示一个被监听的文件描述符的结构体，它包含了文件描述符，事件类型，回调函数等信息
epoll_item表示一个epoll实例中，所有文件描述符的集合的结构体。包含了一个红黑树和一个链表，用来遍历所有的epitem
所以说，epitem是epoll_item的元素，epoll_item是epitem的容器
它两都是内核数据结构。用户调用epoll_ctl()传递一个epoll_event给内核空间，内核空间根据这个结构体创建或更新一个对应的epitem，并将其添加到epoll_item中。用户根据epoll_wait获取epoll_event信息，这个信息是从epitem中复制出来的
或者说：struct epoll_item和eventpoll一样，都表示（关注）一个epoll的实例

epoll相对于select和poll的优势：

epoll使用内核结构存储和管理被监听的文件描述符信息，避免了重复的拷贝文件描述符集合
epoll使用红黑树存储注册的文件描述符，提高了查找和插入的效率
epoll采用回调函数（事件驱动）唤醒进程，避免了不必要的轮询检测，节省了cpu资源
epoll支持边沿触发与水平触发两种模式，方便用户根据需求具体的定制epoll

ET && LT

ET和LT是epoll的两种工作模式，默认选择LT，而select和poll只有LT模式。

ET模式只有在状态变化时会触发事件，LT模式只要有事件就会一直触发
ET可以做到更简洁的编程，因为它不需要对每个事件进行多余的判断和处理
ET可以避免开关EPOLLOUT事件的开销，因为它只在tcp窗口从不饱和变为饱和与再一次变为不饱和时才会触发写事件。而LT需要在每次写数据后检测是否需要关闭或开启EPOLLOUT事件

关于最后一点：EPOLLOUT表示内核的发送缓冲区有数据可写。LT模式下，如果发送缓冲区不满，就会一直触发写事件。所以每次向内核的发送缓冲区写完数据后，需要检查是否要关闭或者开启EPOLLOUT事件（事件的开关根据用户需要发送的数据是否发送完来判断），以免浪费cpu资源。但是在ET模式下，只有发送缓冲区从满到不满才会触发写事件，表示可以进行数据的写入。所以ET不用频繁的进行EPOLLOUT的开关。但是在ET模式下，如果需要下一次的写事件触发来驱动任务，就需要重新注册EPOLLOUT。这是因为重新注册后EPOLLOUT一定会触发一次（相当于手动触发），ET模式下的发送一般都是直接发送，如果数据量太大，没有发送完，那么这时再设置EPOLLOUT，使写事件触发，再次发送数据

事件的触发体现在epoll_wait是否返回该事件上，LT模式下，如果（内核）接收缓冲区的数据没有及时处理完，epoll_wait依旧会返回该事件，以表示读事件的就绪。但在ET模式下，数据没有及时处理完，epoll_wait不会返回该事件，无论是否有新的数据到来。LT模式下，只要发送缓冲区不为满（可写），就会一直触发写事件。ET模式下，只有发送缓冲区从满到不满时，才会触发写事件

总结和补充：

ET模式下
- 只要接收缓冲区的数据从无到有，就会触发读事件
- 发送缓冲区从满到不满，重新注册EPOLLOUT | EPOLLET，第一次进行tcp连接时，会触发写事件
LT模式下
- 只要接收缓冲区有数据就会触发读事件
- 只要发送缓冲区不为满，就会触发写事件

不过选择了ET模式，就要设置fd为非阻塞。因为ET模式需要不断的读取或者发送数据，如果缓冲区满或空了，不能使程序进入阻塞，所以要设置非阻塞

void Util::set_nonblock(int sockfd)
{
    int fd_flag = fcntl(sockfd, F_GETFL);
    if (fd_flag < 0)
    {
        cerr << errno << ": " << strerror(errno) << endl;
        exit(-FTL_FAIL);
    }
    int ret = fcntl(sockfd, F_SETFL,fd_flag | O_NONBLOCK);
    if (ret < 0)
    {
        cerr << errno << ": " << strerror(errno) << endl;
        exit(-FTL_FAIL);
    }
}

tcp多路转接代码实现

#include "Socket.hpp"
#include 

#define MAXEVENTS 1024
#define BUF_SIZE 1024

#define CRT_FAL -1
#define CTL_FAL -2
#define WAIT_FAL -3
#define ACP_FAL -4

class epoll_server
{
public:
    epoll_server(uint16_t port, int listen_sockfd = -1, int epoll_fd = -1)
        : _listen_sockfd(listen_sockfd), _epoll_fd(epoll_fd), _port(port)
    {
    }
    ~epoll_server()
    {
        if (-1 != _listen_sockfd)
            close(_listen_sockfd);
        if (-1 != _epoll_fd)
            close(_epoll_fd);
    }

    // 监听套接字的初始化
    void init_server();
    // 使用epoll进行IO
    void run_server();

private:
    // IO事件的处理
    void handler_event(struct epoll_event* revs, int n);

private:
    // 监听套接字fd与epoll实例fd
    int _listen_sockfd;
    int _epoll_fd;
    // epoll_server绑定的端口号
    uint16_t _port;
};

void epoll_server::init_server()
{
    // 创建sock，绑定端口并使之处于监听状态
    _listen_sockfd = tcpSock::Socket();
    tcpSock::Bind(_listen_sockfd, _port);
    tcpSock::Listen(_listen_sockfd);

    cout << "init_server done" << endl;
}

void epoll_server::run_server()
{
    _epoll_fd = epoll_create(128);
    if (-1 == _epoll_fd)
    {
        cerr << errno << ": " << strerror(errno) << endl;
        exit(CRT_FAL);
    }
    struct epoll_event ev = {0};
    ev.events = EPOLLIN;
    ev.data.fd = _listen_sockfd;
    // 注册文件到epoll实例
    int ret = epoll_ctl(_epoll_fd, EPOLL_CTL_ADD, _listen_sockfd, &ev);
    if (-1 == ret)
    {
        cerr << errno << ": " << strerror(errno) << endl;
        exit(CTL_FAL);
    }

    struct epoll_event revs[MAXEVENTS] = {0};
    int timeout = 2000; // 设置超时时间2秒
    while (true)
    {
        int n = epoll_wait(_epoll_fd, revs, MAXEVENTS, timeout);
        switch (n)
        {
        case -1:
            cerr << errno << ": " << strerror(errno) << endl;
            exit(WAIT_FAL);
            break;
        case 0:
            cout << "超时事件内没有事件发生..." << endl;
            break;
        default:
            handler_event(revs, n);
            break;
        }
    }
}

void epoll_server::handler_event(struct epoll_event* revs, int n)
{
    for (int i = 0; i < n; ++i)
    {
        // 发生了读事件
        if (revs[i].events & EPOLLIN)
        {
            // 监听到一个新连接
            if (revs[i].data.fd == _listen_sockfd)
            {
                string peer_ip;
                uint16_t peer_port;
                int server_sock = tcpSock::Accept(_listen_sockfd, &peer_ip, &peer_port);
                if (-1 == server_sock)
                {
                    cerr << errno << ": " << strerror(errno) << endl;
                    exit(ACP_FAL);
                }
                // 向epoll实例中注册这个服务套接字
                struct epoll_event ev= {0};
                ev.events = EPOLLIN;
                ev.data.fd = server_sock;
                int ret = epoll_ctl(_epoll_fd, EPOLL_CTL_ADD, server_sock, &ev);
                if (-1 == ret)
                {
                    cerr << errno << ": " << strerror(errno) << endl;
                    exit(CTL_FAL);
                }

                cout << "与客户端[" << peer_ip << "]:" << peer_port << "连接成功" << endl;
            }
            // 监听到普通IO事件
            else
            {
                char read_buff[BUF_SIZE] = {0};
                int ret = recv(revs[i].data.fd, read_buff, BUF_SIZE, 0);
                if (ret < 0)
                {
                    cerr << "recv fali" << endl;
                    close(revs[i].data.fd);
                }
                else if (ret == 0)
                {
                    cout << "peer close..." << endl;
                    close(revs[i].data.fd);
                }
                else
                {
                    cout << "普通IO:" << read_buff;
                }
            }
        }
        // 发生了写事件，暂时不处理
        else{}
    }
}

// Socket.hpp
#pragma once

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

class tcpSock
{
    static const int _backlog = 20;
    public:
    // 创建套接字文件，并设置套接字选项，使服务器可以立即重启
    // 最后返回套接字fd
    static int Socket()
    {
        int listen_sock = socket(AF_INET, SOCK_STREAM, 0);
        if (listen_sock < 0)
        {
            cerr << errno << ": " << strerror(errno) << endl;
            exit(-1);
        }

        int opt = 1;
        int ret = setsockopt(listen_sock, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT, &opt, sizeof(opt));
        if (ret < 0)
        {
            cerr << errno << ": " << strerror(errno) << endl;
            exit(-1);
        }

        return listen_sock;
    }

    // 填充服务器IP与端口信息，将其绑定到listen套接字上
    static void Bind(int listen_sock, u_int16_t local_port)
    {
        // 服务器信息的填充
        struct sockaddr_in local;
        memset(&local, 0, sizeof(local));
        local.sin_family = AF_INET;
        local.sin_addr.s_addr = INADDR_ANY; // 只要绑定本机IP就行
        local.sin_port = htons(local_port);

        int ret = bind(listen_sock, (struct sockaddr*)&local, sizeof(local));
        if (ret < 0)
        {
            cerr << errno << ": " << strerror(errno) << endl;
            exit(-1);
        }
    }

    // 使指定套接字处于监听状态
    static void Listen(int listen_sock)
    {
        int ret = listen(listen_sock, _backlog);
        if (ret < 0)
        {
            cerr << errno << ": " << strerror(errno) << endl;
            exit(-1);
        }
    }

    static int Accept(int listen_sock, string* peer_ip, uint16_t* peer_port)
    {
        struct sockaddr_in peer;
        socklen_t peer_len = sizeof(peer);
        int server_sock = accept(listen_sock, (struct sockaddr*)&peer, &peer_len);
        if (server_sock < 0)
        {
            cerr << errno << ": " << strerror(errno) << endl;
            exit(-1);
        }

        *peer_ip = inet_ntoa(peer.sin_addr);
        *peer_port = ntohs(peer.sin_port);

        return server_sock;
    }
};

// main.cc
#include "epoll_server.hpp"

void usage(char *process_name)
{
    cout << "usage: " << process_name << " port"
         << endl;
}


int main(int argc, char* argv[])
{
     // 判断调用者是否传入了端口号
    if (argc != 2)
    {
        usage(argv[0]);
        exit(-1);
    }

    epoll_server eserver(atoi(argv[1]));
    eserver.init_server();
    eserver.run_server();
    return 0;
}

你可能感兴趣的:(Linux学习总结,sql,数据库,linux)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后