首先我们要明确的是在任何IO操作中,均包含两个步骤,等待和拷贝,而在实际的业务中,等待所消耗的时间往往大于拷贝的时间,因此,让IO操作更高效,核心的方法就是将等待的时间缩短。
低阶IO:是指类似于将用户输入的内容读取到某个变量中,将变量中的值打印在屏幕上等等,简单来说就是对C库自己所维护的缓冲区进行I/O操作。
高阶IO:通常应用于网络Socket编程,对UDP(TCP)所维护的发送缓冲区和接收缓冲区进行I/O操作。并且高阶IO分为同步IO和异步IO,同步IO又分为阻塞IO、非阻塞IO、信号驱动IO和多路转接IO
阻塞IO:在内核将数据准备好之前(等待+拷贝),系统调用会一直进行等待。并且所有的套接字默认均是阻塞方式。
非阻塞IO:若当前内核没有将数据准备好,则系统调用会直接返回,并返回一个EWOULDBLOCK错误码。
非阻塞IO一般都是搭配循环来使用的(也叫轮询),这对系统资源是较大的浪费,一般都是在特定的场景下使用。
扩展:将一个文件描述符设置为非阻塞属性。
int fcntl(int fd, int cmd, ... /* arg */ )
,处于#include
- 首先通过给cmd传入
F_GETFL
宏来获取到当前文件描述符的属性- 其次再通过获得的属性按位或上
O_NONBLOCK
属性,将文件描述符设置为非阻塞属性
代码如下:
int f1 = fcntl(fd,F_GETFL);
if(f1 < 0)
{
perror("fcntl");
return ;
}
fcntl(fd,F_SETFL, f1 | O_NONBLOCK);
信号驱动IO:当内核将数据准备好之后,或者说告诉应用进程何时才可以开始拷贝数据,会给应用进程发送一个SIGIO的信号,通知其进行IO操作。当应用程序接收到该信号之后,证明数据已经准备好了,接下来就会调用系统调用函数对其进行相应的IO操作
多路转接IO:在流程上与阻塞IO类似,但是其本质上最核心的地方就是可以一次性等待多个文件描述符的就绪状态。
异步IO:当内核将数据拷贝好之后,通知应用进程进行相关的IO操作。需要注意的是他和信号驱动IO很像,但是信号驱动IO是内核将数据准备好后才通知,而异步IO是内核将数据拷贝好后才通知。
注:为了性能和效率的优先,C++默认采用的是异步IO的方式。
首先我们要知道多路复用函数的作用是什么,其本质上就是让内核帮助程序员监控多个文件描述符的IO事件,一旦监控的某个文件描述符对应的事件产生(IO就绪),就会通知调用者,也就是说可以并行的处理多条客户端的请求,换句话说就是实现了高并发。
作用:监控多个文件描述符,就绪之后,通知调用者。
- nfds:select监控事件集合(fd_set)的范围,范围是从[0,1023]之间去进行选择范围。nfds的取值为:监控的最大文件描述符数值+1
- fd_set:事件集合类型
readfds:可读事件结合
writefds:可写事件集合
exceptfds:异常事件集合
并且内核在使用该数组的时候采用的是位图的方式,因此总共有1024个比特位,
NULL:阻塞。
0 :非阻塞。
传递一个struct timeval:代表着带有超时时间的方式。
返回值:
- 监控成功:返回就绪的文件描述符个数
监控成功会返回就绪的文件描述符个数,并且在返回的时候,会将事件集合中未就绪的文件描述符去除掉
- 监控失败:返回-1
参数含义补充:
优点:
- According to POSIX.1-2001,select遵循的是POISX标准,说明select函数是一个跨平台的函数,既可以在linux中运行,也可以在win中运行。
- select在带有超时时间监控的时候,超时时间单位可以是微秒。
缺点:
- 监控文件描述符的个数最多为1024个
- 随着监控文件描述符的增多,监控的效率在逐渐的下降(本质上是select在轮询的进行监控)
- 可读、可写、异常这些事件需要添加到单独的添加到不同的事件集合中
- 当select监控成功之后,会从事件集合当中去除未就绪的文件描述符,这表明程序在下一次运行的时候,需要重新添加文件描述符。
- 在每次select进行监控的时候,都会将准备好的事件集合拷贝到内核空间,select返回的时候,都会相应的事件集合从内核空间再拷贝到用户空间。
前提:均是监控多个文件描述符,就绪之后,然后通知调用者。与select相比,不支持跨平台,与epoll相比,效率没有epoll高。
struct pollfd*
: 事件集合结构
nfds
:事件结构数组中的有效元素的个数timeout
:>0:带有超时事件,单位秒
==:非阻塞
<0:阻塞
返回值:返回就绪的文件描述符个数
优点:
- 提出了事件结构的方式,在给poll函数传递参数的时候,不需要分别添加到事件集合当中。
- 事件结构数组的大小可以根据程序员自己进行定义,并没有上限的要求。
- 不用再监控到就绪之后,重新添加文件描述符。
缺点:
- 不支持跨平台。
- 内核对事件结构数组进行监控的时候也采用的是轮询遍布的方式。
epoll函数是目前世界上公认在Linux下,多路转接监控效率最高的模型
① 创建epoll操作句柄
size
:自从Liunx2.6.8之后,size参数是被忽略的,但是不要传递一个小于0的数字。返回值:返回epoll的操作句柄。
② 注册待要监控的文件描述符
epfd
:epoll操作句柄op
:
fd
:待处理(添加、修改、删除)的文件描述符event
:文件描述符对应的事件结构返回值:
③ epoll的等待接口
epfd
:epoll的操作句柄events
:类型同 epoll_ctl 中一样,只不过这里的是事件集合数组,从epoll当中获取就绪的事件结构maxevents
:最多一次获取多少个事件结构timeout
:>0:带有超时事件,单位秒
==:非阻塞
<0:阻塞返回值:就绪的文件描述符个数
当某一个进程调用epoll_create函数时,LInux内核会创建一个eventpoll
的结构体,这个结构体中有两个成员与epoll的使用方式密切相关。
简单概述一下:
每当调用epoll_create函数的时候,内核就会创建一个
eventpoll
的结构体,在该结构体中有两个成员,类型分别为红黑树和双向链表,当调用epoll_ctl函数进行添加、修改或删除时,本质上就是对该红黑树进行添加、修改和删除,而每一个添加进来的红黑树结点均会和设备(网卡)驱动程序建立一个回调关系(这个回调函数为ep_poll_callback
),当某个文件描述符就绪之后,他会调用这个回调函数将该就绪的事件结构添加到双向链表当中,而当调用epoll_wait进行监控的时候,如果双向链表为空,则表明当前没有就绪的事件发生,如果不为空,则将双向链表中的内容复制到用户态,并返回将事件数量返回给用户。
注意:这里的双向链表其实实现的是一个队列,虽然是一个双向链表,但是他只支持先进先出(FIFO),是队列的特性。
- 没有数量的限制,文件描述符的数量为内核所支持的最大上限(65536)
- 事件回调机制,当文件描述符就绪之后,会调用回调函数将事件结构复制到双向链表中,调用epoll_wait返回时,直接访问就绪队列就可以知道有多少文件描述符就绪,这个操作的时间复杂度为O(1),即使文件操作符很多,也不会受到影响。
- 数据拷贝是轻量的,只有在合适的时候调用
EPOLL_CTL_ADD
将对应的文件描述符接口拷贝到内核中。这个操作并不频繁(select/poll每次都要循环的进行拷贝)。
select、poll、epoll对比
举个例子:当你在中午饭点玩游戏的时候,如果这个时候饭刚好做好了。
LT:家里人第一次通知的时候,你没有管,那他们还会通知第二次、第三次…
ET:家里人在第一次通知的时候,你没有管,那么他们就不会在通知你了。
① LT(Level Triggered) 水平触发工作模式
在LT模式下,当epoll检测到事件就绪的时候,可以不处理或处理一部分,但是可以连续多次调用epoll_wait对事件进行处理,简单点来说的话就是如果事件来了,不管来了几个,只要仍然有未处理的事件,epoll都会通知你。
② ET(Edge Triggered) 边缘触发工作模式
在ET模式下,当epoll检测到事件就绪的时候,会立即进行处理,并且只会处理一次,换句话说就是文件描述符上的事件就绪之后,只有一次处理机会。 简单来说就是如果事件来了,不管来了几个,你若不处理或者没有处理完,除非下一个事件到来,否则epoll将不会再通知你。
LT模式存在的问题:
如果可读或者可写事件未进行处理,会频繁反复的激活未处理事件
解决:
在不想处理某个事件的时候就将它从epoll中移除,需要时再添加上
ET模式存在的问题:
如果可读或者可写事件没有全部处理,会有老数据残留,需要等待新数据的到来才会被处理
解决:
- 循环读取或者写入数据,直至返回值未EAGAIN或者EWOULDBLOCK(循环调用)
- 读取或写入数据后,通过epoll_ctl设置EPOLL_CTL_MOD,激活未处理事件(相当于将当前未处理事件设置未新事件)
先举个简单的例子,利用select函数对系统的0号文件描述符(读缓冲区)进行监控,一旦监控到读的事件,则将其读入的内容打印到屏幕上。
#include
#include
#include
using namespace std;
#define nfds 1
int main()
{
fd_set readfds;
FD_ZERO(&readfds);
FD_SET(0,&readfds);
while(1)
{
fd_set tmp = readfds;
int ret = select(nfds,&tmp,NULL,NULL,NULL);
if(ret < 0)
{
cout << "select failed" << endl;
return 0;
}
for(int i = 0; i < nfds; ++i){
if(FD_ISSET(0,&tmp))
{
char buf[1024] = {0};
read(0,buf,sizeof(buf)-1);
cout << buf << endl;
}
}
}
return 0;
}
结果验证
在TCP单进程的条件下,存在于将accept函数放到while循环内部或外面所造成的问题
内部:每次接收都是新的连接,和每个客户端只能聊一次(accept函数阻塞)
外部:只能接收一个客户端的连接(recv函数阻塞)
更为详细的请看:Linux:TCP Socket编程(代码实战)。
解决代码如下:
为了更方便使用,我们将selecct函数的相关操作封装为一个类
#include
#include
#include
#include
using namespace std;
class SocketSelect{
public:
SocketSelect()
{
FD_ZERO(&readfds_);
nfds_ = 0;
}
void SetFd(int fd)
{
FD_SET(fd,&readfds_);
if(fd > nfds_)
nfds_ = fd;
}
void RmFd(int fd)
{
FD_CLR(fd,&readfds_);
for(int i = nfds_; i >= 0; ++i)
{
if(FD_ISSET(i,&readfds_))
{
nfds_ = i;
break;
}
}
}
int SelectWait(vector<int>& iv)
{
fd_set tmp = readfds_;
int ret = select(nfds_+1,&tmp,NULL,NULL,NULL);
if(ret < 0)
{
printf("select failed\n");
return -1;
}
for(int i = 0; i <= nfds_; ++i)
{
if(FD_ISSET(i,&tmp))
iv.push_back(i);
}
return ret;
}
~SocketSelect()
{
FD_ZERO(&readfds_);
}
private:
int nfds_;
fd_set readfds_;
};
服务端代码:
#include
#include
#include
#include
#include "ssocket.hpp"
using namespace std;
int main()
{
int sockfd = socket(AF_INET,SOCK_STREAM,IPPROTO_TCP);
if(sockfd < 0)
{
cout << "socket failed" << endl;
return 0;
}
sockaddr_in addr;
addr.sin_port = htons(18989);
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = inet_addr("0.0.0.0");
int ret = bind(sockfd,(struct sockaddr *)&addr,sizeof(addr));
if(ret < 0)
{
close(sockfd);
cout << "bind failed" << endl;
}
ret = listen(sockfd,5);
if(ret < 0)
{
close(sockfd);
cout << "listen failed" << endl;
}
SocketSelect ss;
ss.SetFd(sockfd);
while(1)
{
vector<int> iv;
ret = ss.SelectWait(iv);
if(ret < 0)
{
continue;
}
for(size_t i = 0; i < iv.size(); ++i)
{
if(iv[i] == sockfd)
{
//new con
int newsockfd = accept(iv[i],NULL,NULL);
if(newsockfd < 0)
{
cout << "accept failed" << endl;
continue;
}
ss.SetFd(newsockfd);
}
else
{
//recv
char buf[1024] = {0};
ssize_t recv_size = recv(iv[i],buf,sizeof(buf)-1,0);
if(recv_size < 0)
{
cout << "recv failed" << endl;
continue;
}
else if(recv_size == 0)
{
cout << "peer shutdown" << endl;
ss.RmFd(iv[i]);
close(iv[i]);
continue;
}
else
{
cout << buf << endl;
}
}
}
}
close(sockfd);
return 0;
}
客户端代码:
#include
#include
#include
#include
#include
#include
using namespace std;
int main()
{
int sockfd = socket(AF_INET,SOCK_STREAM,IPPROTO_TCP);
if(sockfd < 0)
{
cout << "socket failed" << endl;
return 0;
}
sockaddr_in addr;
addr.sin_family = AF_INET;
addr.sin_port = htons(18989);
addr.sin_addr.s_addr = inet_addr("118.89.67.215");
int ret = connect(sockfd,(struct sockaddr *)&addr,sizeof(addr));
if(ret < 0)
{
cout << "connect failed" << endl;
}
while(1)
{
//char buf[1024] = "i am client1\n";
char buf[1024] = "i am clientxxxxx\n";
ssize_t send_size = send(sockfd,buf,strlen(buf),0);
if(send_size < 0)
{
cout << "send failed" << endl;
continue;
}
sleep(1);
}
return 0;
}
运行结果:
在多线程下调用select函数(是多个线程共同侦听同一个可读事件集合)
#include
#include
#include
#include
using namespace std;
void* PthreadEntry(void* arg)
{
pthread_detach(pthread_self());
fd_set *readfds = (fd_set*) arg;
while(1)
{
int ret = select(1,readfds,NULL,NULL,NULL);
if(ret < 0)
{
cout << "select failed" << endl;
continue;
}
if(FD_ISSET(0,readfds))
{
char buf[1024] = {0};
read(0,buf,sizeof(buf)-1);
cout << buf << endl;
}
}
return NULL;
}
int main()
{
pthread_t pid;
fd_set readfds;
FD_ZERO(&readfds);
FD_SET(0,&readfds);
for(int i = 0; i < 2; ++i)
{
int ret = pthread_create(&pid,NULL,PthreadEntry,(void *)&readfds);
if(ret < 0)
{
cout << "pthread_create failed" << endl;
continue;
}
}
while(1)
{
sleep(1);
}
return 0;
}
结果说明,没有必要,因为不管是阻塞还是非阻塞,当前缓冲区只能由一个线程进行读,在读完之后,由于文件描述符默认是阻塞属性,因此就会阻塞。其实这是一种惊群效应,当一个fd事件就绪的时候,所有等待这个fd的线程都会被唤醒,但是最终只会有一个线程会读到数据,这就是惊群效应。它会造成极大的性能和资源的浪费。
利用poll函数对系统的0号文件描述符(读缓冲区)进行监控,一旦监控到读的事件,则将其读入的内容打印到屏幕上。
#include
#include
#include
using namespace std;
int main()
{
struct pollfd pollfd[1];
pollfd[0].fd = 0;
pollfd[0].events = POLLIN;
while(1)
{
int res = poll(pollfd,1,-1);
if(res < 0)
{
cout << "poll failed" << endl;
return 0;
}
for(int i = 0; i < 1; ++i)
{
if(pollfd[i].revents == POLLIN)
{
char buf[1024] = {0};
read(pollfd[i].fd,buf,sizeof(buf)-1);
cout << buf << endl;
}
}
}
return 0;
}
运行结果:
对0号文件描述符进行监控,当发生读事件的时候,则从缓冲区中读数据并打印到屏幕上。
#include
#include
#include
#define MAXSIZE 1
using namespace std;
int main()
{
int handle = epoll_create(5);
if(handle < 0)
{
cout << "epoll_create failed" << endl;
return 0;
}
struct epoll_event ee;
ee.events = EPOLLIN;
ee.data.fd = 0;
int res = epoll_ctl(handle,EPOLL_CTL_ADD,0,&ee);
if(res < 0)
{
cout << "epoll_ctl failed" << endl;
return 0;
}
while(1)
{
struct epoll_event arr[MAXSIZE];
res = epoll_wait(handle,arr,MAXSIZE,-1);
if(res < 0)
{
cout << "epoll_wait failed" << endl;
continue;
}
for(int i = 0; i < MAXSIZE; ++i)
{
if(arr[i].events == EPOLLIN)
{
char buf[1024] = {0};
read(arr[i].data.fd,buf,sizeof(buf)-1);
cout << buf << endl;
}
}
}
return 0;
}
结果验证:
#include
#include
#include
#include
#include
#include
using namespace std;
#define MAXSIZE 10
#define Judge(x) if(x<0) {cout << "failed" << endl; return 0;}
int main()
{
int lisnfd = socket(AF_INET,SOCK_STREAM,IPPROTO_TCP);
if(lisnfd < 0)
{
cout << "socket failed" << endl;
return 0;
}
struct sockaddr_in addr;
addr.sin_family = AF_INET;
addr.sin_port = htons(18989);
addr.sin_addr.s_addr = inet_addr("0.0.0.0");
int ret = bind(lisnfd,(struct sockaddr *)&addr,sizeof(addr));
Judge(ret);
ret = listen(lisnfd,5);
Judge(ret);
int epoll_handle = epoll_create(2);
Judge(epoll_handle);
struct epoll_event ee;
ee.events = EPOLLIN;
ee.data.fd = lisnfd;
ret = epoll_ctl(epoll_handle,EPOLL_CTL_ADD,lisnfd,&ee);
Judge(ret);
while(1)
{
struct epoll_event arr[MAXSIZE];
ret = epoll_wait(epoll_handle,arr,MAXSIZE,-1);
if(ret < 0)
{
cout << "epoll_wait failed" << endl;
return 0;
}
for(int i = 0; i < MAXSIZE; ++i)
{
if(arr[i].data.fd == lisnfd)
{
int sockfd = accept(lisnfd,NULL,NULL);
if(sockfd < 0)
{
cout << "accept failed" << endl;
continue;
}
struct epoll_event tmp;
tmp.events = EPOLLIN;
tmp.data.fd = sockfd;
ret = epoll_ctl(epoll_handle,EPOLL_CTL_ADD,sockfd,&tmp);
if(ret < 0)
{
cout << "epoll_ctl failed" << endl;
continue;
}
}
else
{
char buf[1024] = {0};
ssize_t recv_size = recv(arr[i].data.fd,buf,sizeof(buf)-1,0);
if(recv_size < 0)
{
cout << "recv failed" << endl;
continue;
}
else if(recv_size == 0)
{
cout << "Peer Shutdown" << endl;
epoll_ctl(epoll_handle,EPOLL_CTL_DEL,arr[i].data.fd,&arr[i]);
close(arr[i].data.fd);
continue;
}
else
cout << buf << endl;
}
}
}
close(lisnfd);
return 0;
}
客户端代码和上面select一样
运行结果:
首先,我们需要知道的是将epoll设置为ET模式,只需要在epoll_ctl的时候,将其对应的events设置为EPOLLET
即可。
我们使用epoll函数监控0号文件描述符,当要进行读取数据的时候,若epoll监控到该文件描述符就绪之后,则对缓冲区中的内容进行读操作,我们在这里规定一次读2个Byte的数据,而我们输入的数据则要大于2Byte。
首先来看LT模式下,它的运行情况:
#include
#include
#include
using namespace std;
int main()
{
int epoll_handle = epoll_create(2);
if(epoll_handle < 0)
{
cout << "epoll_create failed" << endl;
return 0;
}
struct epoll_event ee;
ee.events = EPOLLIN;
ee.data.fd = 0;
int ret = epoll_ctl(epoll_handle,EPOLL_CTL_ADD,0,&ee);
if(ret < 0)
{
cout << "epoll_ctl failed" << endl;
return 0;
}
while(1)
{
struct epoll_event arr[2];
ret = epoll_wait(epoll_handle,arr,2,-1);
if(ret < 0)
{
cout << "epoll_wait failed" << endl;
return 0;
}
for(int i = 0; i < 2; ++i)
{
if(arr[i].data.fd == 0)
{
char buf[3] = {0};
read(arr[i].data.fd,buf,sizeof(buf)-1);
cout << buf << endl;
}
}
}
return 0;
}
运行结果:
一次只读两个字节,当发现没有读完,则会立即重复的进行读,说明这里的epoll_wait会一直的进行通知。这也就说明在LT模式下,只要当前事件未处理完,则epoll函数会一直进行通知。
ET模式下的运行情况
#include
#include
#include
using namespace std;
int main()
{
int epoll_handle = epoll_create(2);
if(epoll_handle < 0)
{
cout << "epoll_create failed" << endl;
return 0;
}
struct epoll_event ee;
//设置对当前文件描述符的监控为可读事件和ET模式
ee.events = EPOLLIN | EPOLLET;
ee.data.fd = 0;
int ret = epoll_ctl(epoll_handle,EPOLL_CTL_ADD,0,&ee);
if(ret < 0)
{
cout << "epoll_ctl failed" << endl;
return 0;
}
while(1)
{
struct epoll_event arr[2];
ret = epoll_wait(epoll_handle,arr,2,-1);
if(ret < 0)
{
cout << "epoll_wait failed" << endl;
return 0;
}
for(int i = 0; i < 2; ++i)
{
if(arr[i].data.fd == 0)
{
char buf[3] = {0};
read(arr[i].data.fd,buf,sizeof(buf)-1);
cout << buf << endl;
}
}
}
return 0;
}
运行情况:
我们可以清晰的看到,ET模式下当对应事件就绪之后,不管有没有处理完,均只会通知一次,除非等待下一个事件进来才会再次进行通知,也就是说如果一次未处理完,在下一次处理的时候,要首先处理上次遗留下来的老数据。
ET模式问题的解决
ET模式所带来的问题就是如果不能一次将未处理的事件处理完,则会遗留老数据未进行处理,因此,我们只需要对代码进行控制,使其能够一次性将其处理完即可。
解决思路:
当第一次监控到文件描述符就绪之后,我们可以用一个循环来不停的读取缓冲区当中的值,直到读完为止,又因为文件描述符的读写默认属性是阻塞属性,因此,我们要将文件描述符的属性设置为非阻塞属性(调用
fcntl
函数)
这里也有需要注意的地方,当调用fcntl函数将文件描述符的属性设置为非阻塞属性时,每当进行读操作的时候,都会返回一个值,该值代表了读取的字节数,当它返回一个小于0的数时,不一定是读取失败了,而是有可能将数据读完了,这时候就看它返回的错误码,如果返回的错误是EAGAIN
或者EWOULDBLOCK
,则代表着将数据读完了。
代码如下:
#include
#include
#include
#include
using namespace std;
int main()
{
//设置文件描述符的读写属性为非阻塞属性
int flag = fcntl(0,F_GETFL);
if(flag < 0)
{
cout << "fcntl failed" << endl;
return -1;
}
//设置非阻塞属性
fcntl(0,F_SETFL,flag | O_NONBLOCK);
int epoll_handle = epoll_create(2);
if(epoll_handle < 0)
{
cout << "epoll_create failed" << endl;
return 0;
}
struct epoll_event ee;
//设置对当前文件描述符的监控为可读事件和ET模式
ee.events = EPOLLIN | EPOLLET;
ee.data.fd = 0;
int ret = epoll_ctl(epoll_handle,EPOLL_CTL_ADD,0,&ee);
if(ret < 0)
{
cout << "epoll_ctl failed" << endl;
return 0;
}
while(1)
{
struct epoll_event arr[2];
ret = epoll_wait(epoll_handle,arr,2,-1);
if(ret < 0)
{
cout << "epoll_wait failed" << endl;
return 0;
}
for(int i = 0; i < 2; ++i)
{
if(arr[i].data.fd == 0)
{
string res = "";
while(1)
{
char buf[3] = {0};
int t = read(arr[i].data.fd,buf,sizeof(buf)-1);
if(t < 0)
{ //注意:这里当返回值小于0的时候,不一定是发生了错误
//由于文件描述符是非阻塞属性,因此,每次读的时候都会返回一个值
//若返回的错误码是EAGAIN或者EWOULDBLOCK的时候,说明此时已经将缓冲区中的内容读完了
if(errno == EAGAIN || errno == EWOULDBLOCK)
break;
}
res += buf;
}
cout << res << endl;
}
}
}
return 0;
}
结果验证: