IO多路复用是一个非常有用的技术,它允许单个线程/进程同时监视和管理多个IO描述符。它特别适用于那些需要处理大量并发套接字连接的场景,例如Web服务器、数据库服务器或其他网络应用。IO多路复用使得应用程序可以在等待数据时不被阻塞,并在数据到达时立即进行处理。
阻塞与非阻塞IO:
同步与异步IO:
IO多路复用的核心是使用一个系统调用来监视多个文件描述符,看看哪些文件描述符准备好进行读或写操作。有几种主要的IO多路复用技术:
考虑一个网络应用,如Web服务器。在最简单的情况下,服务器每接受一个连接就会创建一个新的进程或线程来处理。但这种方法在高并发的环境下会导致资源极大的浪费。
而IO多路复用的工作原理如下:
select
、poll
或epoll
等系统调用,来同时监视多个文件描述符。优点:
epoll
。限制:
epoll
只在Linux上可用。IO多路复用是处理大量并发网络连接的强大技术。尽管其编程复杂度较高,但考虑到其在高并发环境下的性能和效率,它仍然是许多网络应用的首选技术。
select()
是一个经典的多路复用I/O函数,用于监控多个文件描述符(通常是套接字描述符)以查看其是否准备好进行读、写或是否有异常条件待处理。其主要应用是在网络编程中,特别是当应用程序需要处理多个并发连接或多个I/O流时。
#include
int select(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, struct timeval *timeout);
nfds
: 用于指定要检查的文件描述符的范围,具体而言,是要检查的最大文件描述符值加1。readfds
: 一个文件描述符集,应用程序希望知道它们是否准备好读。writefds
: 一个文件描述符集,应用程序希望知道它们是否准备好写。exceptfds
: 一个文件描述符集,应用程序希望知道上面是否有异常发生。timeout
: 指定select()
函数等待的最长时间。如果设置为NULL,则函数会一直等待,直到某个描述符准备好。fd_set
是一个集合数据类型,专门用于select()
。以下是与其相关的一些宏:
FD_ZERO(fd_set *set)
: 清除文件描述符集。FD_SET(int fd, fd_set *set)
: 将一个文件描述符添加到集合中。FD_CLR(int fd, fd_set *set)
: 从集合中删除一个文件描述符。FD_ISSET(int fd, fd_set *set)
: 检查文件描述符是否在集合中。readfds
、writefds
和exceptfds
来指示select()
要监控哪些文件描述符。select()
函数。select()
函数会阻塞,直到以下条件之一满足:
select()
返回后,应用程序可以检查readfds
、writefds
和exceptfds
来确定哪些文件描述符已经准备好,并进行相应的操作。select()
的优点和缺点优点:
缺点:
fd_set
大小是固定的,这限制了select()
可以处理的最大描述符数量。select()
会在下次调用时再次返回这个描述符,可能导致无效的select()
唤醒。尽管如此,select()
仍然广泛应用于很多应用程序中,尤其是在早期的网络编程中。现代系统可能更倾向于使用其他的多路复用机制,如poll()
、epoll()
(Linux)或kqueue()
(BSD)。
本例使用select()实现了一个Hello服务器。当客户端连接并发送数据时,无论发送什么请求,服务器都会回应一个简单的 “Hello, World!” HTTP响应。
#include
#include
#include
#include
#include
#include
#include
#define PORT 8080
#define BUFFER_SIZE 2048
#define MAX_CLIENTS 5
const char *HTTP_RESPONSE = "HTTP/1.1 200 OK\r\n"
"Content-Type: text/plain\r\n"
"Content-Length: 13\r\n"
"Connection: close\r\n\r\n"
"Hello, World!";
int main() {
int server_socket, client_socket, max_sd, sd, activity;
int client_sockets[MAX_CLIENTS] = {0};
struct sockaddr_in server_address, client_address;
socklen_t client_len;
char buffer[BUFFER_SIZE];
fd_set read_fds;
server_socket = socket(AF_INET, SOCK_STREAM, 0);
if (server_socket == -1) {
perror("Could not create socket");
exit(1);
}
server_address.sin_family = AF_INET;
server_address.sin_addr.s_addr = INADDR_ANY;
server_address.sin_port = htons(PORT);
if (bind(server_socket, (struct sockaddr *)&server_address, sizeof(server_address)) == -1) {
perror("Bind failed");
exit(1);
}
if (listen(server_socket, 3) == -1) {
perror("Listen failed");
exit(1);
}
printf("Waiting for connections on port %d...\n", PORT);
while (1) {
FD_ZERO(&read_fds);
FD_SET(server_socket, &read_fds);
max_sd = server_socket;
for (int i = 0; i < MAX_CLIENTS; i++) {
sd = client_sockets[i];
if (sd > 0)
FD_SET(sd, &read_fds);
if (sd > max_sd)
max_sd = sd;
}
activity = select(max_sd + 1, &read_fds, NULL, NULL, NULL);
if ((activity < 0) && (errno != EINTR)) {
perror("Select error");
}
if (FD_ISSET(server_socket, &read_fds)) {
client_len = sizeof(client_address);
client_socket = accept(server_socket, (struct sockaddr *)&client_address, &client_len);
if (client_socket < 0) {
perror("Accept error");
exit(1);
}
printf("New connection from %s:%d\n", inet_ntoa(client_address.sin_addr), ntohs(client_address.sin_port));
for (int i = 0; i < MAX_CLIENTS; i++) {
if (client_sockets[i] == 0) {
client_sockets[i] = client_socket;
break;
}
}
}
for (int i = 0; i < MAX_CLIENTS; i++) {
sd = client_sockets[i];
if (FD_ISSET(sd, &read_fds)) {
int read_size = recv(sd, buffer, sizeof(buffer), 0);
if (read_size == 0) {
getpeername(sd, (struct sockaddr*)&client_address, &client_len);
printf("Client disconnected: %s:%d\n", inet_ntoa(client_address.sin_addr), ntohs(client_address.sin_port));
close(sd);
client_sockets[i] = 0;
} else {
send(sd, HTTP_RESPONSE, strlen(HTTP_RESPONSE), 0);
// buffer[read_size] = '\0';
// send(sd, buffer, strlen(buffer), 0);
}
}
}
}
close(server_socket);
return 0;
}
此例子创建了一个服务器,使用select()
来监视连接请求和客户端的数据。当一个新的客户端连接到服务器时,它将该客户端的套接字加入到客户端套接字数组中。当客户端发送数据时,服务器会返回"Hello, World!" HTTP响应。当客户端断开连接时,它将该客户端的套接字从数组中删除。
另起一个终端,使用curl发送HTTP请求,会看到服务器返回的HTTP响应:
$ curl http://localhost:8080
Hello, World!
poll()
函数是另一个多路复用I/O工具,用于监视多个文件描述符以查看其是否准备好进行读、写或是否有异常条件待处理。与select()
相比,poll()
提供了更好的可扩展性,尤其是在处理大量文件描述符时。
#include
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
fds
: 是一个指向pollfd
结构数组的指针,该结构包含了要监视的文件描述符的信息。nfds
: 是fds
数组中的项数。timeout
: 以毫秒为单位的等待超时。如果为-1,poll()
将无限等待。pollfd
结构该结构定义在
头文件中,包含以下字段:
struct pollfd {
int fd; /* 文件描述符 */
short events; /* 要监视的事件 */
short revents; /* 实际发生的事件 */
};
fd
: 要监视的文件描述符。events
: 要监视的事件的位掩码。可以是以下值的组合:
POLLIN
: 数据可读。POLLOUT
: 数据可写。POLLERR
: 错误条件。POLLHUP
: 挂起。POLLNVAL
: 描述符不是一个打开的文件。revents
: 输入/输出参数,当poll()
返回时,系统将设置此字段以指示哪些事件实际发生。pollfd
结构数组,设置要监控的文件描述符和事件。poll()
函数。poll()
函数阻塞,直到以下条件之一满足:
poll()
返回后,应用程序可以检查pollfd
结构中的revents
字段,以确定哪些文件描述符已经准备好并进行相应的操作。poll()
的优点和缺点优点:
select()
相比,poll()
不受固定大小的文件描述符集的限制。poll()
提供了更直观的接口,可以明确地为每个文件描述符指定所需的事件。缺点:
poll()
可以处理任意数量的文件描述符,但它必须遍历整个文件描述符列表,这可能导致效率问题。epoll
)相比,poll()
的性能可能不如它们。总的来说,poll()
提供了一种比select()
更灵活的方法来监视文件描述符的多路复用,但在处理大量活跃连接时,可能还需要考虑使用更高级的多路复用技术。
以下是使用poll()
的简单例子,这个例子同样是一个HELLO服务器。
#include
#include
#include
#include
#include
#include
#define PORT 8080
#define BUFFER_SIZE 2048
#define MAX_CLIENTS 5
const char *HTTP_RESPONSE = "HTTP/1.1 200 OK\r\n"
"Content-Type: text/plain\r\n"
"Content-Length: 13\r\n"
"Connection: close\r\n\r\n"
"Hello, World!";
int main() {
int server_socket, client_socket;
struct sockaddr_in server_address, client_address;
socklen_t client_len;
char buffer[BUFFER_SIZE];
struct pollfd fds[MAX_CLIENTS + 1];
server_socket = socket(AF_INET, SOCK_STREAM, 0);
if (server_socket == -1) {
perror("Could not create socket");
exit(1);
}
server_address.sin_family = AF_INET;
server_address.sin_addr.s_addr = INADDR_ANY;
server_address.sin_port = htons(PORT);
if (bind(server_socket, (struct sockaddr *)&server_address, sizeof(server_address)) == -1) {
perror("Bind failed");
exit(1);
}
if (listen(server_socket, 3) == -1) {
perror("Listen failed");
exit(1);
}
printf("Waiting for connections on port %d...\n", PORT);
fds[0].fd = server_socket;
fds[0].events = POLLIN;
for (int i = 1; i <= MAX_CLIENTS; i++) {
fds[i].fd = -1; // initially all clients are -1
}
while (1) {
int activity = poll(fds, MAX_CLIENTS + 1, -1); // infinite timeout
if (activity < 0) {
perror("Poll error");
continue;
}
if (fds[0].revents & POLLIN) {
client_len = sizeof(client_address);
client_socket = accept(server_socket, (struct sockaddr *)&client_address, &client_len);
if (client_socket < 0) {
perror("Accept error");
continue;
}
printf("New connection from %s:%d\n", inet_ntoa(client_address.sin_addr), ntohs(client_address.sin_port));
for (int i = 1; i <= MAX_CLIENTS; i++) {
if (fds[i].fd == -1) {
fds[i].fd = client_socket;
fds[i].events = POLLIN;
break;
}
}
}
for (int i = 1; i <= MAX_CLIENTS; i++) {
if (fds[i].fd == -1) continue;
if (fds[i].revents & POLLIN) {
int read_size = recv(fds[i].fd, buffer, sizeof(buffer), 0);
if (read_size == 0) {
getpeername(fds[i].fd, (struct sockaddr*)&client_address, &client_len);
printf("Client disconnected: %s:%d\n", inet_ntoa(client_address.sin_addr), ntohs(client_address.sin_port));
close(fds[i].fd);
fds[i].fd = -1; // mark this client as -1 again
} else {
send(fds[i].fd, HTTP_RESPONSE, strlen(HTTP_RESPONSE), 0);
// buffer[read_size] = '\0';
// send(fds[i].fd, buffer, strlen(buffer), 0);
}
}
}
}
close(server_socket);
return 0;
}
此代码创建了一个服务器,使用poll()
来监视连接请求和来自客户端的数据。当客户端连接到服务器时,它会将其套接字添加到poll()
的监视数组中。当客户端发送数据时,服务器会返回"Hello, World!" HTTP响应。当客户端断开连接时,它会将该套接字从监视数组中删除。
另起一个终端,使用curl发送HTTP请求,会看到服务器返回的HTTP响应:
$ curl http://localhost:8080
Hello, World!
epoll
是Linux特有的I/O多路复用机制,提供了更高效的方式来监视多个文件描述符的活动。与传统的select()
和poll()
不同,epoll
使用一个事件驱动的方式,只返回那些真正活跃的文件描述符,而不是检查每个文件描述符的状态。这使得epoll
在处理大量文件描述符时具有很高的效率。
int epoll_create(int size);
虽然这个函数有一个size
参数,但在较新的Linux版本中,它实际上并没有用处,只是为了向后兼容。
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epfd
: 由epoll_create()
返回的epoll实例的文件描述符。op
: 操作类型,可以是以下值:EPOLL_CTL_ADD
(添加)、EPOLL_CTL_MOD
(修改)或EPOLL_CTL_DEL
(删除)。fd
: 要操作的文件描述符。event
: 指向epoll_event
结构的指针,描述了fd
上的感兴趣的事件和如何返回它。int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
epfd
: 由epoll_create()
返回的epoll实例的文件描述符。events
: 用于返回活跃事件的epoll_event
结构数组。maxevents
: events
数组的大小。timeout
: 超时(以毫秒为单位)。-1表示无限等待。struct epoll_event {
uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};
events
: 是一个位集,指示感兴趣的事件和返回的事件,例如:EPOLLIN
、EPOLLOUT
、EPOLLERR
等。data
: 是一个联合体,可以包含用户定义的数据,如文件描述符、指针等。epoll_ctl()
向实例中添加或修改文件描述符及其相关的事件。epoll_wait()
等待事件发生。epoll_wait()
返回时,处理活跃的事件。select
和poll
相比,epoll
可以处理大量的并发连接。epoll
只关心活跃的文件描述符,而不是每次都检查所有的文件描述符。select
的FD_SETSIZE限制不同,epoll
的限制通常由系统的最大文件描述符数量决定。epoll
是Linux特有的,不可移植到其他UNIX系统或Windows。总的来说,epoll
是Linux下高并发服务器应用的理想选择,它解决了select
和poll
在大量活跃连接时的性能瓶颈问题。
以下是使用epoll()
的简单例子,这个例子还是HELLO服务器。
#include
#include
#include
#include
#include
#include
#define PORT 8080
#define BUFFER_SIZE 2048
#define MAX_EVENTS 10
const char *HTTP_RESPONSE = "HTTP/1.1 200 OK\r\n"
"Content-Type: text/plain\r\n"
"Content-Length: 13\r\n"
"Connection: close\r\n\r\n"
"Hello, World!";
int main() {
int server_socket, client_socket;
struct sockaddr_in server_address, client_address;
socklen_t client_len;
char buffer[BUFFER_SIZE];
int epoll_fd = epoll_create1(0);
if (epoll_fd == -1) {
perror("epoll_create1");
exit(EXIT_FAILURE);
}
server_socket = socket(AF_INET, SOCK_STREAM, 0);
if (server_socket == -1) {
perror("Could not create socket");
exit(1);
}
server_address.sin_family = AF_INET;
server_address.sin_addr.s_addr = INADDR_ANY;
server_address.sin_port = htons(PORT);
if (bind(server_socket, (struct sockaddr *)&server_address, sizeof(server_address)) == -1) {
perror("Bind failed");
exit(1);
}
if (listen(server_socket, 10) == -1) {
perror("Listen failed");
exit(1);
}
printf("Waiting for connections on port %d...\n", PORT);
struct epoll_event ev, events[MAX_EVENTS];
ev.events = EPOLLIN;
ev.data.fd = server_socket;
if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, server_socket, &ev) == -1) {
perror("epoll_ctl: server_socket");
exit(EXIT_FAILURE);
}
while (1) {
int nfds = epoll_wait(epoll_fd, events, MAX_EVENTS, -1);
if (nfds == -1) {
perror("epoll_wait");
exit(EXIT_FAILURE);
}
for (int n = 0; n < nfds; ++n) {
if (events[n].data.fd == server_socket) {
client_socket = accept(server_socket, (struct sockaddr *)&client_address, &client_len);
if (client_socket == -1) {
perror("accept");
continue;
}
printf("New connection from %s:%d\n", inet_ntoa(client_address.sin_addr), ntohs(client_address.sin_port));
ev.events = EPOLLIN;
ev.data.fd = client_socket;
if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, client_socket, &ev) == -1) {
perror("epoll_ctl: client_socket");
exit(EXIT_FAILURE);
}
} else {
int read_size = recv(events[n].data.fd, buffer, sizeof(buffer), 0);
if (read_size <= 0) {
if (read_size == 0) { // client disconnected
printf("Client disconnected\n");
} else {
perror("recv");
}
close(events[n].data.fd); // close the client socket
} else {
send(events[n].data.fd, HTTP_RESPONSE, strlen(HTTP_RESPONSE), 0);
// buffer[read_size] = '\0';
// send(events[n].data.fd, buffer, strlen(buffer), 0);
}
}
}
}
close(server_socket);
return 0;
}
此代码创建了一个服务器,使用epoll()
来监听连接请求和来自客户端的数据。当客户端连接到服务器时,它会将其套接字添加到epoll()
的监视集中。当客户端发送数据时,服务器会返回"Hello, World!" HTTP响应。当客户端断开连接时,服务器会将该套接字从epoll()
的监视集中删除。
另起一个终端,使用curl发送HTTP请求,会看到服务器返回的HTTP响应:
$ curl http://localhost:8080
Hello, World!
有关curl命令的详细使用,请读者移步到:Linux- curl命令
有关网络编程的常用函数使用方法,请读者移步到:Linux- 网络编程初探