Linux网络设计之reactor网络模型及其应用

网络组件

  • 一、reactor编程介绍
    • 1、建立连接
    • 2、断开连接
    • 3、数据到达
    • 4、数据发送
    • reactor常见疑问
  • 二、reactor应用场景
    • 1、redis——使用单reator
      • (1)redis为什么使用单reactor?
      • (2)redis处理reactor框图
      • (3)redis对reactor的优化
      • (4)从reactor角度看redis源码
    • 2、memcached——多线程方式使用多个reator
      • (1)memcached为什么使用单reactor?
      • (2)memcached如何处理reactor?
      • (3)从reactor角度看memcached源码
    • 3、nginx——多进程方式使用多个reator
      • (1)解决"惊群"问题
      • (2)负载均衡

一、reactor编程介绍

reactor是将对IO的检测转换为对事件的处理,是一种异步事件机制。reactor会使用IO多路复用进行IO检测,IO多路复用器一般是:select、poll、epoll。
reactor大致逻辑:
(1)socket()创建一个套接字,listenfd;
(2)bind()、listen()配置listenfd,绑定和监听;
(3)listenfd注册读事件,交由epoll管理
(4)读事件触发,回调accept
(5)客户端连接clientfd组成读事件
(6)相关事件调用相关回调函数

1、建立连接

接收客户端连接。

//...
int epfd=epoll_create(1);//创建epoll对象

//...
int listenfd=socket(AF_INET,SOCK_STREAM,0);//创建套接字

//...
struct epoll_event ev;
ev.events=EPOLLIN;
epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev)//注册事件

//...
// 当触发listenfd的读事件,调用accept接收连接
struct sockaddr_in clientaddr;
socklen_t len=sizeof(clientaddr);
int clientfd=accept(listenfd,(struct sockaddr *)&clientaddr,&len);

struct epoll_event ev;
ev.events=EPOLLIN;
epoll_ctl(epfd,EPOLL_CTL_ADD,clientfd,&ev)//注册新连接的读事件

//...

连接第三方服务。

//...
int epfd=epoll_create(1);//创建epoll对象

//...
int fd=socket(AF_INET,SOCK_STREAM,0);//创建套接字

//...
struct sockaddr_in clientaddr;
socklen_t len=sizeof(clientaddr);
connect(fd,(struct sockaddr *)&clientaddr,&len);//连接服务

//...
struct epoll_event ev;
ev.events=EPOLLOUT;
epoll_ctl(epfd,EPOLL_CTL_ADD,fd,&ev)//注册事件

//...
// 当触发fd的写事件,连接建立成功
if(status==e_connecting && ev.events==EPOLLOUT)
{
	status=e_connected;
	epoll_ctl(epfd,EPOLL_CTL_DEL.fd,NULL);
}

//...

2、断开连接

//...
if(ev.events & EPOLLRDHUP)
{
	// 关闭服务器读端
	close_read(fd);
}
if(ev.events & EPOLLHUP)
{
	// 关闭服务器读写端
	close(fd);
}

//...

3、数据到达

// ...
if(ev.events & EPOLLIN)
{
	while(1)
	{
		int n=recv(clientfd,buffer,buffer_size,0);
		if(n<0)
		{
			if(errno==EINTR)
				continue;
			if(errno==EWOULDBLOCK)
				break;
			close(clientfd);
		}
		else if(n==0)
		{
			close_read();
		}
		else
		{
			// 处理业务
		}
	}
	// ...
}

// ...

4、数据发送

// ...
if(ev.events & EPOLLOUT)
{
	int n=send(clientfd,buffer,buffer_size,0);
	if(n<0)
	{
		if(errno==EINTR)
			continue;
		if(errno==EWOULDBLOACK)
		{
			struct epoll_event e;
			e.events=EPOLLOUT;
			epoll_ctl(epfd,EPOLL_CTL_ADD,clientfd,&e)//注册事件
			return;
			// break;
		}
		close(clientfd);
	}
	else if(n==buffer_size)
	{
		epoll_ctl(epfd,EPOLL_CTL_DEL,clientfd,NULL);
		// epoll_ctl(epfd,EPOLL_CTL_MOD,clientfd,&e);
	}
	// ...
}

//...

reactor常见疑问

1、epoll惊群
何为”惊群“?网络编程经常使用多线程、多进程模型,每个线程或进程中都有一个epoll对象,通过socket()、bind()、listen()生成的listenfd可能会给多个epoll对象管理,当一个accept到来时所有的epoll都收到通知,所有进程或线程同时响应这一事件,然而最终只有一个accept成功。这就是”惊群“。
2、水平触发和边沿触发
水平触发:当读缓冲区中有数据时,一直触发,直到数据被读完。
边沿触发:来一次事件触发一次。读写操作一般需要配合循环才能全部读写完成。
3、reactor为什么要搭配非阻塞IO?
主要是三方面原因:
(1)多线程环境下,一个listenfd会被多个epoll(IO多路复用器)对象管理,当一个连接到来时所有的epoll都收到通知,所有的epoll都会去响应,但最终只有一个accept成功;如果使用阻塞,那么其他的epoll将一直被阻塞着。所以最好使用非阻塞IO及时返回。
(2)边沿触发下,事件触发才会读事件,那么需要在一次事件循环中把缓冲区读空;如果使用阻塞模式,那么当读缓冲区的数据被读完后,就会一直阻塞住无法返回。
(3)select bug。当某个socket接收缓冲区有新数据分节到达,然后select报告这个socket描述符可读,但随后,协议栈检查到这个新分节检验和错误,然后丢弃了这个分节,这时调用recv/read则无数据可读;如果socket没有设置成nonblocking,此recv/read将阻塞当前线程。
4、IO多路复用一定要搭配非阻塞IO吗?
不是,也可以使用阻塞模式。比如MySQL使用select接收连接,然后一个连接使用一个线程进行处理;也可以使用一个系统调用先获取读缓冲区的字节数,然后读一次就把数据读完,但是这样就导致效率比较低。

int n=EVBUFFER_MAX_READ_DEFAULT;
ioctl(fd,FIONREAD,&n);//获取读缓冲区的数据字节数

二、reactor应用场景

使用单个reactor的场景和使用多个reactor的场景。使用多个reactor又有多线程和多进程的不同用法。

1、redis——使用单reator

redis是一种key-value结构、有丰富的数据结构、对内存进行操作的网络数据库组件。redis的命令处理是单线程的。

(1)redis为什么使用单reactor?

要理解redis为什么只使用单个reactor,需要明白redis的命令处理是单线程的
redis提供丰富的数据结构,对这些数据结构进行加锁非常复杂,所以redis使用单线程进行处理;因为使用单线程进行命令处理,核心业务逻辑是单线程,那么使用再多的reactor是无法处理过来的;所以,redis使用单个reactor。

另外,redis操作具体命令的时间复杂度比较低,更加没有必要使用多个reactor。

(2)redis处理reactor框图

redis
decode compute encode
reactor
acceptor
read
write
client

(3)redis对reactor的优化

对业务逻辑进行了优化,引入IO线程:
接收完数据后,将数据抛到IO线程进行处理;发送数据之前,将打包数据放在IO线程进行处理,再发送出去。参考上图,就是将(read+decode)放到线程中处理,将(encode+write)放在线程中处理。
原因:
对于单线程而言,当接收的数据或发送的数据过大时,会造成线程负载过大,需要引用多线程做IO数据处理。特别是解协议过程,数据庞大而且耗时,需要开一个IO线程进行处理。
场景例子:
客户端上传日志记录;客户端获取排行榜记录。

(4)从reactor角度看redis源码

创建一个epoll对象:

ae_poll.c
ae.c
server.c
调用
调用
调用
调用
aeApiCreate函数
epoll_create
aeCreateEventLoop函数
initServer函数
main函数

创建套接字,绑定监听:

anet.c
server.c
调用
调用
调用
调用
调用
调用
调用
调用
anetTcpServer函数
_anetTcpServer函数
socket
anetListen函数
bind
listen
initServer函数
main函数
listenToPort函数

listenfd放到epoll管理:

ae_epoll.c
ae.c
anet.c
networking.c
server.c
调用
调用
作为回调函数给到
调用
调用
调用
调用
设置
调用
调用
aeApiAddEvent函数
epoll_ctl
aeCreateFileEvent函数
设置回调函数aeFileProc*proc到结构体中
anetTcpAccept函数
anetGenericAccept函数
accept
acceptTcpHandler函数
initServer函数
main函数
createSocketAcceptHandler函数

监听事件:

ae_poll.c
ae.c
server.c
调用
调用
调用
调用
aeApiPoll函数
epoll_wait
aeMain函数
aeProcessEvents函数
main函数

处理事件:

ae_poll.c
ae.c
server.c
调用
调用
调用
调用
调用
调用
返回
aeApiPoll函数
aeMain函数
aeProcessEvents函数
读事件回调函数
clientfd
写事件回调函数
其他事件回调函数
main函数

为clientfd注册读事件:

ae_epoll.c
ae.c
anet.c
connection.c
connection.h
networking.c
调用
返回值传入
调用
作为回调函数传入
调用
调用
调用
调用
调用
返回
传入
调用
设置
调用
调用
aeApiAddEvent函数
epoll_ctl
aeCreateFileEvent函数
设置回调函数aeFileProc*proc到结构体中
anetTcpAccept函数
anetGenericAccept函数
accept
clientfd
connSocketSetReadHandler函数
connSetReadHandler函数
读事件回调函数set_read_handler
ConnectionType
acceptCommonHandler函数
acceptTcpHandler函数
connCreateAcceptedSocket函数
createClient函数
readQueryFromClient函数

2、memcached——多线程方式使用多个reator

memcached是一种key-value结构、对内存进行操作的网络数据库组件。memcached的命令处理是多线程的。
memcached需要libevent,libevent就是一个事件驱动库,memcached对于网络上的使用都是基于libevent的。

(1)memcached为什么使用单reactor?

memcached的key-value结构不像redis支持丰富的数据结构,它的value使用的数据结构相对简单,加锁也就相对容易。因此,可以引入多线程,提高效率。

(2)memcached如何处理reactor?

memcached主线程会有一个reactor,主要负责接收连接;接收完连接后,经过负载均衡,通过pipe(管道)告诉子线程的reactor,将客户端的fd交由该线程的reactor管理;每个线程处理相对应的业务逻辑。

memcached
pipe
pipe
pipe
pipe
pipe
decode compute encode
pipe
decode compute encode
pipe
decode compute encode
reactor
acceptor
reactor#1
reactor#2
reactor#3
reactor#...
#1read
#1write
#2read
#2write
#3read
#3write
client

(3)从reactor角度看memcached源码

github上下载最新的memcached。
开始源码分析
创建套接字,绑定监听:

nmemcached.c
调用
调用
调用
调用
socket
server_socket函数
new_socket函数
bind
listen

注册listenfd读事件:

nmemcached.c
调用
作为参数
作为参数
调用
调用
调用
作为参数
调用
调用
conn_new函数
server_socket函数
struct_event_base*main_base
状态conn_listening
event_set
event_base_set
event_add
回调函数event_handler
drive_machine函数
accept

分配clientfd到具体的线程中,添加读事件:

thread.c
nmemcached.c
调用
调用
调用
非settings.num_napi_ids时调用
settings.num_napi_ids时调用
调用
调用
调用
dispatch_conn_new函数
select_thread_round_robin函数负载均衡
select_thread_by_napi_id函数负载均衡
放到队列中
cq_push函数
notify_worker函数
write函数
update_event
drive_machine函数
其他业务处理函数

3、nginx——多进程方式使用多个reator

nginx可以反向代理,利用多进程处理业务。
master会创建listenfd,并bind和listen;fork出多个进程,每个进程都有一个自己的epoll对象,listenfd交由多个epoll对象管理。这时会有惊群现象,需要处理;通过负载均衡处理事件。

nginx
master
child
fork
fork
fork
fork
decode compute encode
reactor
acceptor
read
write
worker#1
master
worker#2
worker#3
worker#...
client

(1)解决"惊群"问题

加锁方式。nginx会开辟一个共享内存,把锁放在共享内存当中,多个进程去争夺这把锁,争夺到锁的才能进行接受连接。

(2)负载均衡

定义一个进程最大的连接数,当连接数量超过总连接数量的7/8时,该进程就会暂停接受连接,将机会留个其他进程。
这样不会让一个进程拥有过多的连接,而其他进程连接数量过少;从而使每个进程的连接数量相对平衡。
当所有的进程接受连接的数量都达到总连接数量的7/8时,这是nginx接受连接将变得很缓慢。
Linux网络设计之reactor网络模型及其应用_第1张图片

你可能感兴趣的:(Linux网络设计,linux,redis,memcached,nginx,后端)