小杰312

网络编程实战之高级篇, 彻底解决面试C10k问题, 高并发服务器, IO多路复用, 同时监视多个IO事件

一.前言

网络入门篇，从操作系统的层次推开网络大门

网络入门基础模型, 网络大体框架， TCP/IP协议栈, 各种局域网和广域网刨析 (以图解的方式推开网络大门)_小杰312的博客-CSDN博客网络入门基础模型, 网络大体框架， TCP/IP协议栈, 各种局域网和广域网刨析https://blog.csdn.net/weixin_53695360/article/details/122989709?spm=1001.2014.3001.5502

网络基础之三次握手四次分手. HTTP协议刨析(理解着图解着学习) 面试官都惊讶了你的网络功底

一篇文章帮你拿下面试八股文之网络三次握手四次挥手， HTTP超文本传输协议重点理论刨析到实现简单的HTTP服务, 思考着图解着学习网络 (咱不死记硬背)_小杰312的博客-CSDN博客一篇文章帮你拿下面试八股文之网络三次握手四次挥手， HTTP超文本传输协议，思考着图解着学习网络 (咱不死记硬背)https://blog.csdn.net/weixin_53695360/article/details/123189672?spm=1001.2014.3001.5502

网络编程实战基础篇

TCP网络编程模型从入门到实战基础篇,单服务器单个用户非并发版本_小杰312的博客-CSDN博客文章目录前言一、网络编程实践的必备基础知识二、系统调用方法刨析1.socket2.bind3.listen4.accept5.connect三、实现一个简单的功能, 服务器将单客户端传来的小写字母转成大写总结以及留下疑问讨论解决办法前言本文仅仅针对对于学校学习网络编程之后不知道如何运用的情况, 本章学习可以收获的是最为基本的 TCP 模型的掌握编程模型图:一、网络编程实践的必备基础知识ip地址(32位地址) : ...https://blog.csdn.net/weixin_53695360/article/details/122754482?spm=1001.2014.3001.5502

网络编程实战的中级篇(并发服务器的引入)

TCP网络编程模型从入门到实战中等篇,单服务器多个用户的简单并发版本, 从多进程到多线程到线程池版本服务器实现...直到最终解决面试经典C10k高并发服务器设计_小杰312的博客-CSDN博客TCP网络编程模型从入门到实战中等篇,单服务器多个用户的简单并发版本, 从多进程到多线程到线程池版本服务器实现...直到最终解决面试经典C10k高并发服务器设计https://blog.csdn.net/weixin_53695360/article/details/122790450?spm=1001.2014.3001.5502

二.IO多路复用的理解

提出问题：在进行socket套接字编程中, 很多方法都是阻塞式的, 需要等待IO事件的到来, 像是accept 这是一个典型的阻塞函数, 如果没有IO到来. 你却把整个应用程序给阻塞起来等待IO的到来, 这就是对于CPU一个极大的浪费
解决办法: IO多路复用, 对于整个应用程序中所有IO事件是否发生的一种监视, 多路IO地理解, 就是可以同时监视多个文件地IO事件地发生, 复用就是复用主线程或者说是一个进程, 也就是在一个进程中处理多个IO事件。。。。
eg ：我们可以同时监视标准输入和socket IO事件地发生, 正常来说一旦直接进行accept挂起等待socket IO事件，就无法接收其他地IO事件了, 但是IO多路复用可以使得一个进程既可以监视socket IO 也可监视标准输入了

上述说法是借鉴于盛延敏地网络编程实战地说法,极客时间中

多路复用多路转接简单理解其实就是在一个进程中同时处理多个IO事件，或者说处理一个fds集合，处理多个IO的方式存在如下两种

轮询式解决：select和poll的本质都是一次并发处理多个IO事件，但是IO事件的解决上还是采取的轮询遍历对应的 fds集合的方式进行的处理, 因为轮询, 所以效率上不算很好, O(n)...看似是一次解决了多个IO事件, 其实本质上不过是在一段时间内轮询处理了多个IO事件, 之所以我们看起来像是同时并行处理似的, 是因为处理时间及短, 所以看起来就像同时处理一样.
中断式解决: 和上述的select和poll相比epoll采取提前注册监视事件的方式, 不需要再进行轮询，来了IO事件就会提示，执行相应的处理

IO事件地真正监视者其实是操作系统内核, 所以我们地这些系统调用select poll 还有 epoll其实都是需要进入内核态，然后由内核检测IO事件是否发生地.

图解多种类型IO 在从数据报地准备层次上再去理解一下IO多路复用， IO多路转接

阻塞式IO请求调用函数,如果IO没有到位会一直阻塞应用程序等待IO数据报满足再拷贝回到用户空间进行处理

非阻塞IO请求，不会阻塞等待IO，而是直接返回采取定期轮询地方式来不停调用非阻塞函数, 直到数据报准备好拷贝回到用户空间进行处理，在没有准备好之前地调用返回地同时会设置errno = EAGAIN或说EWOULDBLOCK

上述地select 或者poll epoll 同时监视多个IO, 只要存在满足就触发对应地IO事件发生..

IO多路转接: 虽然从流程图上看起来和阻塞IO类似. 实际上最核心在于IO多路转接能够同时等待多个文件描述符的就绪状态

三.IO多路复用的发展

select
函数刨析详解:

上述集合地底层其实是一个位图, 加入到集合中也就是将对应位置为1, 从集合中清除, 也就是将对应位置为0. 位图就是一堆二进制位, 如果这个事件被触发了就对应地会被内核对应地在位图的相应位置上标记为1. 使用位图中的对应位标识监视的文件描述符.

FD_ISSET用来判断fd是否在集合中, 其实就是判断fd对应位上是不是1, 如果是1 说明这个fd对应的IO事件被触发了。。。
return val : 成功返回文件描述符中状态发生变化的个数, 失败返回-1

//常见程序片段
fs_set readset;
//定义监视文件描述符集合
FD_SET(fd,&readset);
//添加需要监视事件
select(fd+1,&readset,NULL,NULL,NULL);
//阻塞监视所有IO(内核监视修改rfds)
if(FD_ISSET(fd,readset)){……}
//判断IO事件触发,执行IO处理

小案例测试1: 先简单地监视一下标准输入...

#include 
#include 
#include 
#include 
#include 

#define ERR_EXIT(m) \
	do { perror(m); close(EXIT_FAILURE); } while(0)

int main() {
	//第一步定义读事件描述符集合
	fd_set rfds;
	int ret;
	FD_ZERO(&rfds);//清零rfs集合
	FD_SET(0, &rfds);//添加标准输入的监视
	ret = select(1, &rfds, NULL, NULL, NULL); //最大的监视描述符 + 1 监视读取集合, 写集合 异常集合, 设置延迟
	if (ret == -1) {
		ERR_EXIT("select()");
	} else if (ret) {
		char buff[100] = {0};
		read(0, buff, sizeof(buff) - 1);
		printf("Data is available now.\n");//标准输入读取有动静了, 数据准备好了已经
		printf("input: %s\n", buff);
	} else {
		printf("No Data\n");
	}
	return 0;
}

案例2：实现一下基于select地并发服务器.. 服务器功能, 将客户端传过来的小写字符转成大写输出。服务端代码如下:

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

#define ERR_EXIT(m) \
	do { perror(m); close(EXIT_FAILURE); } while(0)
typedef struct sockaddr SA;
const int BUFFSIZE = 1024;

int CreateSocket() {
	struct sockaddr_in serveAdd;
	int listenfd;
	if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
		ERR_EXIT("socket");
	}
	int reuse = 1;
	//设置允许冲用本地端口和地址
	if (setsockopt(listenfd, SOL_SOCKET,  SO_REUSEADDR, &reuse, sizeof(reuse)) == -1) {
		ERR_EXIT("setsockopt");
	}
	bzero(&serveAdd, sizeof(serveAdd));
	serveAdd.sin_family = AF_INET;
	serveAdd.sin_port = htons(12345);
	serveAdd.sin_addr.s_addr = htonl(INADDR_ANY);
	if (bind(listenfd, (SA*)&serveAdd, sizeof(serveAdd)) == -1) {
		ERR_EXIT("bind");
	}
	if (listen(listenfd, 5) == -1) {
		ERR_EXIT("listen");
	}
	return listenfd;
}

int main() {
	fd_set rfds;//定义读事件描述符集合
	char buff[BUFFSIZE] = {0};

	int listenfd = CreateSocket();

	set fdset;//保存所有文件描述符.
	fdset.insert(listenfd);
	while (1) {
		//因为select内核每一次会对于rfds做出改变, 所以每一次都需要重新设置rfds
		FD_ZERO(&rfds);
		for (int fd : fdset) {
			FD_SET(fd, &rfds);
		}
		int ret = select(*fdset.rbegin() + 1, &rfds, NULL, NULL, NULL);
		if (ret > 0) {
			for (int fd : fdset) {
				if (fd == listenfd && FD_ISSET(fd, &rfds)) {
					//来了新的连接
					struct sockaddr_in clientAdd;
					socklen_t clientLen = sizeof(clientAdd);
					int connfd = accept(fd, (SA*)&clientAdd, &clientLen);
					if (connfd == -1) {
						ERR_EXIT("accept");
					}
					//将新的文件描述符加入到描述符集合和读事件描述符集合中
					fdset.insert(connfd);
					FD_SET(connfd, &rfds);
					printf("create connection fd: %d\n", connfd);
				} else if (FD_ISSET(fd, &rfds)) {
					//说明是客户端发送的IO来了
					int read_size = recv(fd, buff, sizeof(buff) - 1, 0);
					if (read_size < 0) {
						ERR_EXIT("recv");
					} 
					if (read_size == 0) {//客户端断开连接了
						FD_CLR(fd, &rfds);
						fdset.erase(fd);
						printf("delete connection fd: %d\n", fd);
						close(fd);//关闭连接
					} else {//正常收到数据
						for (char& ch : buff) {
							ch = toupper(ch);
						}
						send(fd, buff, read_size, 0);
					}
				}
			}
		} else {
			ERR_EXIT("select");
		}
	}
	return 0;
}

select小结:

select实现多路复用存在两次描述符集合的遍历, 第一次是调用select将描述符拷贝进入到内核中让内核进行检测IO事件的发生, 内核检测的方式就是遍历一遍描述符集合, 然后修改描述符集合中的发生IO状态变化的文件描述符的对应位. 将对应位图中的位标记为1, 表示IO事件触发，然后select函数返回, 在用户态, 还是需要一次遍历检测被触发的IO事件然后执行对应的IO处理代码块...

所以使用select会需要两次的文件描述符集合的遍历, 还会存在两次拷贝, 用户拷贝到内核空间，内核拷贝会用户态, 存在效率上的不足, 而且文件描述符数量还存在限制, 一般是默认最多1024个

对于需要检测监视的IO事件对应的所有描述符我们需要额外进行存储

原因1 : 每一次调用select之后内核都会对于fds进行一个修改, 所以每一次从新调用select监视之前我们都需要重新向fds中加入所有需要监视的文件描述符, 所以需要一个容器存储需要监视的文件描述符号

原因2 : 我们需要获取需要监视的所有描述符数量，就是maxFd + 1, 故而也需要存在所有的fd, 为了更快的获取maxFd 我采取了使用set容器存储所有的fd, 底层是一颗红黑树, 获取maxFd的效率高，直接就是 *fdset.rbegin(); 当然使用数组存储也是OK的

编程模型如下:

创建fd_set ，和一个存储所有描述符号的容器

初始化最初需要监视的文件描述符, 加入到fd_set中同步添加到容器中

循环不断地进行 r = select();

根据select地返回值 r 来判断是否存在事件地触发

if ( r < 0) { 出错了；}

else if (r == 0) {设置了延时, 轮询时间，在延时期间没有IO时间被触发 }

else {判断处理触发地IO事件, 不同地IO事件存在不同地处理方式 (判断处理) }

poll
函数刨析

不同与select使用三个位图来表示三个fdset的方式，poll使用一个pollfd的指针实现.

timeout设置为-1 就会永久阻塞, 直到有事件发生, 设置为0 是立刻返回
将IO检测的结果放在revents中, 所以我们判断是否触发IO事件的时候, 是通过&revents判断的

事件判断地代码片段:

if (fds[i].revents & POLLIN) {
//通过&地方式判断事件地类型,读写还是其他的紧急呀啥的
}

小小案例1：使用poll监视标准输入

#include 
#include 
#include 
#include 
#include 
#include 

int fdNum = 0;//存储当前描述符数目, 方便遍历
int main() {
	//1.创建pollfd结构体数组
	struct pollfd fds[100]; 
	//2.设置需要监视的描述符
	fds[0].fd = 0;//监视标准输入
	fds[0].events = POLLIN;
	fdNum++;
	char buff[256] = {0};
	//3.开始监视
	while (1) {
		int r = poll(fds, fdNum, 1000);//0表示一直阻塞,而不是定时轮询
		if (r) {
			//说明存在事件触发
			if (fds[0].revents & POLLIN) {
				memset(buff, 0, sizeof(buff));
				int n = read(0, buff, sizeof(buff) - 1);
				buff[n] = 0;
				printf("检测到标准输入: %s\n", buff);
			}
    } else if (r == 0) {
      printf("time out\n");//超时
      continue;
    } else {
			printf("No Data\n");
		}
	}
	return 0;
}

案例2: 基于poll实现一个简易的服务端, 还是老规矩将客户端传过来的字符转成大写写回.

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

#define ERR_EXIT(m) \
	do { perror(m); close(EXIT_FAILURE); } while (0)
typedef struct sockaddr SA;
#define BUFSIZE 256
#define CLIENTSIZE 100
#define SERVE_PORT 12345 


int CreateSocket() {
	int listenfd;
	struct sockaddr_in serveAdd;
	//创建套接字
	if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
		ERR_EXIT("socket");
	}
	int reuseaddr = 1;

	//设置可以复用端口地址
	if (setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &reuseaddr, sizeof(reuseaddr)) == -1) {
		ERR_EXIT("setsockopt");
	}

	//设置协议地址簇
	bzero(&serveAdd, sizeof(serveAdd));
	serveAdd.sin_family = AF_INET;
	serveAdd.sin_port = htons(SERVE_PORT);
	serveAdd.sin_addr.s_addr = htonl(INADDR_ANY);
	//绑定本地端口地址
	if (bind(listenfd, (SA*)&serveAdd, sizeof(serveAdd)) == -1) {
		ERR_EXIT("bind");
	}
	//监听
	if (listen(listenfd, 5) == -1) {
		ERR_EXIT("listen");
	}
	return listenfd;
}
//设置非阻塞
int setnoblock(int fd) {
	int oldflag = fcntl(fd, F_GETFL);//获取flag
	fcntl(fd, F_SETFL, oldflag | O_NONBLOCK);
	return oldflag;
}
 


int main() {

	struct pollfd fds[CLIENTSIZE];//定义存储事件的poll集合
	int listenfd = CreateSocket();
	char buf[BUFSIZE] = {0};//存储中间数据
	map fddata;//存储键值对
	//每一个fd都有自己的收发数据, 因为收发数据是分开处理的
	fds[0].fd = listenfd;
	fds[0].events = POLLIN | POLLERR;
	fds[0].revents = 0;
	int count = 1;//监视fd事件的数目
	while (1) {
		int ret = poll(fds, count, -1);//-1代表一直阻塞,直到事件到来
		if (ret < 0) {
			ERR_EXIT("poll");
		} 
		//至此, 说明有IO事件满足处理, 遍历寻找满足事件
		for (int i = 0; i < count; ++i) {
			//客户端关闭, 或者出错
			if ((fds[i].revents & POLLRDHUP) || (fds[i].revents & POLLERR)) {
				int fd = fds[i].fd;//提取fd
				fds[i] = fds[count - 1];//使用末尾pollfd覆盖
				i -= 1;//此次i删除, 覆盖过来的末尾事件需要重新检测
				count -= 1;
				fddata.erase(fd);//从mp中删除
				close(fd);
				printf("%d delete connection\n", fd);
			} else if ((fds[i].revents & POLLIN) && (fds[i].fd == listenfd)) {
				//建立新的链接
				struct sockaddr_in clientAdd;
				socklen_t clientLen = sizeof(clientAdd);
				int connfd = accept(fds[i].fd, (SA*)&clientAdd, &clientLen);
				char dst[256] = {0};
				printf ("Get connection %d from %s:%d\n ", connfd, 
					inet_ntop(AF_INET, &clientAdd.sin_addr, dst, sizeof(dst))
					, ntohs(clientAdd.sin_port));
				setnoblock(connfd);//设置非阻塞
				fds[count].fd = connfd;
				fds[count].events = POLLIN | POLLRDHUP | POLLERR;
				fds[count++].revents = 0;
			} else if (fds[i].revents & POLLIN) {
				//有可读事件
				memset(buf, 0, BUFSIZE);
				int read_size = recv(fds[i].fd, buf, BUFSIZE - 1, 0);
				if (read_size < 0) {
					ERR_EXIT("recv");
				}
				if (read_size == 0) {
        			//客户端断开此次连接
        			printf("EXIT\n");
				} else {
					fddata[fds[i].fd] = buf;//数据进行拷贝进去,拷贝构造
					fds[i].events |= POLLOUT;
					fds[i].events &= (~POLLIN);
				}
			} else if (fds[i].revents & POLLOUT) {
				int fd = fds[i].fd;
				//有可写事件
				memset(buf, 0, BUFSIZE);
				strcpy(buf, fddata[fd].c_str());//拿到数据
				int n = fddata[fd].size();
				buf[n] = 0;
				for (int i = 0; i < n; ++i) {
					buf[i] = toupper(buf[i]);
				}
				//写回,同时设置成为读事件
				send(fd, buf, n, 0); 
				fds[i].events |= POLLIN;
				fds[i].events &= (~POLLOUT);
			}
		}
	}
	return 0;
}

poll小结

优势

poll对比select不再使用BitMap来存储关注的文件描述符事件了,

pollfd结构包含了要监视的event和发生的event，不再使用select“参数-值”传递的方式. 接口使用比 select更方便.

poll并没有最大数量限制(相较select打破了文件描述符个数上的限制) (但是数量过大后性能也是会下降, 所以在fd数目很大的情况下也不适合).

poll 没有最大数量, 不像select的 fd_set在一开始是设定好了, 上限1024个最多. poll上线取决于pollfd结构体数组的大小, 我们可以使用动态数组或者从堆区new一个足够大的数组

劣势

和select函数一样，poll返回后，需要轮询pollfd来获取就绪的描述符. (所以还是会存在循环遍历找到可读可写的文件描述符, 所以效率依然不算很高),时间复杂度上面其实和select差不多, 也还是会存在内核态和用户态之间的相互拷贝文件描述符集合.,只是形式上不一样罢了. 一个用bitmap 一个用结构体链式.

同时连接的大量客户端在一时刻可能只有很少的处于就绪状态, 因此随着监视的描述符数量的增长, 其效率也会线性下降.

所以综上poll也还是不是解决C10k问题的利器

poll编程模型

创建pollfd结构体数组，并且创建一个 map 映射fd和对应存储数据的string

init 初始化fds[0] 并且定义一个count记录需要监视的事件数目.

循环不断的进行 r = poll();

循环遍历fds监视IO事件并且通过判断 fds[i].revents & 各种宏的结果来判断IO事件类型进行不同的操作

epoll

搞定C10k问题的神器, 完全没有像上述的select 和 poll的随着fd的数量稍稍一大就会及其拉跨, 性能猛地就掉下来了，入下图分析

正是由于epoll的稳定, 所以奠定了它在高并发服务器，解决C10k类型问题中的霸主地位.
我们还是先图解分析一下epoll的函数, 然后再从底层数据结构康康为啥它相比select和poll实现了质的飞跃.

上述的epoll_wait 使用起来其实是和之前的select还有poll是一个道理, 监视IO事件触发, 通过返回值来执行触发的事件. 不过还是有差别, 它的return val == 触发的IO事件的个数, 我们遍历处理事件的时候不需要再遍历所有的监视IO事件, 只需要直接遍历它的返回值处理就行, 这个就先减小了遍历的压力
epoll_ctl先提前注册号需要监视的事件，然后调用epoll_wait阻塞获取IO触发的事件, 在使用epoll_wait的时候不需要像使用select + poll那样需要每次都重新拷贝需要监视的IO事件到内核中进行检测,而是进行了分离, 提前用epoll_ctl注册好需要监视的事件，然后epoll_wait获取触发的IO事件

小案例1：监视标准输入:

#include 
#include 
#include 
#include 
#include 

#define ERR_EXIT(m)\
	do { perror(m); exit(EXIT_FAILURE); } while(0)

int main() {
	int epollfd = epoll_create(5);//创建epoll句柄对象 
	//注册监视事件
	struct epoll_event ev;
    ev.data.fd = 0;
	ev.events = EPOLLIN;
	if (epoll_ctl(epollfd, EPOLL_CTL_ADD, 0, &ev) == -1) {
		ERR_EXIT("epoll_ctl");
	}
	while (1) {
		struct epoll_event evs[3];//存储返回的IO触发事件
		//循环获取返回的IO触发事件
		int r = epoll_wait(epollfd, evs, 3, -1);
		if (r < 0) {
			ERR_EXIT("epoll_wait");
		} else {
			//说明存在IO事件被触发了,循环遍历处理
			for (int i = 0; i < r; ++i) {
				if (evs[i].events & EPOLLIN) {
					char buff[256] = {0};
					read(0, buff, sizeof(buff) - 1);
					printf("input：%s", buff);
				}
			}

		}
	}
	return 0;
}

基于epoll的服务器实现 (还是简单的将小写字符转成大写然后写回客户端就OK了)其实写起来和poll差不大多:

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
using namespace std;

#define ERR_EXIT(m) \
	do { perror(m); close(EXIT_FAILURE); } while (0)

typedef struct sockaddr SA;
#define BUFSIZE 256
#define CLIENTSIZE 1000
#define SERVE_PORT 12345 

int CreateSocket() {
	int listenfd;
	struct sockaddr_in serveAdd;
	//创建套接字
	if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
		ERR_EXIT("socket");
	}
	int reuseaddr = 1;

	//设置可以复用端口地址
	if (setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &reuseaddr, sizeof(reuseaddr)) == -1) {
		ERR_EXIT("setsockopt");
	}

	//设置协议地址簇
	bzero(&serveAdd, sizeof(serveAdd));
	serveAdd.sin_family = AF_INET;
	serveAdd.sin_port = htons(SERVE_PORT);
	serveAdd.sin_addr.s_addr = htonl(INADDR_ANY);
	//绑定本地端口地址
	if (bind(listenfd, (SA*)&serveAdd, sizeof(serveAdd)) == -1) {
		ERR_EXIT("bind");
	}
	//监听
	if (listen(listenfd, 5) == -1) {
		ERR_EXIT("listen");
	}
	return listenfd;
}

int setnoblock(int fd) {
	int oldfl = fcntl(fd, F_GETFL);
  fcntl(fd, F_SETFL, oldfl | O_NONBLOCK);
	return oldfl;
}

//添加监视IO事件                                                                                                                                                       
void addfd(int epfd, int fd) {
	struct epoll_event ev;
	ev.data.fd = fd;
	ev.events = EPOLLIN | EPOLLET | EPOLLERR;//EPOLLET边缘触发
	if (epoll_ctl(epfd, EPOLL_CTL_ADD, fd, &ev) == -1) {
		ERR_EXIT("epoll_ctl");
	}
	setnoblock(fd);//设置非阻塞, 非阻塞IO + IO多路复用技术结合(提高性能)
}
//删除监视IO事件
void delfd(int epfd, int fd) {
	struct epoll_event ev;
	ev.data.fd = fd;
	if (epoll_ctl(epfd, EPOLL_CTL_DEL, fd, &ev) == -1) {
		ERR_EXIT("epoll_ctl");
	}
}

int main() {
	int listenfd = CreateSocket();
	if (listenfd == -1) {

	}
	int epfd = epoll_create(CLIENTSIZE);//创建epoll对象句柄
	if (epfd == -1) {
		ERR_EXIT("epoll_create");
	}
	char buff[BUFSIZE];//中间存储读取到数据的容器
	map fddata;//映射fd, data 键值对
	struct epoll_event evs[CLIENTSIZE]; //存储返回的IO事件
	addfd(epfd, listenfd);		  
	while (1) {
		int r = epoll_wait(epfd, evs, CLIENTSIZE, -1);
		for (int i = 0; i < r; ++i) {
			if (evs[i].events & EPOLLERR) {
				//出错断开删除连接删除监视
				delfd(epfd, evs[i].data.fd);
				printf("fd: %d Erron\n", evs[i].data.fd);
				close(evs[i].data.fd);
				fddata.erase(evs[i].data.fd);
			} else if ((evs[i].events & EPOLLIN) && evs[i].data.fd == listenfd) {
				//新的连接到来
				char dst[256];
				struct sockaddr_in clientAdd;
				socklen_t clientLen;
				int connfd = accept(listenfd, (SA*)&clientAdd, &clientLen);
				if (connfd == -1) ERR_EXIT("accept");
				printf("%d Create connection and %s:%d \n", connfd
					, inet_ntop(AF_INET, &clientAdd.sin_addr, dst, sizeof(dst))
					, ntohs(clientAdd.sin_port));
				addfd(epfd, connfd);
			} else if (evs[i].events & EPOLLIN) {
				int fd = evs[i].data.fd;
				//客户端来数据了
				memset(buff, 0, BUFSIZE);
				int read_size;
				if ((read_size = recv(fd, buff, BUFSIZE - 1, 0)) == -1 ) {
					ERR_EXIT("recv");
				} else if (read_size == 0) {
					printf("fd: %d delete connection\n", fd);
					delfd(epfd, fd);//客户端断开了连接了
					fddata.erase(fd);
					close(fd);
				} else {
					fddata[fd] = buff;//会自动调用对应的拷贝构造函数
					evs[i].events |= EPOLLOUT;
					evs[i].events &= (~EPOLLIN);
					if (epoll_ctl(epfd, EPOLL_CTL_MOD, fd, &evs[i]) == -1) {
						ERR_EXIT("epoll_ctl");
					}					
				}
			} else if (evs[i].events & EPOLLOUT) {
				int fd = evs[i].data.fd;
				//有数据可以向客户端写入了
				memset(buff, 0, BUFSIZE);
				strcpy(buff, fddata[fd].c_str());
				//转成大写
				for (int i = 0; i < fddata[fd].size(); ++i) {
					buff[i] = toupper(buff[i]);
				}
				send(fd, buff, fddata[fd].size(), 0);
				//然后修改监视事件
				evs[i].events &= (~EPOLLOUT);
				evs[i].events |= EPOLLIN;
				if (epoll_ctl(epfd, EPOLL_CTL_MOD, fd, &evs[i]) == -1) {
					ERR_EXIT("epoll_ctl");
				}
			}
		}
	}
	close(listenfd);
	close(epfd);
	return 0;
}

Epoll小结

epoll在内核里面使用了红黑树来监视所有待检测的文件描述符, 把需要监视的socket全部通过epoll_ctl函数加到红黑树中, 而且这个红黑树是处在内核中的, 所有避免了每一次调用返回IO触发事件的时候的拷贝, 向select 和 poll就需要将需要监视的事件拷贝进入内核, 而且是每一次都需要拷贝, 这个代价还是比较大

而且内核中监视IO事件使用红黑树存储, 增删改查的效率都远远的超过了线性结构....select和poll都是使用的线性结构, 遍历轮询IO事件效率低下...

epoll使用的是事件驱动机制, 我个人觉得有点像中断机制的意思了,   内核中维护一个就绪链表存储就绪事件, 当用户调用epoll_wait的时候直接返回有IO事件发生的描述符个数就是了, 链表中的就绪事件通过我们传入的 struct epoll_event数组直接拿出, 有了这个就绪链表还避免了内核的轮询查找发生了IO的事件.

epoll最牛逼的还是它的稳定, 随着fd事件的增加不会像poll和select那样出现线性的急速性能下滑,.. 所以他也被称作解决C10k问题的利器

留疑: 边缘触发和水平触发我暂时不是很理解, 大佬可以留下您的理解, 感激不尽

epoll编程模型

调用epoll_create创建epoll实例句柄

调用epoll_ctl注册监视事件

循环调用epoll_wait() 返回IO发生的事件

循环遍历返回的事件进行处理, 事件类型通过如下方式判断

if (evs[i].events & EPOLLIN) {处理读数据事件} else if (){} else if (){}

四.C10K服务端代码

此次仅仅附上代码, 具体很多细节, 我暂时还没学通, 线程池 + 多路复用 + 非阻塞IO结合

#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include

#define SERV_PORT 8000
#define MAXLINE 80

#define prrexit(msg){\
    perror(msg);\
    exit(1);\
    }


typedef struct Task{
    int fd;
    struct Task *next;
}Task;

typedef struct Task_pool{
    Task *head;
    Task *tail;
    pthread_mutex_t lock;
    pthread_cond_t havetask;
}Task_pool;

Task_pool *task_pool_init(){
    Task_pool *tp=(Task_pool*)malloc(sizeof(Task_pool));
    tp->head=NULL;
    tp->tail=NULL;
    pthread_mutex_init(&tp->lock,NULL);
    pthread_cond_init(&tp->havetask,NULL);
    
    return tp;
}

void task_pool_push(Task_pool *tp,int fd){
    pthread_mutex_lock(&tp->lock);

    Task *t=(Task *)malloc(sizeof(Task));
    t->fd=fd;
    t->next=NULL;

    if(!tp->tail){
        tp->head=tp->tail=t;
    }else{
        tp->tail->next=t;
        tp->tail=t;
    }

    pthread_cond_broadcast(&tp->havetask);//广播条件可用
    pthread_mutex_unlock(&tp->lock);
}

Task task_pool_pop(Task_pool *tp){
    pthread_mutex_lock(&tp->lock);

    while(tp->head==NULL)
        pthread_cond_wait(&tp->havetask,&tp->lock);//暂时交还锁，等待条件满足

    Task tmp,*k;
    k=tp->head;
    tmp=*k;
    tp->head=tp->head->next;

    if(!tp->head)//没了
        tp->tail=NULL;

    free(k);
    pthread_mutex_unlock(&tp->lock);

    return tmp;
}

void task_pool_free(Task_pool *tp)
{
    pthread_mutex_lock(&tp->lock);
    Task *p=tp->head,*k;

    while(p){
        k=p;
        p=p->next;
        free(k);
    }
    tp->head=NULL;

    pthread_mutex_unlock(&tp->lock);
    pthread_mutex_destroy(&tp->lock);
    pthread_cond_destroy(&tp->havetask);
    free(tp);
    return;
}

void *up_server(void *arg)
{
    pthread_detach(pthread_self());
    //detech函数可以使一个线程在结束时自动释放相关资源
    char buf[80];//读取缓冲
    Task_pool *tp=arg;
    while(1)
    {
        Task tmp=task_pool_pop(tp);//取出一个线程
        int connfd=tmp.fd;
        printf("get task fd=%d\n",connfd);
        //epoll会在每一次有数据到来时唤醒线程服务，所以不需要while(1)循环等待
        /*while(1)
        {*/
        int n = read(connfd,buf,80);
        write(1,buf,n);
        for(int i=0;i

 
  五. 总结 
   
    
    本文主要是理论结合实践的学习IO多路复用技术，又言IO多路转接技术..... 
    IO多路复用本质上就是在一个进程中同时处理多个IO事件, 所谓的同时处理多个IO事件的方式存在两种, 一种就是轮询处理, 本质其实还是一个一个的IO事件的进行处理, 只是一次监视多个IO事件，然后将状态改变, IO事件触发的事件进行处理....   处理还是存在先后顺序的, 我们之所以觉得是同时处理的, 不过是因为处理单个事件的时间很短我们看着就像同时处理多个事件一个样.... 
    IO多路复用技术非轮询的, 采取监视事件   和  返回事件结果接口分离的方式来实现, 提前注册好需要监视的事件, 不再需要像select和poll那样每一次调用接口都想内核拷贝一次监视事件, 底层存储监视事件使用的是红黑树的结构，大大提升了效率......  
    存储就绪事件也不是采取内核中轮询遍历的方式了, 而是单独的使用一个就绪链表存储就绪IO事件，提高了效率.... 
    根据上述可以总结出 epoll节约了空间(避免了内核和用户空间的不断拷贝事件，IO事件的存储对应的是数据结构)  还通过线性结构改成红黑树接口分离提高了效率和稳定性... 
    但是  其实这个仅仅只是高并发服务器的入门, 还有非阻塞IO  +  IO多路复用技术都是高并发服务器的入门阶段 (后面小杰还会持续更新，还有小杰的图解基础网络章节, 谢谢大家, 祝看本文的读者学生学业有成, 工作人员升职加薪)   
    小杰算是初学者, 好多理解不足希望大家给与指出，谢谢

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
父母教育孩子的方式，将影响孩子一生树英教育
为什么有些孩子总是充满自信与快乐？独立、有主见又坚强？而有些孩子却自卑、胆怯，软弱又过度依赖父母？为什么有些孩子总是健康、阳光又富于创造力？而有些孩子却悲观、孤僻又思想空乏？一个孩子的行为取决于孩子的思想，思想取决于环境和自己的认知，认知取决于教育。父母是孩子人生中的第一位教育者，父母养育孩子的方式，将决定他们人生的高度，影响他们的一生。网络图，侵权即删优秀的父母就像园丁，既要浇水施肥，又要修剪杂
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

网络编程实战之高级篇, 彻底解决面试C10k问题, 高并发服务器, IO多路复用, 同时监视多个IO事件

一.前言

二.IO多路复用的理解

三.IO多路复用的发展

select

poll

epoll

四.C10K服务端代码

五. 总结

你可能感兴趣的:(计算机网络,网络,面试,服务器)