芸兮

计算机网络（三）网络协议栈与epoll的底层原理

layout: post
title: 计算机网络（三）网络协议栈与epoll的底层原理
description: 计算机网络（三）网络协议栈与epoll的底层原理
tag: 计算机网络

文章目录

POSIX API与网络协议栈
epoll的底层实现
- epoll使用的数据结构
- 协议栈与epoll通信
- - epoll对于不同事件的处理
- 协议栈触发回调通知epoll的时机
- - 协议栈通知epoll的时机总结
  - 从回调机制看epoll与select/poll的异同
- epoll三个API的实现
- - epoll_create
  - epoll_ctl
  - epoll_wait
- epoll的线程安全
- ET与LT如何实现
- - ET与LT的使用场景

POSIX API与网络协议栈

常用的POSIX API按照C/S模式有以下8种：

服务端：
- socket()：socket仅仅返回一个fd，fd是对这个连接的唯一标识符，对于tcp而言，每个连接背后都有一个TCB(tcp control block，TCP控制块)，操作系统是通过TCB来控制每个fd代表的tcp连接的。int socket(int domain, int type, int protocol);
- bind()：刚刚创建的socket，底层的TCB是没有被初始化的，bind的作用就是绑定本地的ip和端口。bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
- listten()：服务端调用listen()后，开始监听网络上发送给socket的连接请求。listen(fd,size)，fd是socket的文件描述符，size在Linux是指全连接队列的长度，即一次最多能保存size个连接请求。
- accept()：accept()函数只做两件事，将建立好的连接从全连接队列中取出，给他分配一个fd（与listen_fd不同，这里是client_fd）并返回。int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
- recv()：send和recv在TCP连接生命周期中占用的时常最长，主要负责数据的收发。send函数负责将数据拷贝到内核，内核协议栈主要是利用TCB中的发送缓冲区进行数据缓存，然后根据内核自己的策略决定何时将数据发送。接收端数据也是先到达TCB的接收缓冲区，然后才是通过recv拷贝到用户空间。
- send()：send函数负责将数据拷贝到内核，内核协议栈主要是利用TCB中的发送缓冲区进行数据缓存，然后根据内核自己的策略决定何时将数据发送。
- close()：close(fd)，最简单函数，参数是要关闭的clientfd，实际上tcp的关闭需要完成4次挥手的复杂过程，不过这些都是内核帮我们实现好了。
客户端
- socket()
- connect()：连接服务端ip地址和端口

抛开C/S模式，POSIX API还提供了一些socket控制函数：

socket参数设置函数
- setsockop()：set socket option，设置socket选项
- getsockopt()：get socket option，获取option选项
- shutdown()：切换半关闭状态
- fcntl()：file control，设置fd参数，例如更改阻塞类型

下面是服务端构建tcp连接监听和接待的demo：

#include
#include
#include
#include
// socket --> socket也是一个进程
// bash --> execve("./server", "") bash 进程执行了函数

int main(){

	// 1、用socket()创建一个socket
	//socket返回的int是连接的标记符，随着socket连接数从3开始自增，因为0，1，2分别代表了标准输入、输出、错误
	int listenfd = socket(AF_INET, SOCK_STREAM, 0); // 参数是历史沿用写法
	if (listenfd == -1) return -1; // 创建失败，直接返回,POSIX API特点，返回0是成功，返回负值是失败

	// 2、创建绑定服务器地址
	struct sockaddr_in servaddr; // 准备绑定一个服务器地址
	// POSIX API的又一特点，一般取单词前4个字母作为名字缩写
	servaddr.sin_family = AF_INET; // 指定TCP/IP协议簇，这里是IPV4
	// htonl: host to net long，网络地址使用long类型存储
	// 将主机字节序 转为网络字节序，INADDR_ANY是本机回环地址 : 0.0.0.0
	servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
	// htonl: host to net short，端口号使用short类型存储
	// 将主机字节序 转为网络字节序，指定端口为8888 
	servaddr.sin_port = htons(8888);

	//3、用bind()绑定创建的地址
	if( -1 == bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr))){
		// 如果绑定失败，直接返回
		return -2;
	}
	//4、listen()开启监听，设置全连接队列大小为10
	listen(listenfd, 10);

	//5、准备一个客户端结构体client
	struct sockaddr_in client;
	socklen_t len = sizeof(client);

	//6、用accept()接待客户端连接
	int clientfd = accept(listenfd, (struct sockaddr*)&client, &len);

	printf("hello TCP socket world!\n");
	printf("listenfd: %d\n", listenfd);
	return 0;
}

epoll的底层实现

epoll使用的数据结构

epoll至少需要两个集合：

所有fd的总集；
就绪fd的集合；
一个fd，底层对应一个TCB（TCP控制块），那么也就是说key = fd，val = TCB，是一个典型的kv型数据结构，对于kv型数据结构，我们可以使用以下三种数据结构进行存储。

hash表
红黑树
b/b+树

epoll选择的是红黑树，它的查找速度很快为（O（log(N)）），其次在调用epoll_create()的时候，只需要创建一个红黑树根节点即可，无需浪费额外空间。不使用hash表是因为epoll表示的连接范围很大，可能只有几个连接，也可能有百万连接，如使用hash表，我们并不清楚，一开始底层的数组应该创建多大比较合适。不使用b/b+tree，是因为它主要用于在磁盘索引中降低层高，没有红黑树的增删改查效率高。

就绪队列不是以查找为主，主要作用是将里边的元素拷贝给用户进行处理，没有优先级，因此可以采用线性的数据结构，双端队列。

epoll中红黑树的节点和就绪队列的节点是同一个节点，所谓加入就绪队列，就是将节点的前后指针联系在一起

协议栈与epoll通信

应用程序只能通过三个api接口：epoll_create、epoll_cntl、epoll_wait来操作epoll，当一个io准备就绪的时候，epoll是怎么知道io准备就绪了呢？是由协议栈将数据解析出来触发回调通知epoll的。也就是说可以把epoll的工作环境看出三部分，左边应用程序的api，中间的epoll，右边协议栈的回调，中间的vfs不是本篇重点，这里直接忽略了。

epoll对于不同事件的处理

socket有两类，一类是监听listenfd，一类是客户端clientfd。对于sockfd而言，我们一般比较关注EPOLLIN和EPOLLOUT这两个事件，所以如果是listenfd，我们通常的做法就是accept。对于clientfd来说，如果可读我们就recv，如果可写我们就send。即处理的IO事件类型包含三类：

对于listenfd的accept
对于clientfd如果是读事件，则recv
对于clientfd如果是写事件，则send

对应者我们在程序中的写法：

int main() {
	//…………
	while (1 ){
		int ready = epoll_wait(r->epfd, events, EVENT_LENGTH, -1);
		int i = 0;
		for (int i = 0; i < nready; ++i) {
			int clientfd = events[i].data.fd;
			if (is_listenfd(sockfds, clientfd)) {
				// accept
				//…………
			} else if (events[i].events & EPOLLIN) {
				// recv
				// …………
			} else if (events[i].events & EPOLLOUT)
				// send
				// …………	
		}
	
	}
	return 0;
}

协议栈将数据解析出来触发回调通知epoll，epoll是怎么知道哪个io就绪了呢？

我们从ip报文头部解析出源ip和目的ip，从tcp报文头部解析出源端口和目的端口，此时TCP连接的五元组就凑齐了。socket fd --- <源ip地址，源端口，目的ip地址，目的端口，协议>，一个fd就是一个五元组，知道了fd，我们就能从红黑树中找到对应的节点。

那么协议栈的回调函数需要做什么事情呢？我们传入fd和具体事件类型，然后做下面两个操作：

通过fd找到对应节点
把节点加入到就绪队列

协议栈触发回调通知epoll的时机

三次握手完成后，会往全连接队列中添加一个TCB节点，触发一个回调函数，通知epoll有个EPOLLIN事件：（通知有新的连接需accept）
客户端发送一个数据包，协议栈接收后回复ACK，之后触发一个回调函数，通知epoll里边有个EPOLLIN事件：（通知可读）
每个连接的TCB里边都有一个sendbuf（发送区缓存），在对端接收到数据并返回ACK，sendbuf就可以将这部分已经确认接收的数据清空，此时sendbuf里边必定就有新的剩余空间，此时触发一个回调函数，通知epoll里边有个EPOLLOUT事件：（通知可写）
当对端发送close，服务端在接收FIN后，回复ACK，如果接收客户端发送 FIN 报文后，服务端仍有未读取的数据，会调用回调函数，通知epoll有个EPOLLIN事件：（通知可读）
这是因为，当客户端发送 FIN 报文后，服务端还能够继续接收来自客户端的未读取数据，直到收到客户端的 ACK 报文关闭连接。
当接收到RST标志位（重置连接请求），回复ACK后，也会触发回调函数，通知epoll有一个EPOLLERR事件：（通知连接出现了错误）
内核会产生EPOLLERR事件，并将其放入等待事件队列中，等待进程调用epoll_wait函数时返回处理。

协议栈通知epoll的时机总结

三次握手完成之后，EPOLLIN，通知可以accept
接收到数据，回复ACK后，EPOLLIN，通知可读
发送数据收到ACK之后，对端收到数据，清除确认接收数据的缓存，一定产生了新的可写空间，EPOLLOUT，通知可写
接收FIN报文，回复ACK后，此时如果服务端还有未读取的数据，触发EPOLLIN，通知可读
接收到RST，回复ACK后，通知EPOLLERR

从回调机制看epoll与select/poll的异同

select使用fdset管理fd，fdset最多只能处理1024个fd，而poll使用链表管理fd，没有最大连接数限制；
select/poll都是轮询遍历检查每个fd是否就绪，不同的是select会把就绪的fd存放到用户空间的fdset，而poll会把就绪的fd存放到用户空间的就绪链表中。select和poll没有本质区别
每次调用epoll/select需要将fd总集拷贝到内核，而epoll不同epoll只会拷贝需要的东西，没有资源浪费。
select/poll需要循环遍历总集是否有就绪，而epoll是哪个节点就绪了，通过fd找到节点，然后直接将节点加入到就绪队列。

epoll三个API的实现

epoll_create

在用户进程调用 epoll_create 时，内核会创建一个 struct eventpoll 的内核对象，初始化epoll的红黑树根节点，等待队列，就绪队列等，它的结构如下：

struct eventpoll {

    //sys_epoll_wait用到的等待队列
    wait_queue_head_t wq;

    //接收就绪的描述符都会放到这里
    struct list_head rdllist;

    //每个epoll对象中都有一颗红黑树
    struct rb_root rbr;

    ......
}

eventpoll 这个结构体中的几个成员的含义如下：

wq：等待队列链表。软中断数据就绪的时候会通过 wq 来找到阻塞在 epoll 对象上的用户进程。
rbr：一棵红黑树。为了支持对海量连接的高效查找、插入和删除，eventpoll 内部使用了一棵红黑树。通过这棵树来管理用户进程下添加进来的所有 socket 连接。
rdllist：就绪的描述符的链表。当有的连接就绪的时候，内核会把就绪的连接放到 rdllist 链表里。这样应用进程只需要判断链表就能找出就绪进程，而不用去遍历整棵树。

epoll_ctl

epoll_ctl()负责add,del,mod 增加、删除、修改结点。
这里以EPOLL_CTL_ADD添加fd为例：
内核会完成下边三件事：

分配一个红黑树节点对象epitem
添加等待事件到等待队列wq中，设置回调函数ep_poll_callback
将epitem插入到epoll对象的红黑树中

epitem的数据结构如下：

//file: fs/eventpoll.c
struct epitem {

    //红黑树节点
    struct rb_node rbn;

    //socket文件描述符信息
    struct epoll_filefd ffd;

    //所归属的 eventpoll 对象
    struct eventpoll *ep;

    //等待队列
    struct list_head pwqlist;
}

新加入的fd，添加到等待队列pwqlist上(注意这里的等待队列是epitem的上的等待队列，即，每个fd上的等待任务列表，并不是eventpoll中的wq)，并为其注册回调ep_poll_callback；当有IO事件时，内核协议栈就会通过注册的这个ep_poll_callback函数来回调，进而通知到epoll对象。

epoll_wait

epoll_wait把就绪队列的结点copy到用户态放到events里面，返回就绪队列节点的个数ready。

int ready = epoll_wait(r->epfd, events, EVENT_LENGTH, -1);

epoll_wait 做的事情不复杂，当它被调用时它观察 eventpoll->rdllist 链表里有没有数据即可。有数据就返回，没有数据就创建一个等待队列项，将其添加到 eventpoll 的等待队列上，然后把自己阻塞掉就完事。

注意：
1、epoll_ctl 添加 socket 时也创建了等待队列项。不同的是这里的等待队列项是挂在 epoll 对象上的，而前者是挂在 socket 对象上的。
2、epoll_wait的第四个参数是timeout，timeout 参数指定了等待时间，它可以让 epoll_wait 函数在等待一定时间后超时返回而不阻塞进程。具体来说，当 timeout 参数为正数时，epoll_wait 函数最多等待 timeout 毫秒，然后返回；当 timeout 参数为零时，epoll_wait 函数立即返回；当 timeout 参数为负数时，epoll_wait 函数将一直等待直到某个事件发生才返回。使用 timeout 参数可以避免 epoll_wait 函数无限期地等待 I/O 事件的发生，从而提高应用程序的响应性和可靠性。但是需要注意的是，timeout 参数并不保证 epoll_wait 函数一定会在指定的时间内返回，因为它可能会受到其他因素（如系统调度、竞争条件等）的影响。

epoll的线程安全

如果有3个线程同时操作epoll，有哪些地方需要加锁？

如果同时调用epoll_create()，那就是创建三颗红黑树，没有涉及到资源竞争，没有关系。
如果同时调用epoll_ctl()，对同一颗红黑树进行增删改，这就涉及到资源竞争，需要对红黑树加锁，对于红黑树的锁设计需要结合具体的应用场景来进行优化，在保证数据一致性和原子性的前提下，尽量减少锁的粒度和范围，并使用适当的锁机制来提高系统的性能和可靠性。
如果同时调用epoll_wait()，其操作的是就绪队列，所以需要对就绪队列进行加锁。
我们要扣住epoll的工作环境，在应用程序调用 epoll_ctl() ，协议栈会不会有回调操作红黑树结点？调用epoll_wait() copy出来的时候，协议栈会不会操作操作红黑树结点加入就绪队列？

综上所述：

epoll_ctl() 对红黑树加锁
epoll_wait()对就绪队列加锁
回调函数() 对红黑树加锁,对就绪队列加锁

对于红黑树这种节点比较多的时候，采用互斥锁来加锁。就绪队列就跟生产者消费者一样，结点是从协议栈回调函数来生产的，消费是epoll_wait()来消费。那么对于队列而言，用自旋锁（对于队列而言，插入删除比较简单，cpu自旋等待比让出的成本更低，所以用自旋锁）。

ET与LT如何实现

epoll 的 ET（边缘触发）和 LT（水平触发）是通过在内核中实现不同的事件通知机制来实现的。

在 ET 模式下，只在有新的事件到来时，通知一次；
在 LT 模式下，如果没有读完数据就会一直触发；

水平触发和边沿触发代码只需要改一点点就能实现。从协议栈检测到接收数据，就调用一次回调，这就是ET，接收到数据，调用一次回调。而LT水平触发，检测到recvbuf里面有数据就调用回调。所以ET和LT就是在使用回调的次数上面的差异。

具体而言，协议栈流程里面触发回调，是天然的符合ET只触发一次的；如果是LT，在recv之后，如果缓冲区还有数据，那么会将该节点再次加入到就绪队列。

ET与LT的使用场景

Nginx默认使用ET（边缘触发）模式，因为ET模式可以更好地适用高并发和大规模数据处理场景，具体原因如下：
- 1、提高性能：ET模式可以充分利用多路复用技术，在单个线程中同时处理多个连接，从而提高系统的性能和吞吐量，相比于LT模式，循环反复将就绪fd加到就绪队列，ET模式可以减少对CPU和系统资源的占用。
- 2、降低延迟：在ET模式下，当某个文件描述符上有I/O事件发生时，内核会立即通知应用程序处理，实现更及时的响应和处理，更加关注epoll中的活跃连接。
Redis默认使用LT（水平触发）模式，但也支持ET。这是因为Redis主要用于数据存储和读写操作，对于I/O事件的及时处理并没有特别强烈的要求，具体原因如下：
- 1、简单易用：LT模式相对于ET模式而言，实现更加简单，可靠性更高，并且对应用程序的编写和调试也更加友好。
- 2、兼容性更好：由于LT模式是Linux内核默认的事件通知机制，因此可以更好地兼容各种版本的内核和系统环境。
- 3、不需要高性能：Redis的主要任务是数据存储和读写操作，并不需要想web服务器等高性能服务那样需要尽可能地减少响应延迟和CPU占用率。

总之：ET 和 LT 模式各自具有不同的特点和优势，需要根据具体的应用场景来选择合适的模式，并进行相应的优化和调整，对于响应要求更高的使用ET，对于使用简单和数据安全性要求更高的使用LT。

10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
“大国品牌”建设全面启动，工业电商生态加速成型人工智能
3月17日，AMT企源与中国工业互联网研究院（简称“工联院”）于北京、上海两地同步举行“大国品牌”电商平台项目启动仪式。工联院相关领导和负责人，AMT企源团队负责人、项目经理和项目骨干，共同出席本次启动仪式。工联院成立于2018年，是工业和信息化部直属的科研机构，承担工业互联网相关的发展战略、规划、政策、标准研究，网络、平台、安全体系建设，国际交流与合作等工作。为落实品牌强国战略，加速优质品牌的培
C/C++学习路线概述 DustWind丶 C/C++c++
根据如下视频和文章总结：想做C语言/C++开发?这些才是你该学的东西！C语言/C++直通企业级开发的详细学习路线节选：肝了半个月，我整理出了这篇嵌入式开发学习学习路线+知识点梳理目录1C/C++学习概述1.1C语言的基础知识1.2C++的基础知识2C/C++编程学习四大件2.1数据结构和算法2.2操作系统2.3计算机网络2.3.1计算机网络分层2.3.2典型协议（以TCP/IP四层模型举例）2.4
域名如何绑定服务我真的不想做程序员 java java 后端开发语言服务器阿里云容器
目录一、理解域名与Java服务之间的关系二、DNS解析三、配置DNS记录四、Java服务的配置1.部署Java应用2.配置反向代理五、DNS解析六、验证绑定是否成功七、代码示例八、总结在现代网络应用中，域名和Java服务的绑定是实现用户友好访问和后台服务的关键步骤。本文将详细介绍这一过程，包括DNS解析、反向代理以及Java服务的配置，最后会展示代码示例和视觉化流程图。一、理解域名与Java服务之
揭秘时空大数据：详细介绍、真实应用场景和数据示例解析陈书予 GIS开发（时空大数据）前端大数据 python 时序数据库
时空大数据(SpatialBigData)是指利用空间环境和时间环境信息，以及数字技术，从多种来源获取的海量、动态的、多维的数据，对空间环境和时间环境进行实时监测，并基于复杂的数据分析和挖掘，获取有价值的信息。时空大数据示例：1）社会网络数据：Twitter、Facebook、Instagram等社交媒体上的海量数据，可以通过时间、空间、主题等来提取有价值的信息。2）遥感图像数据：通过遥感技术从卫
python爬虫系列实例-python爬虫实例，一小时上手爬取淘宝评论(附代码) weixin_37988176
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。1明确目的通过访问天猫的网站，先搜索对应的商品，然后爬取它的评论数据。可以作为设计前期的市场调研的数据，帮助很大。2爬取评论并储存（首先要进行登录，获取cookie）搜索你想收集的信息的评价，然后点开对应的产品图片。找到对应的评价的位置。找到对应的位置之后就可以进行数据的爬取了
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
路由交换技术——多私网下NAPT、FTP服务公网映射配置的实验「J1e」网络网络协议 tcp/ip
网络地址转换（NAT）技术概述1.定义与背景网络地址转换（NetworkAddressTranslation,NAT）是一种在IP数据包传输过程中修改源或目标IP地址及端口的技术，主要用于解决IPv4地址短缺问题。随着互联网设备激增，NAT通过允许多个设备共享单一公网IP地址，显著延缓了IPv4地址耗尽的速度。2.工作原理NAT的核心是通过中间设备（如路由器、防火墙）建立内网私有地址与外网公有地址
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术 Mark White dnn 人工智能神经网络
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术在深度学习的精密机械中，有些细微的调整机制往往被视为理所当然，却实际上蕴含着深刻的数学洞察和巧妙的工程智慧。今天，我们将探讨两个看似独立却本质相通的机制：生成模型中的温度参数与Transformer注意力机制中的缩放因子。这两个设计都围绕着同一个核心概念——softmax分布的平滑控制。Softmax函数：概率分布的催化剂在深入讨论之前，
弱网测试究竟要怎么做，才能防止漏测？学掌门 IT 软件测试程序员软件测试软件测试工程师
1、为什么要进行弱网测试？在游戏测试–黑盒测试中，分为功能测试与专项测试，在上几篇文章中说的都是功能测试，而专项测试主要包括弱网和性能测试。（其实弱网也是性能的一种。）功能测试主要是保证功能的完整性，能让玩家能够流程的体验整个游戏功能，而弱网测试就是其中需要关注的异常点。首先我们知道现在的网络场景一般是无网络2g3g4g和wifi，以及即将要到来的5g。弱网当然就包括无网、2g，3g不知道算不算，
一个比Fiddler/Charles更好用的免费抓包神器金丝猴也是猿 http udp https websocket 网络安全网络协议 tcp/ip
Proxyman与Sniffmaster：抓包工具的双剑合璧在当今的网络开发与调试中，抓包工具是不可或缺的利器。无论是前端开发者、后端工程师，还是安全研究人员，都需要通过抓包工具来分析网络请求、调试接口、排查问题。今天，我们将介绍两款强大的抓包工具：Proxyman和Sniffmaster，它们各自拥有独特的功能，能够帮助你在不同的场景下高效完成工作。Proxyman简介Slogan：只是简单地点
家用笔记本换装centos7当服务器全流程吕域服务器 windows 电脑 centos
目录1、安装centos7系统硬件准备软件和镜像准备制作启动盘2、网络连接和ssh远程登陆centos7连接网络ssh远程登陆3、笔记本闭盖不休眠（7*24小时可用）4、定时开关机（省电、保护电脑）5、配置开发环境（此处以python为例，非必要项，示需求安装）1、安装centos7系统硬件准备老旧淘汰笔记本一台（新笔记本不合算，舍不得）一个大于8G的U盘网线一根（后续联网用）软件和镜像准备软件U
自学黑客技术多长时间能达到挖漏洞的水平？慕烟疏雨网络安全 web安全安全网络运维
抱着一个明确的目的去学习，学习效果能够事半功倍，给你点个赞。但值得注意的一个点是：任何未经授权的挖洞行为，都是违法的！！！任何未经授权的挖洞行为，都是违法的！！！任何未经授权的挖洞行为，都是违法的！！！这一点一定要切记！！！！！！！接下来回归主题，你想挖漏洞做副业这个想法是好的，但有时候理想很丰满，现实很骨干。从提问描述来看，你之前应该没有深入了解过网络安全，为了避免后面说的东西你理解不了，那我就
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
java tcp pdf_Java网络编程(TCP、Socket).pdf 华西怀 java tcp pdf
Java网络编程(TCP、Socket)Java网络编程—TCP/Socket前言网络编程可分为基于TCP的网络程序设计和基于UDP的网络程序设计。TCP是基于字节流的面向连接的，常用于可靠的网络传输，而UDP是基于数据报的无连接的网络传输，常用语即时通信。1.0基于Socket的Java网络编程网络上的两个程序通过一个双向的通信连接实现数据的交换，这个双向链路的一端称为一个Socket。Soc
关于误差平面小记文弱_书生乱七八糟平面算法神经网络机器学习
四维曲面的二维切片：误差平面详解在深度学习优化过程中，我们通常研究损失函数（LossFunction）的变化，试图找到权重的最优配置。由于神经网络的参数空间通常是高维的，我们需要使用低维可视化的方法来理解优化过程和误差平面（ErrorSurface）。在这里，我们讨论一个四维曲面的二维切片，其中：三个维度是网络的权重（w1,w2,w3w_1,w_2,w_3w1,w2,w3）。第四个维度是误差（损失
关于神经网络中的激活函数文弱_书生乱七八糟神经网络人工智能深度学习
激活函数（ActivationFunction）详解理解首先煮波解释一下这四个字，“函数”相信大家都不陌生，能点进来看这篇文章说明你一定经历至少长达十年的数学的摧残，关于这个概念煮波就不巴巴了，煮波主要说一下“激活”，大家可能或多或少的看过类似于古装，玄幻，修仙等类型的小说或者电视剧。剧中的主角往往是天赋异禀或则什么神啊仙啊的转世，但是这一世他却被当成了普通人，指导某一时刻才会迸发出全部的能量（主
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
关于神经网络中的正则化文弱_书生乱七八糟神经网络人工智能深度学习
神经网络训练中的正则化正则化（Regularization）是神经网络训练中的一个关键技术，主要用于防止模型过拟合（overfitting），提高泛化能力。1.为什么需要正则化？在神经网络训练过程中，模型的目标是找到能在训练数据上表现良好的参数，同时也能泛化到未见过的数据。如果一个模型过于复杂（如参数过多、层数过深），它可能会记住训练数据中的噪声，而不是学习数据的本质模式。这种情况称为过拟合（ov
【Java】TCP网络编程：从可靠传输到Socket实战郑州吴彦祖772 【Java】网络原理 java 并发编程 tcp/ip
活动发起人@小虚竹想对你说：这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧！我们一起发掘写作的魅力，书写出属于我们的故事。我们诚挚邀请你参加为期14天的创作挑战赛！提醒：在发布作品前，请将不需要的内容删除。各位看官，大家早安午安晚安呀~~~如果您觉得这篇文章对您有帮助的话欢迎您一
vpc网络的原理会探索的小学生网络
一、VPC的基本概念和功能VPC是一个专有的云上私有网络，允许用户在公共云上配置和管理一个逻辑隔离的网络区域。用户可以自定义IP地址范围、创建子网、配置路由表和网络网关。VPC提供了类似于传统数据中心的安全和可配置的私有网络空间，同时又具备云计算的弹性和可扩展性‌二、VPC的关键组件和技术细节vSwitch‌：交换机，组成专有网络的基础网络设备，用于连接不同的云资源。‌vRouter‌：路由器，作
【知识管理】搞技术的季经验分享
一、概念：知识：公司内部的个体的、部门的、企业的，甚至是行业的不同的知识层次所综合组成的知识网络，包括品牌市场、渠道、知识产权、技术标准、技术秘密、产品附加值、竞争情报等多种内容。知识管理：是传递知识的过程，由于传递人员的经验问题或者知识源的问题，可能导致较大的知识损耗。而知识管理的过程通过对隐性知识的挖掘和一系列知识管理的活动，可以有效提升知识转化的效率，体现企业内知识资产的价值。二、要素和现状
【运维的七种武器】搞技术的季运维
最近项目陆续增加，相应的运维方面压力逐步攀升，经常出现打包和发布失败的情况，给交付团队带来困扰。运维技术是随着软件技术的发展同步发展起来的，当前复杂的软件技术架构对运维的稳定和高效带了了很大挑战。一、运维平台发展史：1.第一阶段，以专业化网管工具为代表，包括网络设备、主机、数据库、中间件、存储等进行专业监控管理的各种专业化工具。2.第二阶段，以ITIL流程化管理为代表的综合网管，通过事件、服务、流
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
【Kafka高级】Kafka性能优化与调优实践全栈追梦人 kafka 性能优化 linq
在大规模数据处理和实时消息传递场景中，Kafka的性能优化至关重要。本文将从生产者性能优化、消费者性能优化以及集群性能调优三个方面展开，结合实际代码示例和配置参数，帮助读者更好地理解和应用Kafka性能优化策略。一、生产者性能优化Kafka生产者的性能直接影响消息发送的效率和系统的吞吐量。以下是一些关键优化策略：1.1批量发送生产者会将消息批量发送到Kafka，减少网络请求次数。以下参数对批量发送
网络编程之解除udp判断客户端是否断开 v维焓网络 udp windows
思路：每几秒发送一条不显示的信息，客户端断开则不再发送信息，超时则表示客户端断开连接。（心跳包）服务器#include#defineMAX_CLIENTS100//最大支持100个客户端#defineTIMEOUT5//5秒超时structClient{structsockaddr_inaddr;time_tlast_seen;//记录最后一次收到该客户端数据的时间};structClientcl
第二十九篇数据仓库与商务智能：技术演进与前沿趋势深度解析随缘而动，随遇而安数据库数据仓库大数据数据库架构数据库开发
声明：文章内容仅供参考，需仔细甄别。文中技术名称属相关方商标，仅作技术描述；代码示例为交流学习用途，部分参考开源文档（Apache2.0/GPLv3）；案例数据已脱敏，技术推荐保持中立；法规解读仅供参考，请以《网络安全法》《数据安全法》官方解释为准。目录一、核心差异：技术定位与实现路径1.1核心能力矩阵二、协同关系：现代数据供应链的双引擎2.1数据价值链协同2.2典型技术栈集成三、前沿技术动态（2
Docker网络模式的运用云原生的爱好者 docker 网络容器
一、docker网络模式有哪些？都有什么用？Docker提供了多种网络模式，每种模式适用于不同的场景。以下是Docker的主要网络模式及其作用：---###1.**Bridge模式（默认模式）**-**定义**：Docker会创建一个虚拟网络桥（`docker0`），容器通过这个桥连接到宿主机网络。-**特点**：-容器分配独立的IP地址。-容器之间可以通过IP地址通信。-容器可以通过宿主机的IP
什么是通配符SSL证书？ https
随着网络攻击手段的不断升级，保护用户数据、确保传输安全已成为网站运营者的首要任务。而通配符SSL证书，作为网站安全领域的一项重要技术，正以其独特的优势，成为越来越多网站的选择。一、通配符SSL证书概述通配符SSL证书，是一种能够保护一个主域名及其所有子域名的SSL证书。它通过使用星号作为通配符，实现了对主域名下所有子域名的统一保护。这意味着，无论你的网站有多少个子域名，都只需要一张通配符SSL证书
IP归属地查询API：数字世界中的“定位神器” api
前言在数字时代，IP地址如同网络世界的“身份证”，记录着每个设备的网络足迹。而IP归属地查询API，则是解读这张“身份证”的关键工具，它能够将一串串枯燥的数字转化为具体的地理位置信息，为各行各业提供精准的数据支持。IP归属地查询API：技术原理与应用场景IP归属地查询API的工作原理并不复杂。它通过庞大的IP地址数据库，将IP地址与地理位置信息进行匹配，从而返回查询结果。这些数据库通常由专业的网络
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。