RzBu11d023r

负载均衡一致性哈希算法实现 | nginx 负载均衡一致性哈希源码分析 | ngx_http_upstream_consistent_hash_module 源码分析

这是本学期分布式计算/系统课程负载均衡节的课后作业，理解七层反向代理的负载均衡 Nginx 中使用的的一致性哈希算法。开头只是讲一些没用的东西，后面主要是分析 Nginx 的 O(1) 时间复杂度的一致性哈希负载均衡的模块源代码实现，顺便了解一下 nginx 模块开发（参考Development guide (nginx.org) 中的 load balancing 部分）的大致样子。

前情提要：

负载均衡比较 | dpdk 和 lvs 对比 | Nginx 反向代理负载均衡实验_我说我谁呢 --CSDN博客_lvs反向代理

文件共享服务的需求

一开始还是以最为广泛使用的 P2P、BT、PT 等分布式系统来讲解吧。一致性哈希还应用在负载均衡、分布式缓存（比如分布式 kv 数据库）等很多方面。

NAT 废话

P2P 的最大拦路虎是 nat ，对于纯纯 p2p 的 nat 打洞之前的笔记已经有了结论了，总之就是一方公网肯定赢，采用公网中介节点中转浪费带宽，两方 nat 只能借助一个索引服务器进行打洞不保证能通（对称和不对称、IPS nat 网关对入站和出站不同的策略、因素比如连通时机、链路上设备对某个 rfc 的支持、isp 掐断连接等）。对于 BT 来说，最好的体验需要公网 IP，百度云之前的 P2P 可能是 nat 内的，之前 windows 10 支持的系统更新下载 p2p 也是说就近的用户共享可能也是 nat 内，避免进行复杂的不可靠不可控的 nat 打洞，对于 BT 没有公网 IP 可能也能做种，因为至少一些节点有公网 IP 或者他的 nat 支持 in bound，但是具体有没有 nat 打洞可能是没有的。

Tracker 服务器

没有 DHT 的他们实际不是完全去中心化的，因为至少他需要 tracker 服务器，当然 tracker 服务器理论上是必须的（索引作用）。如果能够把这个索引的功能做成分布式的就能从文件去中心化到完全去中心化。这里就用了 DHT（Distributed Hash Table）技术，算法是一致性哈希算法。进入一个共享资源的网络时，索引信息是必须的，不然你不知道去哪里下载。tracker 的原理是在 torrent 上附带一个 trackerlist，一般 tracker 服务器是不会完蛋的。然后下载方或者做种方都可以链接到 tracker 服务器上让别人了解到一些 metadata。

tracker 的原理是新人通过 torrent 信息发送请求给 tracker server，请求的内容包括种子标识、节点标识、端口、需要下载的范围之类的东西，当然节点的下载开始、停止做种等也会通过请求来进行。然后 tracker 会发一些信息返回，这些信息包括下载完的（可以发送请求）和还在下载（给你之后做种用，比如 nat 可以通过这个给公网用户做种）节点数、节点的 ip:port 等。

BitTorrent

而下载的过程无非就是直接向公网地址请求、运营商大内网时直接请求，本机公网的可能收到 nat 的入站请求等，然后就是下载文件了。这个过程如下（PPT 来自 Princeton COS518: Advanced Computer Systems Lecture 15 spring 17）：

更加详细的，通过一个非官方的 spec 看 BitTorrentSpecification - TheoryOrg （v1.0 的，没有用到 dht 和一致性哈希）。tracker 本身不保存文件的信息，比如某个节点他哪个文件在哪个范围，因为这个可能会易变动，不可能时刻 coordinate。对于具体的官方资料， bittorrent 他们给了一些 bep_0000.rst_post (bittorrent.org)，包括普通的、投入使用的比如 uTorrent 可能有一些新的 extensions，以及一些 draft。当然 spec 本身没有说 dht 怎么实现，易接口的方式描述使用 dht 构建 bt 客户端。总之现在知道 tracker 的实现是没有一致性哈希的，文件能不能下载，节点有哪些文件这些需要通过 peer message 来获取。

一致性哈希和 DHT 概述

一致性哈希可以用来实现 dht 。DHT 能够保证链路的稳定性，say 一个新人要下载东西，使用哈希算法来进行一堆文件服务器中选一个下载某个块，过程中的节点进出会导致哈希的变动，网络动荡不安。DHT 的原理是构建一个分布式的 hash table 技术（或者就字面意义指这个哈希表）。以 BT 举例，DHT 使得每一个节点都只有部分哈希表（当然整体上会有 replication）。结合一致性哈希，能够实现一个要点就是对于新节点的加入来说，即使链路上的节点没有获取到最新的哈希表（CAP 来说这个实现没有一致性但是有 Partition tolerance 和 Avaliabilitiy），也能支持正常的下载，如果有人 down 机了，下载方自然会请求更新 DHT。对于服务器的负载均衡的时候，注册用户的数据在哪个服务器（数据库水平分区），就应该保证每次都对应到那一台避免大量缓存失效。

图解

15-445 Intro to DDB 里面的图解

总之一致性哈希的整体思路就是使用虚拟节点和某个时针的顺序遍历真实节点策略，一致在一个很大的环上面 hashing， hash 出来的是虚拟节点，虚拟节点可能没有真实节点，于是就顺延直到找到一个真实节点。

负载均衡需要的一致性哈希

Nginx 的负载均衡就可以这样实现，不过 nginx 的负载均衡根本不需要 DHT。但是注意的是默认的 ip_hash 策略不是的，其中不包含一致性hash，所以需要安装ngx_http_upstream_consistent_hash 模块（Upstream Consistent Hash | NGINX）才能获取一致性哈希特效。

额，完全的一致性哈希算法+DHT 的实现思路可以在这个 PPT 看清楚。

L15-dhts (princeton.edu)

我主要讲一下纯一致性哈希（在一个中心化服务器上）的实现思路，对于 DHT 来说这个得另外写一篇。DHT 主要要进行哈希表信息本身的分散，每个节点只能看到一部分的内容，然后整体有 overlap 的部分。

最直接的思路是环这个很简单理解，一样真思路就是用一个数组，但是你一想啊，虚拟节点可能有很多很多的（稀疏的），而真实节点只占有一小部分，所以这样什么的效率都很低下了。本来哈希表就是平均空间浪费 100%，现在还要再搞虚拟节点，肯定是不行的。实际上的一致性哈希算法的哈希表一般是要支持动态扩容的，因为理论上我们需要保证网络总是可以加入的，所以环上真实节点的稀疏性应该维护，可以通过一个倍数来限制，扩容的时候其实很简单就是增加了末端而已，比 JDK hashmap 那个扩容简单多了！当然，实际情况是对于小网络而言，可以限制一个最大容量，大量节点的时候，环可以不用稀疏，发生动荡（比如有人 down 机了）也就变稀疏了。

所以要实现这个环，环本身是虚拟的（逻辑存储），我们可以用红黑树（std::map）、跳表等东西来做，因为本身只需要指定查找 lower_bound 或者 upper_bound 时的 comparator 就行了.

上面这个是一个 upper_bound 的例子，say hash 出来的是 0x1，那么查找的时候一直找到第一个大于 1 的，就会引流到 NodeA。边界考虑是，大于 0xazd656co 的哈希数值比如 0xfffffffe，第一个大于他的没有 Node 了，就会返回 end 迭代器，这个时候只需要返回 map 的 begin 就行了。

高性能和配置需要的优化

一个优化是，再增加一些虚拟节点从而达到分布均匀或者说负载均衡（当然均匀这个本身应该是由哈希算法保证的，但是实际是做不到的，特别是一开始物理节点就比较稀疏的情况会很容易一个负载重一个轻），另外这种方案也能方便调节比如说有一些节点的能力（对于 BT 可能是带宽之类的）更强，应当提供一些复制节点，这个实现也很简单，只需要增加一个中间层。我们每次创建节点都给 id 加上一些编号，然后他的实际信息都是同一个节点。这个优化其实还有一个用途，我们说过做 DHT 需要一些冗余存在，实际就是一些互相构成有部分重叠的小网络。

至此简单的思路都讲明白了。关键就是使用二叉树（对于动态更新需求不高可以直接用有序数据结构）而已。

ngx_http_upstream_consistent_hash_module 模块

下面应该要讲的是怎么实现分布式哈希表。比较重要的一个实现应该是 Kademlia 如果你需要实现一个 P2P 共享网络。对于实际的网络应用开发需求而言，我们并不需要分布式的哈希表来做什么东西，所以我不打算在这里讲解这个具体的算法的实现。因为本来如果你做单机服务，只有一个问题，如果要做分布式的东西，你就有两个问题了。单线程多线程也一样，如果要做多线程，那两问个题了有你。DHT 主要是用于节点的发现和联系，P2P 是一个应用，过程中这个 hashtable 可能不是一致的，但是维护的信息保证网络是一段时间可用的。而对于分布式系统来说，比如分布式数据库，需要的不是通过网络去查找节点获取信息，而是尽可能地在 CAP 里面做 trade-off ，所以这里用 Paxos 、Raft 这种协调 partitions 和 replications 的一致性才是重点。

但是上面讲的单机一致性哈希算法是广泛应用的。比如负载均衡的时候，注册用户的数据在哪个服务器（数据库水平分区），就应该保证每次都对应到那一台避免大量缓存失效。对于扩容之后，也应当保证尽可能少的路由发生改变。

不需要的运行时动态

这里本来应该有一段复习数据结构的 BST 和有序数组+二分查找的两种数据结构的复杂度分析的，但是我懒得做的，脑子里想一想就好了吧，无非是动态修改的不太一样，然后是移动的次数、Cache 友好型上的。总之其实如果知道了这个之后，实际对于 upstream server 的 configuration 是不会事实变化的，对动态修改其实并不是很需要啦。至于 down 机检测避开的情况也很好解决，不直接在哈希环上面打 tag，而是另外打就行了。实际的扩容减容的更新都是需要 reload 的，这个时候只需要保证每次初始化的时候同一台服务器都能映射到环上同一个点就行了，这个用 server name 做 hash key 就行了。

然后就看 Nginx 的一致性哈希模块是怎么实现一致性哈希的。早期这个模块的实现思路就是环形的，现在新版本的代码修改了一些地方，采用了新的思路，实现了 O(1) 引流。

ngx_http_consistent_hash/ngx_http_upstream_consistent_hash_module.c at master · replay/ngx_http_consistent_hash (github.com)

下面是对用到的数据结构的认识：

画图绘制，下面具体讲解实现。

源码分析

初始化

首先是模块的初始化：

ngx_http_upstream_consistent_hash

ngx_http_consistent_hash/ngx_http_upstream_consistent_hash_module.c at d4aa50b35bb44d576b968ecdf235c268c03664c5 · replay/ngx_http_consistent_hash · GitHub

可以看到注册 upstream 初始化函数为：ngx_http_upstream_init_consistent_hash

下面就看他

ngx_http_upstream_init_consistent_hash

中

ngx_http_consistent_hash/ngx_http_upstream_consistent_hash_module.c at master · replay/ngx_http_consistent_hash (github.com)

根据服务器的权重和一定的倍数乘积来决定最后建立多少个虚拟的中间节点来实现权重均匀分布，这里的 points 是整体的数量变量，用来决定要分配多少内存的（毕竟是 C 写的）。这里对于同样的服务器配置，应该都是同样的 points 大小。

continuum 是临时的指针，最后 buckets 会存到 us->peer.data 里面。下面是构建一个哈希环，只有有效节点的。

这一段是初始化 nodes 数组，从而根据配置文件把所有的 upstream （us）都放到 nodes 数组里面去了，每个中间虚拟节点的哈希值则是使用 crc32 算法，不过注意这里的 hash_data 的值。point 的意思就是他在0~0xffffffff 环上的点的位置，这里可以看到 hash_data 是根据 server name 和 k （就是 copy 的节点编号）来编码的，理论上服务器不可能有千万台 crc 应该不会重复，证明的话只需要证明字符串中间一个子的编码值是连续的时候会不会冲突就行了。

形成哈希环

然后采用了 qsort 来进行一次的根据哈希值（point）排序，使得数组成哈希环。

ngx_http_consistent_hash/ngx_http_upstream_consistent_hash_module.c at master · replay/ngx_http_consistent_hash (github.com)

空间换时间

然后他在 buckets 数组里面分别放上了 nodes 数组每个范围的头头（hash_find 是数组中的根据 point 的二分查找），目前情况如下图那样。

所以实际他是通过这个 buckets 来实现一致性哈希的。而 buckets 本身是对 nodes 数组的一个采样，steps * buckets = 0xffffffff，所以就是等于上面一块取一个节点然后放进 bckets 中，注意乘法溢出的利用。注意 buckets 的数量是比服务器数量要大很多的，比如 1024，上图只是简化版.

到此结束，之后只会用到 buckets （这个是最新的版本2015的实现，改为使用 bucket 进行引流），这样的好处是什么呢？是每次查询都不需要进行二分查找了，空间换时间保证了 O(1) 的引流速度，这也是高性能的要求！至于空间损耗，我大概估算是不到 10KB 吧（此处可能有误，也许可以说是很值了）。

O(1) 的客户端请求处理

接下来到客户端到达的情况了！

我们可以看到 peer init 注册为函数 ngx_http_upstream_init_consistent_hash_peer

https://github.com/replay/ngx_http_consistent_hash/blob/d4aa50b35bb44d576b968ecdf235c268c03664c5/ngx_http_upstream_consistent_hash_module.c#L135

这个函数实际就是客户端连接进来的时候进行的初始化：

ngx_http_upstream_init_consistent_hash_peer

ngx_http_consistent_hash/ngx_http_upstream_consistent_hash_module.c at d4aa50b35bb44d576b968ecdf235c268c03664c5 · replay/ngx_http_consistent_hash · GitHub

可以看到，注册 get 为

ngx_http_upstream_get_consistent_hash_peer

ngx_http_consistent_hash/ngx_http_upstream_consistent_hash_module.c at d4aa50b35bb44d576b968ecdf235c268c03664c5 · replay/ngx_http_consistent_hash · GitHub

O(1) 没毛病。（如果有错误请欢迎指出，我会悔改删除跑路）

附注，文件共享服务和 DHT 的历史（这段没有意义，不用读）。

1968-1969 年，肯尼迪被暗杀，夏威夷大学的研究人员开始研究 ALOHA 网络。1969年，Unix 被开发出来，同年ARPANET 建立，B 树被发明。
70s 初 C语言出来，B+树被发明，在电话线上可以上网（Unix）。1971 年 aloha 广播算法搞出来，同年在 ARPANET 上建立了 email。1971 年 Gourand 明暗处理，72年红黑树被发明出来。1975年 Phong 光照模型。
1978 Intel 8086 处理器发布。同年改革开放，世界上第一个 BBS。
1979 中美建交。摩托罗拉 68000，第一代 Macintosh 采用，人类消灭天花。
1980 年福岛邦彦论文提出神经网络（CNN），同年 Witted 光透视模型。1981 年，MS-DOS 系统发布。
1983 年，ARPANET 的协议标准定为 TCP/IP
1985 年出了 FTP（rfc959）。同年 80386 发布， Windows 1.0 图形界面发布. ARM 开始做 RISC，同年 C++ 出现，任天堂红白机和马里奥发布。
1986 年 SQL86 标准，塞尔达传说登场，87年 SQL 标准，最终幻想1发布。89 年 80486 处理器发布，同年 Lecun 发表第一个实现反向传播神经网络和实现了 CNN，具有应用论文。
1990 年，www 正式提出了（浏览器+网页编辑器 for NeXT（乔布斯当时离开苹果创立的，摩托罗拉 CPU）），这个时候有了各种音视频的格式，网络的传输速度也更快了，MIME 出现了。同年 lamport 大佬的 paxos 算法提出（以一个岛故事发布），此时也许没有多少人能看懂，或者分布式应用还没有广泛，总之相关的应用还要过好多年才火热。此时 windows 3.0 发布.
1991 海湾战争。同年 Linux 开始开发，AMD 发布 AM386，年底苏联解体。1992 年 OpenGL 第一版发布，。
1993 年，邪恶的 NAT 在 RFC 1663 提出。NAT 推动了互联网飞入平常百姓家。同年 HTML 提出. Windows 3.1 上支持第一个图形网页浏览器。同年 Windows NT 3.1 发布，内核支持 IOCP。同年 DOOM 游戏发布。
1994 Linux 1.0 正式发布。1995 年 DirectX 发布，win95 发布，Java 发布。1996 年 W3C 发布第一个 CSS 标准，同年游戏 Quake 游戏发布。1997年哈利波特与魔法师， GTA 游戏发布。1998 年 Google 成立。中国 CERNET 建成
1999年，napster ， p2p 音乐共享软件发布，他是一个中心化的 CS 架构，本身napster 的 Server 用来引流，文件本身则是通过 P2P 传输。第一个 GPU Geforce 256发布。美国轰炸南联盟。
2000年的时候 ed2k 出现了，他和 napster 相比最大的 feature 就是分块下载，为后面的 BT 奠定了基础。后来 ed2k 的改进版本 embed 了服务器，开始搞出网络之上的网络 eDonkey Network，也就是现代 p2p 共享网络的起源。但是本质上还是需要文件提供方充当服务器的 CS 结构，只不过这个 P2P 是指没有机构。
2001napster 树大招风，被关掉了（7月）同月 BitTorrent 发布，主要是和 ed2k 差不多，但是增加了对已下载片段的做种，同时仍然是需要中心化的 indexing sites （tracker）。同年 iPod +iTunes 发布（10月）。同年 DHT 相关研究火热（Chord 算法），但是 BitTorrent 还不支持 trackerless。ed2k 支持 seeding 的方法是搭建一个中心化的 indexing 网站，需要有人通过 torrent 给登记种子。
2002 年 Kademlia 论文（kad，基于 DHT 的 p2p overlay network）发布，同年 emule 发布，emule 是一个支持 e2dk 协议的开源客户端，1.0 时同时支持 kad 网络，成为 e2dk 的替代品，kad 网络是支持 dht 的 bt 原型。同年 linux 2.4.44 发布了 epoll。
2004 年 Nginx 第一版发布。同年 facebook，
2005 年 BitTorrent 引入 Mainline DHT 实现 trackerless，基于 Kademlia（11月），至此真正的去中心化 P2P file sharing 出现。同年分布式数据库开始流行，
20年代末中间人攻击用 TCP 搞 bittorrent 客户端，导致后续的文件服务器都开始用 UDP，ISP 不稳定，无连接报太多 hop 了，实际链路上的设备会把 UDP 丢包，具有随机性，这些可能是由于路径上设备的处理能力等有关，实际 TCP 不丢包只是因为他有重传机制，所以 UDP 也要自己做 seq、ack 、retransmission 这些。本质上什么都有连接的。
2014 年 Raft 论文（Stanford）。同年 MapReduce 论文（Google）。

集成学习中的多样性密码：量化学习器的多样性元楼集成学习学习机器学习人工智能
合集-scikit-learn(69)1.【scikit-learn基础】--概述2023-12-022.【scikit-learn基础】--『数据加载』之玩具数据集2023-12-043.【scikit-learn基础】--『数据加载』之真实数据集2023-12-064.【scikit-learn基础】--『数据加载』之样本生成器2023-12-085.【scikit-learn基础】--『数据
iOS 12.2 真机测试实战指南：全面掌握16E226测试要点 Ready-Player
本文还有配套的精品资源，点击获取简介：在iOS开发中，真机测试对于确保应用在不同设备上的性能和兼容性至关重要。本文深入解析了iOS12.2版本和特定的构建号16E226，包括新功能和改进点。重点介绍了开发者在进行真机测试时应关注的方面，如兼容性、性能、新特性集成、UI适配、错误和崩溃的修复、权限请求处理、网络连接稳定性及安全性。通过本文，开发者能够学习如何使用真机测试包16E226来优化应用，确保
考了微软MOS认证后才发现的事 qb_jiajia microsoft 微软
一、微软MOS认证和计算机二级的区别二、微软MOS认证简介微软MOS认证，MicrosoftOfficeSpecialist(MOS)中文称之为“微软办公软件国际认证”，是微软为全球所认可的Office软件国际性专业认证，全球有168个国家地区认可，每年有近百万人次参加考试，它能有效证明Word、Excel、PPT、Acess等办公软件技能。三、微软MOS认证含金量有效证明精通Ofice办公软件，
如何将应用程序从 iPhone 传输到Mac电脑 Coolmuster 苹果手机 iPhone iOS iphone macos ios
我们的设备常常需要同步以保持数据的一致性。对于iPhone用户来说，将应用程序和数据同步到Mac电脑上可以带来极大的便利，无论是为了备份、跨设备使用还是数据迁移。一、为什么需要将iPhone应用程序同步到Mac？在多种情况下，用户可能需要将iPhone上的应用程序同步到Mac上，例如：跨设备工作流程，需要在Mac上继续使用iPhone应用程序。备份应用程序及其数据，以防丢失。将iPhone上购买的
Spring MVC 框架解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC深度解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring Cloud服务治理精讲 Java廖志伟 Java场景面试宝典 Spring Cloud Service Governance Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域设计关键技术解析 Java廖志伟 Java场景面试宝典
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
iPhone 抓包工具有哪些？多工具对比分析优缺点 2501_91591841 http udp https websocket 网络安全网络协议 tcp/ip
iOS平台一向以安全性著称，这也使得对其进行网络调试和抓包变得异常困难。相比安卓，iPhone抓包难点主要在以下几点：系统限制代理设置的灵活性无法自由安装根证书抓包常涉及HTTPS解密与双向认证破解普通用户设备无root或越狱权限因此，选择一款合适的iPhone抓包工具成为开发和测试流程中至关重要的一环。本文整理了当前主流的iOS抓包工具，分别从功能范围、使用难度、兼容性和适用场景进行横向对比，希
Linux 磁盘管理、文件系统、VLM和配额：从基础到实战指南燕841 linux 运维服务器
在Linux系统运维中，磁盘管理是保障系统稳定运行的核心环节。无论是服务器扩容、新硬盘挂载，还是灵活调整存储空间，都离不开对磁盘分区、文件系统和逻辑卷的深入理解。本文将从磁盘基础讲起，逐步解析分区策略、文件系统创建、挂载管理及LVM逻辑卷技术，助你轻松驾驭Linux存储管理。一、磁盘基础：机械与固态计算机的存储核心是硬盘，从存储介质上可分为两类：机械硬盘（HDD）：依靠盘片旋转和磁头读写数据，内部
三步搞定！易涨去水印小程序教你「视频即时去水印」秘籍资源客去水印短视频去水印
一、为什么需要「去水印」？短视频去水印是很多创作者、运营者在内容传播和二次创作中常做的操作，背后涉及内容使用场景、传播效果、版权合规等多方面原因，具体可以从以下几个角度理解：一、避免“品牌冲突”，强化自身内容辨识度原视频的水印（如平台LOGO、创作者ID、账号昵称等）本质是原作者或平台的“身份标识”。如果直接使用带水印的视频（尤其是搬运、二次剪辑其他平台/创作者的内容时），水印会分散观众注意力，甚
我是如何搭建了一个企业级PDF处理平台的 wh3933 pdf 架构
第一部分：执行摘要与架构愿景1.1.拟议解决方案概述本文旨在为构建一个模块化、高鲁棒性、可扩展的企业级PDF处理平台提供全面的架构设计与技术实现蓝图。该平台的核心功能集成了虚拟打印、PDF创建、光学字符识别（OCR）以及高级加密，以满足现代企业对文档工作流自动化和安全性的严苛要求。为了实现这一目标，我们提出一个清晰的、关注点分离的系统架构。该架构将整个解决方案解耦为两个核心部分：一个部署在用户工作
虚拟局域网（VLAN） m0_73882020 计算机网络
虚拟局域网（VLAN）的ID是用于标识同一VLAN中设备的数字标签。VLAN的作用是在同一个物理网络设备（如交换机）上，将不同的设备分隔成逻辑上的多个局域网。不同VLAN的设备无法直接通信，除非通过路由器或三层交换机。这种技术提高了网络的安全性、管理性和效率。VLANID说明：VLANID范围：1-4094。ID结构：VLANID是一个12位的标识符，范围是1到4094，其中一些ID具有特殊用途或
Flask 框架：深入浅出理解其工作原理与机制 chilavert318 熬之滴水穿石 flask python 后端
今天写不发相关连载了，而是将我近段时间接触到的内容做次分享。这几天，使用了开源的DashGO框架，了解到了这个开源的底层是Flask框架。所以花了点时间了解一下，现在Web开发领域，各种框架层出不穷，看了一下Flask的源码，作为一款轻量级的PythonWeb框架，还是凸显了简洁、灵活的特点。今天就深入浅出地将我理解的Flask讲解出来。一、Flask是什么简单来说，Flask是一个使用Pytho
Docker 学习入门篇：从基础概念到实战部署
一、Docker核心概念与核心价值1.1Docker是什么？Docker是基于Go语言开发的开源容器化平台，旨在实现“一次镜像，处处运行”。它通过将应用程序及其依赖环境（代码、运行时、系统工具、系统库等）打包成一个轻量级、可移植的镜像（Image），使应用能够在不同环境中稳定运行，彻底解决了传统开发中环境不一致、部署复杂的难题。1.2Docker解决了什么问题？环境一致性难题：开发、测试、生产环境
车载以太网-TC8测试-UT(Upper Tester) 天赐好车车载以太网车载以太网 TC8 UT
目录一、技术原理：指令体系与协议适配1.**指令格式与传输机制**2.**协议栈交互逻辑**3.**规范遵循与版本演进**二、测试应用：TC8测试场景与案例1.**TCP协议栈深度验证**2.**ARP协议健壮性测试**3.**SOME/IP服务动态管理**三、实现挑战与解决方案1.**实时性要求**2.**安全性风险**3.**协议栈适配差异**四、集成流程与工具链1.**UT开发与部署**2.
【后端开发】Flask学习教程大雨淅淅后端开发 flask 学习 python 后端
目录一、Flask是什么？二、环境搭建，准备启航2.1安装Python2.2安装Flask库三、第一个Flask程序，初窥门径3.1导入Flask类3.2创建应用实例3.3定义路由和视图函数3.4运行应用四、深入理解Flask核心概念4.1路由系统详解4.2请求与响应处理4.3模板引擎Jinja2五、Flask扩展，增强战斗力5.1Flask-SQLAlchemy：数据库操作的得力助手5.2Fla
OpenHarmony实战—— 自定义构建函数：@Builder装饰器我命油我不有天 HarmonyOS OpenHarmony 鸿蒙开发 harmonyos openHarmony 鸿蒙开发 ArkUI 物联网装饰器构建函数
往期推文全新看点（文中附带最新·鸿蒙全栈笔记）1️⃣鸿蒙（HarmonyOS）北向开发知识点记录~2️⃣鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~3️⃣鸿蒙应用开发与鸿蒙系统开发哪个更有前景？4️⃣嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~5️⃣对于大前端开发来说，转鸿蒙开发究竟是福还是祸？6️⃣鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？7️⃣记录一场鸿蒙开发
【零基础学AI】第33讲：强化学习基础 - 游戏AI智能体 1989 0基础学AI 人工智能游戏 transformer 分类深度学习神经网络
本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI训练能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium(原OpenAIGym)NumPyMatplotlib推荐使用JupyterNotebook进行实验前置知识Python基础编程（第1-8讲）基本数学概念（函数、导数）神经网络基础（第23讲
Mysql 8.0问题汇总 Greenland_12 mysql 数据库
1概述8.0对安全性做了大量默认限制（认证方式、远程访问、密码复杂度等）1认证插件改变8.0使用caching_sha2_password，之前是mysql_native_password见问题328.0默认auth_socket登录8.0默认需要使用sudomysql登录见问题3同一修改38.0密码策略严格8.0validate_password.policy默认是MEDIUM见问题148.0默
Kotlin Flow 冷流和热流麦田里的守望者-Jiang Kotlin android kotlin rxjava android
本文主要分析了冷流和热流的相关实现原理，原理逻辑长而复杂。特别是涉及热流SharedFlow相关实现原理时，逻辑更是抽象，理解比较困难。本文比较长，建议根据目录选择分段阅读，可以先看基础概念和冷流，再分别看热流SharedFlow和StateFlow。阅读本文时，可以带着以下问题去思考：冷流和热流指的是什么？在业务开发中，冷流和热流可以用来做什么或者解决什么问题？冷流和热流的区别是什么？冷流的执行
【AI与数据管理】基于AI大模型的企业元数据管理方案暴躁小师兄数据学院人工智能 ai 语言模型
基于AI大模型的元数据关键解决方案元数据（metadata）是描述数据的数据，例如数据的来源、结构、类型和质量信息。它在数据管理、分析和应用中至关重要。随着人工智能（AI）大模型（如基于Transformer的模型）的发展，这些模型凭借其强大的自然语言处理、模式识别和生成能力，为元数据处理提供了高效、自动化的解决方案。下面，我将逐步解释基于AI大模型的元数据关键解决方案，帮助您理解核心方法、挑战和
【数据安全】《个人隐私保护法》详解-如何保护自己的隐私数据。暴躁小师兄数据学院数据治理大数据
《个人隐私保护法》详解《中华人民共和国个人信息保护法》（简称《个人隐私保护法》）于2021年11月1日正式实施，是我国首部专门针对个人信息保护的综合性法律。该法构建了完整的个人信息保护框架，核心内容如下：一、立法目的与适用范围立法目的规范个人信息处理活动，保障个人信息权益，促进个人信息合理利用。立法目标={保护权益规范处理促进利用\text{立法目标}=\left\{\begin{array}{l
【数据空间】数据空间基本理论及公司建设方法暴躁小师兄数据学院数据治理大数据人工智能安全网络区块链
数据空间基本理论及公司建设方法数据空间是一种数据管理框架，旨在帮助组织高效存储、访问、集成和分析数据。它强调数据作为战略资产，通过结构化方法提升数据价值。以下我将从基本理论入手，逐步解释公司如何完成建设，确保内容结构清晰、真实可靠。一、数据空间基本理论数据空间理论源于数据管理领域，核心是解决数据孤岛、不一致性和安全风险等问题。其理论基础包括：数据抽象与建模：数据空间将数据视为独立于应用的资源，使用
Flow 数据流学习-冷流和热流 qq_39844788 学习
文章参考的Kotlin学习笔记（五）——Flow数据流学习实践指北（一）-掘金Kotlin系列之认识一下Flow-掘金冷流（ColdFlow）：在数据被使用方订阅后，即调用collect方法之后，提供方才开始执行发送数据流的代码，通常是调用emit方法。即不消费，不生产，多次消费才会多次生产。使用方和提供方是一对一的关系。热流（HotFlow）：无论有无使用方，提供方都可以执行发送数据流的操作，提
前端新手看这篇就够了：各种接口请求方式全解析！鸡吃丸子前端
在前端开发中，我们经常需要向后端发送请求获取数据，比如用户登录、获取列表、提交表单等。而请求方式有很多种，例如GET、POST、PUT、DELETE，传参方式也五花八门：有的放在URL，有的放在请求体，有的用form-data，有的用JSON…这篇文章就一次性帮你理清楚各种请求方式的写法、参数位置、格式区别，帮助你彻底搞懂前端怎么写接口！一、最常用的HTTP请求方法方法说明GET获取数据（常用于查
【测开面试篇一】全网最全测试开发岗位面试真题集分享 m0_37135615 软件测试面试经面试职场和发展
前言各位测试人，大家好，最近不是在网上投简历，就是在面试的路上。也接到了不少电话面试以及F2F面试，花时间给大家整理一下互联网大厂测试开发岗位的面试知识点和一些遇到的真题，各位看官请笑纳。本人整理的面试知识点以及面试真题涵盖了互联网大厂（腾讯，字节，百度，滴滴，快手）春秋招，以及牛客网和CSDN众多面经里面的面试真题，极具含金量和真实性，里面每道题基本都是高频考察的。如果你励志想进入互联网大厂并成
数据结构——20.B树爱看烟花的码农数据结构数据结构
第一部分：核心理论精讲一、B树(B-Tree)1.为什么需要B树？当数据量非常大时，内存无法一次性装下，大部分数据需要存储在磁盘等外部存储器上。磁盘I/O（读/写）操作相比内存访问非常慢。为了减少磁盘I/O次数，我们需要一种特殊的树结构，它的每个节点可以存储大量信息，从而使得树的高度尽可能低。B树（一种多路平衡查找树）就是为此而设计的。2.B树的定义(m阶)一棵m阶B树是满足以下条件的m路查找树：
GaussDB 权限管理：从 RBAC 到精细化控制的技术实践如清风一般 gaussdb
GaussDB权限管理：从RBAC到精细化控制的技术实践一、引言在分布式数据库环境中，权限管理是保障数据安全和合规性的核心环节。GaussDB（开源版及云服务版）提供了一套完整的权限管理体系，支持基于角色的访问控制（RBAC）、细粒度权限分配和动态审计等功能。本文将深入解析GaussDB的权限管理模型、操作方法及实战技巧。二、GaussDB权限管理模型核心对象与层级GaussDB的权限管理围绕以下
雪豹速清：智能清理，释放手机空间非凡ghost 智能手机软件需求 android 生活
在智能手机的日常使用中，随着时间的推移，手机内存往往会逐渐被各种垃圾文件占据，导致手机运行缓慢、存储空间不足。为了解决这一问题，南宁酷比网络科技有限公司推出了雪豹速清这款功能强大的手机清理软件。它通过智能筛选垃圾文件、保护重要数据、查找卸载残留等功能，为用户提供了一个高效、安全的手机清理解决方案，让手机内存空间更加清洁，运行更加流畅。雪豹速清为用户带来轻松的文件管理功能，你可以对手机的内存进行清理
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

负载均衡一致性哈希算法实现 | nginx 负载均衡一致性哈希源码分析 | ngx_http_upstream_consistent_hash_module 源码分析

前情提要：

文件共享服务的需求

NAT 废话

Tracker 服务器

BitTorrent

一致性哈希和 DHT 概述

图解

负载均衡需要的一致性哈希

高性能和配置需要的优化

ngx_http_upstream_consistent_hash_module 模块

不需要的运行时动态

源码分析

初始化

形成哈希环

空间换时间

O(1) 的客户端请求处理

附注，文件共享服务和 DHT 的历史（这段没有意义，不用读）。

你可能感兴趣的:(网络编程,分布式系统,理解性笔记,负载均衡,哈希算法,nginx)