京东云开发者

图计算引擎分析——Gemini

作者：京东科技王军

前言

Gemini 是目前 state-of-art 的分布式内存图计算引擎，由清华陈文光团队的朱晓伟博士于 2016 年发表的分布式静态数据分析引擎。Gemini 使用以计算为中心的共享内存图分布式 HPC 引擎。通过自适应选择双模式更新（pull/push），实现通信与计算负载均衡 [‎1]。图计算研究的图是数据结构中的图，非图片。

实际应用中遇到的图，如社交网络中的好友关系、蛋白质结构、电商等 [‎2] 等，其特点是数据量大（边多，点多），边服从指数分布（power-law）[‎7]，通常满足所谓的二八定律：20% 的顶点关联了 80% 的边，其中 1% 的点甚至关联了 50% 的边。

如何存储大图

随着社交媒体、零售电商等业务的发展。图数据的规模也在急剧增长。如标准测试数据集 clueweb-12，生成后的文本数据大小 780+GB。单机存储已经不能满足需求。必须进行图切分。常见的图切分方式有：切边、切点。

切点：又称 “以边为中心的切图”，保证边不被切开，一条边在一台机器上被存储一次，被切的点创建多个副本，副本点所在的机器不清楚关于此点的相关边。如上图所示，中间点被分别保存三个版本，此点会分别出现在三台机器上，在做更新时需要更新三次。

切边：又称以 “顶点为中心的切图”，相比于切点，保证点不被切开。边会被保存两次，作为副本点所在机器能清楚感知到此点的相关边。如上图所示信息只进行一次更新。

Gemini 采用切边的方式进行存储。

定义抽象图为 G (V,E)，Gemini 定义了主副本（master）与镜像副本（mirror），计算时是以 master 为中心进行计算。如下图所示，集群每台机器上仅保存 mirror 到 master 的子图拓扑结构，而 mirror 点并未被实际存储（比如权重值），每台机器负责一部分 master 存储（

）。

如下图所示，Gemini 将图按照 partition 算法切分到 2 个不同的机器。其中 mirror 作为逻辑结构，没有为其分配实际存储空间；但每条边被存储了两次。

优点：单机可以完整获取 master 的拓扑结构，不需要全局维护节点状态。

图存储

图的常见存储方式：邻接矩阵、邻接表、十字链表，此处不作详细解释，有兴趣可参照 [‎3]。

表示方法	邻接矩阵	邻接表	十字链表
优点	存储结构简单，访问速度快，顺序遍历边	节省空间，访问速度较快	在邻接表基础上进一步，节省存储空间。
缺点	占用空间很大（n*n 存储空间）	存储使用指针，随遍历边结构，为提高效率，需要同时存储出边入边数据。	表示很复杂，大量使用了指针，随机遍历边，访问慢。

分析上表优缺点，可见：上述三种表示方式都不适合幂律分布的 graph 存储。

压缩矩阵算法

图计算问题其实是一个 HPC（High Performance Computing）问题，HPC 问题一般会从计算机系统结构的角度来进行优化，特别在避免随机内存访问和缓存的有效利用上。有没有一种既保证访问效率，又能满足内存的局部性，还能节省空间的算法呢？压缩矩阵存储。

常见的图压缩矩阵算法有三种 coordinate list（COO）、Compressed sparse row（CSR）、Compressed sparse column (CSC) 算法进行压缩 [‎8][‎9]。

COO 压缩算法

COO 使用了坐标矩阵实现图存储（row,collumn,value），空间复杂度 3*|E|；对于邻接矩阵来说，如果图中的边比较稀疏，那么 COO 的性价比是比较高。

CSR/CSC 压缩算法

CSC/CSR 都存储了 column/row 列，用于记录当前行 / 列与上一个行 / 列的边数。Index 列存储边的所在 row/column 的 index。

CSC/CSR 是在 COO 基础上进行了行 / 列压缩，空间复杂度 2|E|+n，实际业务场景中的图，边往往远多于点，所以 CSR/CSC 相对 COO 具有更好压缩比。

优点：存储紧密，内存局部性强；

缺点：遍历边时，需要依赖上一个点的最后一条边的 index，所以只能单线程遍历。

压缩矩阵算法无法实时更新拓扑结构，所以压缩矩阵算法只适用静态或者对数据变化不敏感的场景。

CSC 伪代码	CSR 伪代码
loc← 0 for vi←0 to colmns for idx ←0 to colmn [i] do // 输出到指定行的列 edge [vi][index [idx]] ←value [loc] loc← loc+1 end end	loc← 0 for vi←0 to rows for idx ←0 to row [i] do // 输出到指定列的行 edge [ index [idx]] [vi] ←value [loc] loc← loc+1 end end

Gemini 的图压缩

Gemini 对 CSC/CSR 存储并进行了改进，解释了压缩算法的原理。Gemini 在论文中指出，index 的存储空间复杂度是 O (V)，会成为系统的瓶颈。

引出了两种算法：Bitmap Assisted Compressed Sparse Row（bitmap 辅助压缩 CSR）和 Doubly Compressed Sparse Column（双压缩 CSC），空间复杂度降到 O (|V’|),|V’| 为含有入边点的数量。

Gemini 改进后的 CSR 算法使用 bitmap 替换 CSR 原有的 Rows 结构：

• ext 为 bitmap，代码此 bit 对应的 vid 是否存在出边，如上 id 为 0/2/4 的点存在出边。

• nbr 为出边 id；

• ndx 表示保存了边的 nbr 的 index 范围；

如上图 CSR 图，点 0 存在出边（ext [0] 为 1），通过 idx 的差值计算出 0 点存在一条出边（idx [1]-idx [0]=1），相对于存储 0 点第一条出边的 nbr 的下标为 0（idx [0]）；同理可推得点 1 无出边。

Gemini 双压缩 CSC 算法将 idx 拆分成 vtx 及 off 两个结构：

• vtx 代表存在入边的点集合；

• nbr 为入边数组；

• Off 表示保存入边 nbr 的 index 偏移范围；

如上图 CSC 算法：vtx 数组表示点 1，2，3，5 存在入边，使用 5 个元素的 off 存储每个点的偏移量。如点 2 存在由 0 指向自己的入边 (0ff [2]-off [1]=1), 所以 nbr [1] 存储的就是点 2 的入边 id（0）。

优点：通过改进后的存储结构，同时支持多线程并行。

Gemini 的双模式更新

双模式更新是 Gemini 的核心：Gemini 采用 BSP 计算模型，在通信及计算阶段独创性地引入 QT 中的 signal、slot 的概念；计算模式上借鉴了 ligra 的设计 [‎5]。

Gemini 沿用 Ligra 对双模式阈值定义：当活跃边数量小于（｜E｜/20，|E | 为总边数）时，下一轮计算将使用 push 模式（sparse 图）；否则采用 pull 模式（dense 图）。这个值为经验值，可根据场景进行调整。

在开始计算前，都需要统计活跃边的数量，确定图模式。

在迭代过程中，每一个集群节点只保存部分计算结果。

在分布式系统中，消息传播直接涉及到通信量，间接意味着阈值强相关网络带宽和引擎的计算效率。双模式直接平衡了计算负载与通信负载。

圆角矩形标识操作是在本地完成的，Gemini 将大量的需通信工作放在本地完成。

Gemini 节点构图

Gemini 在实现上，增加 numa 特性。如何分配点边，如何感知 master 在哪台机器，哪个 socket 上，都直接影响到引擎计算效率。

location aware 和 numa aware 两个 feature 去解决了上述问题；由于 Graph 幂律分布的特点，运行时很难获得很好的负载均衡效果，所以在 partition 时，也引入了平衡因子 α，达到通信与计算负载均衡。

在 partition 阶段通过增加 index 结构：partition_offset, local_partition_offset。（partition_offset 记录跨机器的 vid offset，local_partition_offset 记录跨 numa 的 vid offset）。

Location-aware

以边平均算法为例，集群规模 partitions = 4（台），图信息见下表。

点边分布情况

点 s	0	1	2	3	4	5	6	7	8
Out Edge	0	3	5	30	2	4	6	2	20

存在出边 sum = 72

切图轮次	1	2	3
剩余边	72	34	22
平均分配	18	12
Master 分配结果	0: 0～3
1：	4~6
2：		7~8
3:

从上表分析可见：

• 编号为 0 的机器分配 4 点 38 条边；

• 编号为 1 的机器分配 3 点 12 条边；

• 编号为 2 的机器分配 2 点 22 条边；

• 编号为 3 的机器分配 0 点 0 条边。

此方法分配会造成负载的偏斜，影响到引擎的计算效率。

Gemini 在切图时，每个 partition 分配点个数遵循公式

, 其中平衡因子定义为 α=8*（partitions-1）。

仍然以上图为例，Gemini 通过ɑ因子平衡了边的分布。

切图轮次	1	2	3	4
剩余权重边	288	208	128	44
平均分配	72	70	64	44
Master 分配结果	0: 0～2
1：	3～4
2：		5～7
3:			8

对比两次切分的结果，添加 α 增加了出边较少的点的权重。

通过实际场景应用发现：按照论文中 α 平衡因子设定，很可能出现内存的倾斜（内存分配上相差 20% 左右，造成 oom kill）。在实际生产场景中，我们根据时间场景和集群配置，重新调整了 α 参数取值设置，内存分配基本浮动在 5% 左右。

Numa-aware

NUMA 介绍

根据处理器的访问内存的方式不同，可将计算机系统分类为 UMA（Uniform-Memory-Access，统一内存访问）和 NUMA（Non-Uniform Memory Access, 非一致性内存访问）。

在 UMA 架构下，所有 cpu 都通过相同的总线以共享的方式访问内存。在物理结构上，UMA 就不利于 cpu 的扩展（总线长度、数据总线带宽都限制 cpu 的上限）。

Numa （Non-Uniform Memory Access, 非一致性内存访问）是目前内核设计主流方向。每个 cpu 有独立的内存空间（独享），可通过 QPI（quick path Interconnect）实现互相访问。由于硬件的特性，所以跨 cpu 访问要慢 [‎11]。

相对于 UMA 来说，NUMA 解决 cpu 扩展，提高数据总线宽度总线长度带来的问题，每个 cpu 都有自己独立的缓存。

根据 NUMA 的硬件特性分析，NUMA 具有更高本地内存的访问效率，方便 CPU 扩展。HPC 需要数据访问的高效性，所以 NUMA 架构更适合 HPC 场景（UMA 与 NUMA 无优劣之分）。

Gemini 充分利用了 NUMA 对本 socket 内存访问低延迟、高带宽的特性，将本机上的点跨多 socket 数据实现 NUMA-aware 切分（切分单位 CHUNKSIZE）。切分算法参考 Location-aware。

Gemini 的任务调度

Gemini 计算采用 BSP 模型（Bulk Synchronous Parallel）。为提高 CPU 和 IO 的利用率做了哪些工作呢？Gemini 提出了两个设计：计算通信协同调度、work stealing（偷任务）。

计算通信系统调度

Geimini 在计算过程中引入了任务调度控制。他的调度算法设计比较简单，可简单理解为使用机器节点 ID 按照规定顺序收发数据，避免收发任务碰撞。

Gemini 将一轮迭代过程称为一个 step，把每一个 step 又拆分为多个 mini step（数量由集群规模确定）。

• computation communication interleave

为了提高效率，减少线程调度的开销，Gemini 将一次迭代计算拆分成了 computation 和 communication 两个阶段。在时间上，每一轮迭代都是先计算，再进行通信，通信任务调度不会掺杂任何计算的任务。

这样设计的好处在于既保证上下文切换的开销，又保证内存的局部性（先计算再通信）。缺点就在于需要开辟比较大的缓存 buffer。

• Task Schedule

简而言之：每个机器都按照特定的顺序收发数据

上图列举了集群中 master 分布情况，以 Node0 为例：

节点	Node 0
Master 范围	0、1
阶段 1	将数据向 Node1 发送关于点 2 的数据，接收来自 Node2 数据
阶段 2	将数据向 Node2 发送关于点 5 的数据，接收来自 Node1 数据
阶段 3	处理自身的数据（本地数据不经网络传输）

在整个过程中，node0 按照机器 id 增序发送，按照机器 id 降序接收，这个 feature 可以一定程度避免出现：同时多台机器向同一台机器发送数据的情况，降低通信信道竞争概率。

Work stealing

该设计是为了解决分布式计算系统中常见的 straggler 问题。

当某个 cpu task 处理完成所负责的 id，会先判断同一个 socket 下的其他 cpu task 是否已完成。如果存在未完成任务，则帮助其他的 core 处理任务。(跨机器的 work stealing 没有意义了，需要经历两次网络 io，而网络 io 延迟是大于处理延迟。）

Gemini 开源代码中定义线程状态管理结构，下图引用了开源代码的数据结构，并对变量进行了说明。

开始计算时，每个 core 均按照自己的 threadstate 进行处理数据，更大提升 cpu 使用效率。该设计是以点为单位进行的数据处理，但未解决热点的难题（这也是业界难题，可以对热点再次切分，也是需要突破的一个问题）。

下面是 2 core 的 work stealing 示意图：

其中在初始情况 T0 时刻，core1 与 core2 同时开始执行，工作状态都为 working；

在 T1 时刻， core2 的任务首先执行完成，core1 还未完成。

为了提高 core2 的利用率，就可以将 core1 的任务分配给 core2 去做。为了避免 core1、core2 访问冲突，此处使用原子操作获取 stealing 要处理 id 范围，处理完成之后，通过 socket 内部写入指定空间。

在 T2 时刻，core2 更新工作状态为 stealing，帮助 core1 完成任务。

在开源代码中，在构图设计 tune chunks 过程，可以实现跨机器的连续数据块读取，提升跨 socket 的效率。

注：开源代码中，push 模式下并未使用到 tread state 结构，所以 tune chunks 中可以省略 push 模式 thread state 的初始化工作。其中在初始情况 T0 时刻，core1 与 core2 同时开始执行，工作状态都为 working；

Gemini API 接口设计

API 设计上借鉴了 Ligra，设计了一种双相信号槽的分布式图数据处理机制来分离通信与计算的过程。

屏蔽底层数据组织和计算分布式的细节。算法移植更加方便，简化开发难度。并且可以实现类 Pregel 系统的 combine 操作。

将图的稀疏、稠密性作为双模式区分标志。

Gemini 算法调用使用 c++11 的 lambda 函数表达式，将算法实现与框架解耦。

Gemini 在框架设计中创新的使用 signal、slot。将每轮迭代分为两个阶段：signal（数据发送），slot（消息处理），此处实现了通信与数据处理过程的解耦。

Gemini 源码分析

Gemini 代码可以分为初始化，构图，计算三部分。

初始化：设置集群配置信息，包括 mpi、numa、构图时所需的 buffer 开销的初始化；

构图：依据算法输入的数据特征，实现有 / 无向图的构造；

计算：在已构造完成的图上，使用双模式计算引擎计算。

Gemini 构图代码分析

Gemini 在构图时，需要事先统计每个点的出边、入边信息，再依据统计信息切图，申请存储图所需的空间。

以无向图构建为例，整个构图过程经历了 3 次文件读取：

1. 统计入边信息；

2. 生成图存储结构（bitmap、index）；

3. 边数据存储。

入口函数：load_undirected_from_directed

开源源码 Gemini 集群同时分段读取同一份 binary 文件，每台机器都分段读取一部分数据。

出边信息统计

上图代码分段读取文件，统计每个点的出边信息，见 line 456、457，通过 openmpi 通信，聚合所有点出边信息 line 460。

Line 451：原理上可以使用 omp 并发，但由于原子操作锁竞争比较大效率并不高。

Location aware 代码实现

Gemini 在 location aware 解决了地址感知，集群负载平衡的工作。

解释最后一行：owned_vertices 记录当前机器 master 点个数，partition_offset [partition_id] 记录 master 节点 vid 的下限，partition_offset [partition_id+1] 记录 master 节点 vid 的上限。

好处：

1. 提升了内存的访问效率；

2. 减少了内存的零头（在这个过程中，Gemini 为提高内存块读取的效率，使用 pagesize 进行内存对齐。）。

NUMA aware 代码实现

NUMA aware 作用是在 socket 上进行了 partition，平衡算力和 cpu 的负载，程序实现与 Location aware 过程类似。

NUMA aware 也进行了 a 因子平衡和 pagesize 对齐。

总结：机器机器共享同一份出边统计数据，所以在 location aware 和 numa aware 阶段的结果都是相同的，partition 结果也不会出现冲突的情况。

注：aware 阶段都是对 master 的切分，未统计 mirror 的状态；而构图过程是从 mirror 的视角实现的，所以下一个阶段就需要统计 mirror 信息。

构建边管理结构

在完成 Location aware 和 NUMA aware 之后，需要考虑为边 allocate 存储空间。由于 Gemini 使用一维数组存储边，所以必须事先确定所需的存储空间，并 allocate 相应的内存管理结构。Gemini 使用二级索引实现点边遍历。

读者很可能出现这样的误区：建立 master->mirror 关系映射。这样会带来什么问题？超级顶点。也就意味着通信和计算负载都会上升。这对图计算引擎的效率影响很大。

可自行计算万亿级别点，每个 socket 上存储的 index 占用的空间。

单

节点处理本地数据（按照 CHUNCKSIZE 大小，分批向集群其他节点分发边数据）。记录 mirror 点的 bitmap 及出边信息。

数据发送过程是按照 CHUNCKSIZE 大小，分批发送。

在发送结束时，需确保所用的数据发送完成，发送字符‘\0‘作为结束符。

图存储

依据上一阶段构建的管理结构实现边的存储，管理结构解释：

Bitmap 的作用是确定在此 socket 下，此 mirror 点是否存在边；

Index 标识边的起始位置（见图压缩章节介绍）。

下图注释内容介绍了 index 的构建过程，构建过程中使用了单线程，cpu 利用率较低，可自行测试一下。

在边存储时，数据分发实现了并发传输。代码实现过程，见下图代码注释。

边数据分发过程代码：

任务调度代码实现

构建任务调度数据结构 ThreadState, 参数配置 tune_chunks 代码实现，使用了 α 因子进行平衡。逻辑上将同一个 socket 的边数据，按照线程进行二次划分（balance）。

计算源码分析

双模式的核心思想：尽可能将通信放到本地内存，减少网络 IO 开销。

以 dense 模式为例：pull 模式将集群中的其他节点的部分结果 pull 到本地，实现同步计算。

处理模块代码定义

注意：line1796 send_queue_mutex 的使用，通过锁控制发送模块的先后顺序。

任务调度算法实现：

为保证每台机器上的计算结果一致，所以在传播过程中每个机器都会接收到相同的数据，在进行计算。

总结

Gemini 的关键设计：

• 自适应双模式计算平衡了通信和计算的负载问题；

• 基于块的 Partition 平衡了集群单机计算负载；

• 图压缩降低了内存的消耗。

Gemini 可继续优化方向：

• Proces_edges 过程中，发送 / 接收 buffer 开辟空间过大，代码如下：

在切换双模运算时，调用了 resize 方法，此方法实现：当仅超过 capacity 时，才重新 alloc 内存空间，未实现进行缩容（空间

）。

• adj_index 会成为系统瓶颈

论文中也提到 adj_index 一级索引会占用大部分空间（论文中也提到了会成为瓶颈）。改进后的 CSC 压缩算法使用二级索引结构。在计算时会影响数据访问速度，无向图中压缩效果不好，远高于一级索引的空间复杂度（幂律分布决定，极大部分点存在 1 条以上的出边，易得空间复杂度 2|V’|>|V|）。

• α 因子调整

α 因子应该根据图的特征进行动态调整，否则很容易造成内存 partition 偏斜。

• 动态更新

由于压缩矩阵和 partition 方式都限制了图的更新。可通过改变 parition 切分方式，牺牲 numa 特性带来的局部性，通过 snapshot 实现增量图。

• 外存扩展

Gemini 是共享内存的分布式引擎。在实际生产环境中，通过暴力增加机器解决内存不足的问题，不是最优解。大容量外存不失为更好的解决方案。

参考文献

11 1. Gemini: A Computation-Centric Distributed Graph Processing System 2. https://zh.wikipedia.org/wiki/%E5%9B%BE_(%E6%95%B0%E5%AD%A6) 3. https://oi-wiki.org/graph/save/ 4. https://github.com/thu-pacman/GeminiGraph.git 5. Ligra: A Lightweight Graph Processing Framework for Shared Memory 6. Pregel:a system for large-scale graph processing. 7. Powergraph: Distributed graph-parallel computation on natural graphs 8. https://en.wikipedia.org/wiki/Sparse_matrix#Coordinate_list_(COO) 9. https://programmer.ink/think/implementation-of-coo-and-csr-based-on-array-form-for-sparse-matrix.html 10. https://frankdenneman.nl/2016/07/06/introduction-2016-numa-deep-dive-series/ 11. https://frankdenneman.nl/2016/07/13/numa-deep-dive-4-local-memory-optimization/

内容来源：京东云开发者社区 [https://www.jdcloud.com/]

你可能感兴趣的:(前端,java,开发语言)

Android Studio 中将 AAR 包发布到 Maven 本地仓库帅次 Android Studio android studio maven android kotlin flutter gradle macos
目录1.配置build.gradle.kts（或build.gradle）2.配置publishing任务3.发布到本地Maven仓库3.1Couldnotfindmethodpublications()forarguments...3.2bash:./gradlew:Permissiondenied3.3AndroidGradlepluginrequiresJava17torun.Youarec
android视频缓存框架 [AndroidVideoCache](https://github.com/danikula/AndroidVideoCache) 源码解析与评估 MrJarvisDong third party 源码
文章目录android视频缓存框架[AndroidVideoCache](https://github.com/danikula/AndroidVideoCache)源码解析与评估引言使用方式关键类解析HttpProxyCacheServer代理缓存服务类**java.net.ProxySelector**代理选择Pinger判断本地serverSocket是否存活GetRequest封装用于获取
基于JAVA中的spring框架和jsp实现自然灾害论坛平台项目【附项目源码+论文说明】大雄是个程序员项目实践自然灾害论坛平台 java 项目源码 spring 毕业设计课程设计网页设计
摘要在上个世纪末期，也就是20世纪末，随着计算机技术的发展与进步和数据库方面的知识在互联网的大力运用，互联网技术以及网站技术在网上的大力推广，网上论坛（自然灾害论坛）也逐渐在网兴起，它的出现帮助了网上各种特定的群体进行一个在线的知识传递与信息的交流。本计算机自然灾害论坛设计，采用了JSP（JAVA）技术和MYSQL数据库开发，尝试实现了自然灾害论坛的基本功能以及帮助我们掌握了论坛技术的核心特点。该
Java架构师成长之路 hweiyu00 分享 spring 微服务 spring cloud java
概述本教程主要从6个方面，全面讲解Java技术栈的知识。1.性能调优深入理解MySQL底层原理、索引逻辑，数据结构与算法。使用Explain进行优化分析MVCC原理剖析日志机制解析2.框架源码掌握Spring底层原理带你手写一个Spring解析IOC、AOP源码、以及事务原理3.并发编程剖析Java底层锁机制CAS、JUC工具使用、AQS源码分析以及并发的集合类的讲解4.分布式开发剖析分布式中使用
Java面试高频问题深度解析：JVM、锁机制、SQL优化与并发处理 Debug Your Career 面试 java 面试 jvm
问题列表Java中如何实现一个工作流引擎？Bean的作用域有哪些？JVM中的锁机制是如何工作的？三个方法分别被synchronized锁住，方法a调用方法b，b能获取到a的锁吗？会有什么问题？SQL优化时，EXPLAIN中需要关注哪些关键点？什么是覆盖索引？SELECT*一定不会命中索引吗？SELECT*和SELECT全字段在性能上有区别吗？什么是回表？它与索引有什么关系？100万数据分给10个线
JavaScript基础-DOM的一些基本常用语法 Southern Wind JavaScript javascript
总结了一下JS一直到DOM中所用的单词的用法输入方式：window.prompt('请输入数据');输出方式：1、window.alert('HelloJavaScript');2、console.log输出到控制台3、输出数据到页面document.write('hello')JavaScript数据类型1、基本类型string：字符型number：数值型boolean：布尔型2、特殊类型und
CopyOnWriteArrayList详解重生之我在成电转码 java 开发语言集合
1️⃣什么是CopyOnWriteArrayList？java.util.concurrent包下的线程安全的List读多写少场景下的性能优选核心思想：写时复制（Copy-On-Write）2️⃣底层原理内部维护一个volatileObject[]array读操作：直接读取数组，不加锁，性能极高写操作（增删改）：加ReentrantLock互斥锁把原数组复制一份新数组在新数组上操作操作完成后，替换
JavaScript基础-删除事件（解绑事件）難釋懷 javascript 前端开发语言
在现代Web开发中，动态地添加和移除事件处理器是构建交互式网页的关键技能之一。虽然添加事件处理器相对直观，但了解如何有效地移除或“解绑”这些处理器同样重要。这不仅有助于优化性能，还能防止潜在的内存泄漏问题。本文将介绍几种方法来删除JavaScript中的事件处理器，并探讨它们的应用场景及最佳实践。一、为什么需要删除事件？随着页面复杂度的增加，不恰当地管理事件处理器可能会导致性能下降或出现意外行为。
fastjosn注册自定义序列化器林发和开发语言 java
自定义序列化器： importcom.alibaba.fastjson.serializer.JSONSerializer; importcom.alibaba.fastjson.serializer.ObjectSerializer; importorg.springframework.boot.actuate.health.Status; importjava.io.IOExcepti
没想到枚举Enum类还能实现接口！教你玩转Java枚举Enum 林发和 Java 干货分享 java
枚举是什么？枚举是一种特殊的数据类型，预先定义一组常量（对象），并且必须为其赋值。Java枚举类型的基本想法非常简单：这些类通过共有的静态final域为每个枚举常量导出一个实例。枚举类型没有可以访问的构造器，所以它是真的final类。客户端不能创建枚举类型的实例，也不能对它进行扩展，因此不存实例，而只存在声明过程的枚举常量。也就是枚举类型是实例受控的。它们是单例（Singleton）的范型化，本质
SpringBoot 整合security 实现自定义Token和clientId登录及退出(二) .猫的树 spring boot spring java
接上一篇6.认证相关处理创建登录成功DemoAuthenticationSuccessHandler.java/***用户身份验证通过处理*/@Component@SuppressWarnings("all")publicclassDemoAuthenticationSuccessHandlerimplementsAuthenticationSuccessHandler{@Autowiredpri
Flink sql-clinet 查询报错 lhfmqc sql-clinet 运行问题查询报错 flink
Flinksql-clinet查询报错运行后进行select'helloworld’报以下错误，couldnotexecutesqlstatementjava.net.NoRouteToHostException:Noroutetohost在关闭防火墙之后仍无法解决这个时候你需要进入flinkconf配置中查看flink-conf.yaml文件，查看jobmanager.rpc.address该地
rocketmq-client 4.3.0 在springboot中的使用 Myueye JAVA java
rocketmq-client4.3.0在springboot中的使用1、导入依赖2、配置文件属性3、编写配置类4、使用测试5、结果5.1RocketMQ后台显示5.2前端页面5.3后端后台1、导入依赖org.apache.rocketmqrocketmq-client4.3.02、配置文件属性mq.nameserverAdd=ip地址:9876mq.topic=top1(topic名称)mq.p
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
Linux脚本实践1 一点多余. linux 运维服务器脚本
前言日常在Liunx中用到多个版本的java修改很麻烦，一个脚本搞定。1.准备两个jdk(如下图所示)2.准备脚本文件viswitch_jdk.sh#!/bin/bash#提示用户输入JDK路径read-p"请输入JDK的绝对路径（例如/usr/local/jdk/jdk-11.0.21）："jdk_path#检查输入的路径是否存在if[!-d"$jdk_path"];thenecho"错误：路径
Spring Bean 的生命周期：从创建到销毁的完整解析一点多余. java 开发语言
引言：为什么需要了解SpringBean的生命周期？在Spring框架中，Bean是应用程序的核心构建块，理解其生命周期对于开发高效、稳定的应用至关重要。根据2023年JetBrains开发者调查报告，超过75%的Java开发者使用Spring框架，而Bean的生命周期管理是Spring的核心特性之一。以下数据展示了Bean生命周期的重要性：90%的Spring性能问题与Bean的初始化或销毁不当
六十天前端强化训练之第二十九天之深入解析：从零构建企业级Vue项目的完整指南编程星辰海 #前端前端 Vue项目
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、Vite核心原理与开发优势二、项目创建深度解析三、配置体系深度剖析四、企业级项目架构设计五、性能优化实战六、开发提效技巧七、质量保障体系八、扩展阅读推荐一、Vite核心原理与开发优势1.1为什么选择Vite？Vite采用现代浏览器原生ES模块系统（NativeESM）作为开发服务器，颠覆了传统打包工具的
今日BUG— java.lang.NumberFormatException 水晶果冻1125 其它 bug int范围
今日照例巡检系统，打开系统的汇聚首页，发现数据都消失了，于是查看其他服务器上部署的版本也出现了同样的问题，而其他功能并未受影响，排除后台服务挂掉的可能，内心生出疑问一直运行稳定的程序怎么突然都查不出来内容了呢？赶紧查看系统运行日志，果然看见了报错信息java.lang.NumberFormatException:Forinputstring:"2315841207"于是赶紧确认了下int数据类型的
HTTP核心知识 Sean2077 HTTP http
理解HTTP协议是优化Web应用性能、调试问题和实现高效通信的基础。以下是前端开发者需要掌握的核心HTTP知识：1.HTTP基础概念请求与响应模型理解客户端（浏览器）发送HTTP请求，服务器返回HTTP响应的基本流程。HTTP方法（Methods）GET：获取资源（幂等操作）POST：提交数据（非幂等）PUT：更新资源DELETE：删除资源HEAD：仅获取响应头OPTIONS：查看服务器支持的通信
前端性能优化-知识点甲亿前端性能优化
Web性能优化意义1.减少整体加载时间：减小文件体积、减少HTTP请求、使用预加载。2.使网站尽快可用：仅加载首屏内容，其他内容根据需要进行懒加载。3.平滑和交互性：使用CSS替代JS动画、减少UI重绘。4.加载表现形式：使用加载动画、进度条、骨架屏等过渡信息，让用户感觉到页面加载更快。5.性能监测：性能指标、性能测试、性能监控持续优化等Web性能指标RAIL性能模型Response(响应)：快速
Java24的新特性 hello_ejb3 redis 数据库 java
Java语言特性系列Java5的新特性Java6的新特性Java7的新特性Java8的新特性Java9的新特性Java10的新特性Java11的新特性Java12的新特性Java13的新特性Java14的新特性Java15的新特性Java16的新特性Java17的新特性Java18的新特性Java19的新特性Java20的新特性Java21的新特性Java22的新特性Java23的新特性Java2
JavaScript 性能优化实战：优化循环结构提升效率 deying0865423 javascript 开发语言
目录一、理解循环的性能损耗二、减少循环迭代次数（一）缓存数组长度（二）提前终止循环三、优化循环内部操作（一）避免在循环内执行复杂计算（二）减少DOM操作四、选择合适的循环类型（一）for循环与while循环的选择（二）for...in与for...of的使用场景在JavaScript编程中，循环结构是实现重复执行任务的基础工具。然而，不当的循环使用常常会导致性能瓶颈，特别是在处理大量数据时，循环的
【网络安全 | 漏洞挖掘】通过控制台调试实现登录秋说 web安全漏洞挖掘
未经许可，不得转载。文章目录正文在安全测试过程中，我留意到一个特殊现象：当登录出现错误时，相关请求包并不经过BurpSuite。那么此时账号密码是储存在前端的，我通过调试即可实现登录管理员账户。正文由于系统设定，输入错误的账号和密码会弹出“账号密码错误”的提示。基于此，我在代码中“账号密码错误”提示的相关位置设置了断点，截图如下：随后，我刷新浏览器页面，输入错误的账号和密码，然后点击登录按钮，操作
漫谈jvm 另一个绝影 JVM 漫谈jvm
背景介绍jvm已经是Java开发的必备技能了，jvm相当于Java的操作系统。JVM,javavirtualmachine,即Java虚拟机，是运行javaclass文件的程序。Java代码经过Java编译器编译，会编译成class文件，一种平台无关的代码格式，class文件按照jvm规范，包括了java代码运行的数据和代码等内容。jvm加载class文件后，就可以执行java代码了。JVM有不同
漫谈JVM weixin_34111790 运维 java python
2019独角兽企业重金招聘Python工程师标准>>>背景介绍创建了一个技术类公众号:一起源码分析，里面会分享最新的开源代码、源码解读、开发技巧等，欢迎大家关注。JVM已经是Java开发的必备技能了，JVM相当于Java的操作系统。JVM,javavirtualmachine,即Java虚拟机，是运行javaclass文件的程序。Java代码经过Java编译器编译，会编译成class文件，一种平台
开发语言漫谈-脚本语言大道不孤,众行致远技术杂谈开发语言
前面讲的都称之为编程语言，就是做系统用的。还有一大类称之为脚本语言的语言，这类语言数量极多，大部分程序员用不上，也不关心，这是系统维护人员专用的邻域。这个定义其实也很不准确，不必较真。更准确的来讲，能直接运行的文本都可以称之为脚本语言，按这个标准，python也是。但是python同样用于做系统。我们今天讲的脚本语言纯粹用于系统维护邻域。我们重点将编程语言，对这些脚本语言就打包一起介绍了bash：
vant官网-vant ui 首页-移动端Vue组件库 embelfe_segge 面试学习路线阿里巴巴 android 前端后端
Vant是有赞前端团队开源的移动端vue组件库，适用于手机端h5页面。鉴于百度搜索不到vant官方网址，分享一下vant组件库官网地址，方便新手使用vant官网地址https://vant-contrib.gitee.io/vant/#/zh-CN/通过npm安装在现有项目中使用Vant时，可以通过npm或yarn进行安装：#Vue2项目，安装Vant2：npmivant-S#Vue3项目，安装V
可视化埋点在React Native中的实践 Shopee技术团队前端 react native 前端 react.js
本文首发于微信公众号“Shopee技术团队”。1.背景笔者所在团队为Shopee的本地生活前端团队，用户可以在我们的平台购买优惠券，然后去线下门店使用。随着用户规模不断增加，研究用户行为数据可以更好地指导产品功能设计，提供更加优秀的用户体验。用户行为数据的研究首先涉及到如何采集，即我们常说的“埋点”。一直以来，我们项目中的埋点都采用代码埋点，每次新增埋点往往是一些重复性的工作，且需要重新发布代码才
去哪儿网 ReactNative 跨小程序多端方案介绍去哪儿网技术沙龙大前端前端 react native 小程序
1前言qrn-remax-unir是由去哪儿网前端技术团队实现的一套将RN适配到小程序端的跨端组件，通过该组件库可快速方便的将RN源代码直接运行到小程序端。方案参考了react-native-web的适配方案，使用remax框架来实现适配组件库并达到适配多小程序的目的。和react-native-web一样，它对RN源代码侵入度低，并且调试和替换组件相当方便。方案来自于社区，我们只是合理的应用用来
流浪地球 - 华为OD机试真题(E卷、Java) 什码情况华为od java 数据结构算法面试机试
针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。有兴趣的同学可以扫码添加我们的微信（code5bug）了解，免费试课一下。题目描述流浪地球计划在赤道上均匀部署了N个转向发动机，按位置顺序编号为0~N。1).初始状态下所有的发动机都是未启动状态;2).发动机启动的方式分为”手动启动”和”关联启动”两种方式;3).如果在时刻1一个发动机被启动，下一个时刻
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默