字节跳动技术团队

字节跳动在 RocksDB 存储引擎上的改进实践

本文选自“字节跳动基础架构实践”系列文章。

“字节跳动基础架构实践”系列文章是由字节跳动基础架构部门各技术团队及专家倾力打造的技术干货内容，和大家分享团队在基础架构发展和演进过程中的实践经验与教训，与各位技术同学一起交流成长。

RocksDB 是世界上最被广泛使用的存储引擎之一，字节跳动内部大量的数据库产品（如图数据库、NewSQL 等）都构建在 RocksDB 之上，对存储引擎的研发投入将会持续加大，为更多业务赋能。

本文将介绍字节跳动对 RocksDB 存储引擎的几方面改进，其中参考了大量社区贡献的经验，也有部分独创的技术，希望能为大家带来更多的优化思路。

1. 背景

RocksDB 作为最著名的 LSM 类存储引擎之一，在字节跳动内部占据非常重要的位置，大量的数据库、存储系统都在基于 RocksDB 进行构建或改进，但 LSM 系列众所周知的一些问题同样困扰着字节跳动的业务，包括性能问题、成本问题、功能问题等等。

本文首先尝试梳理和介绍我们对 RocksDB 在五个方面的改进（在内部存储引擎 TerarkDB 的基础上开发），希望能给社区带来一些参考价值，也欢迎对存储引擎感兴趣的技术专家加入我们一起为字节跳动构建更强大的底层支撑。

2. RocksDB 的不足

读写放大严重
应对突发流量的时候削峰能力不足
压缩率有限
索引效率较低
等等

3. 我们的改进

3.1 LazyBuffer

RocksDB 之前的某个版本引入了 PinnableSlice 作为数据在引擎内的传输载体，它的主要作用是可以减少数据复制，即当用户所要查找的数据在 BlockCache 中的时候，只返回其引用。

但是 PinnableSlice 在一些场景下无法发挥价值，比如用户的某个操作需要触碰 大量不需要的 Value 时（如 Value 有很多版本或者有大量的 tombstone），PinnableSlice 依然会对这些无用的 Value 产生 I/O 操作，这部分开销是完全可以避免的。

我们为此构建了 LazyBuffer 替换 PinnableSlice，当用户获得 Value 的时候，并不真正进行磁盘 I/O，只有用户真正需要取值的时候才进行真正的 fetch 操作进行 I/O。

Lazy Buffer 是对 PinnableSlice 的增强，从减少数据复制更进一步减少不必要的 IO，对于大量的扫描、SeekRandom 等场景有很大好处。

3.2 Lazy Compaction

自从 LSM 推广开来，针对 LSM Compaction 的各种策略优化层出不穷，其中主流的 Compaction 策略有以下几种：

Leveled Compaction

全部层级都按照标准的从上到下进行层级合并
读写放大都比较严重，但是空间放大较低
在这篇论文（Towards Accurate and Fast Evaluation of Multi-Stage Log-Structured Designs）中有详细的阐述

Tiered Compaction

即 RocksDB 中的 Universal Compaction
空间放大和读放大严重，但是写放大最小
在这篇论文（Dostoevsky: Better Space-Time Trade-Offs for LSM-Tree Based Key-Value Stores via Adaptive Removal of Superfluous Merging）有详细的阐述

Tiered+Leveled Compaction

即 RocksDB 中的 Level Compaction
是一个混合的 Compaction 策略，空间放大比 Tiered Compaction 更低，写放大也比 Leveled 低

Leveled-N Compaction

比 Leveled Compaction 写放大更低，读放大更高
一次合并 N - 1 层到第 N 层

从上面的分类我们可以看到，主流的 Compaction 策略主要 在不同的合并时机之间进行权衡和选择，字节跳动在这里使用了稍微改进一点的方式。

首先，我们要理解如果能够允许 SST 可以不必保持强有序，那么就可以让我们收集到更多的统计信息后再真正执行外排序（Compaction），但缺点是会增加一定程度的读放大，对读延迟会有影响，那么有没有办法让增加的读放大可控，甚至几乎不增加读放大呢？

我们尝试构建了一种新的 SST 数据结构（Adaptive Map，简称 aMap），区别于 RocksDB 默认的结构，aMap 是一个逻辑上的虚拟 SST，如下图所示：

图：aMap 结构示意图

图中 SST 1、SST 2、SST 3 是三个物理上的 SST 文件，当需要对他们进行合并的时候，我们先构建虚拟遮罩，对上层暴露逻辑上的合并好的 SST（逻辑上是一个大 SST），同时记录和标记其中的覆盖度、Key Space 等统计信息。

它的主要功能有：

大的 Compaction 策略上，继承了 RocksDB 的 Level Compaction（Universal Compaction 也可以支持，看场景需要，默认是 Level Compaction）
当需要进行 Compaction 的时候，会首选构建 Adaptive Map，将候选的几个 SST 构成一个逻辑上的新 SST（如上图所示）
Adaptive Map 中会切分出多个不同的重叠段，R1、R2、R3、R4、R5，这些重叠段的重叠度会被追踪记录
后台的 GC 线程会优先选择那些重叠度更好的层进行 GC，通过这种手段，我们可以让 GC 更有效率，即写放大远低于默认的情况

读写放大和原版 RocksDB 对比，理论分析上是有优势的：

表：复杂度分析对比（读放大和写放大）

3.3 KV 分离

在论文 *WiscKey: Separating Keys from Values in SSD-conscious Storage* 介绍了一种 KV 分离的 SST 设计，它的主要方式是构建一个 Value Log 文件不断的在上面追加 Value 数据，同时原始的 SST 中 Value 只记录数据真实存在的位置即可。

图：KV 分离的基本原理

其实 KV 分离的思路比较直接和简单，把符合阈值的 value 从直接存储在 SST 中，改为存储文件指针，降低 Compaction、Seek 等操作的开销。

RocksDB 社区有一个 KV 分离的 BlobDB 功能，但是目前功能还不完善，还有大量的工作需要继续做，这里就暂不做对比。另一个 TitanDB 是一个实现上相对完整的 KV 分离存储引擎（以 RocksDB 插件的形式构建），我们在这里对他们进行一个简单的对比：

综合来看，在和社区的对比中，我们实现 KV 分离的大体思路是类似的，但由于我们有 Adaptive Map 的存在，可以对真正的 GC 操作进行延迟到负载较低的时候进行，对于应对突发流量尖峰会有相当不错的效果。

但 KV 分离也带来了一些损失，最重要的就是对于范围查询造成了损害，后续可以通过逻辑层进行 Prefetch 来降低这部分的损耗。

3.4 多种索引支持

对于原生的 RocksDB，其 SST 格式大致如下图所示：

[data block 1]
[data block 2]
...
[data block N]
[meta block 1: filter block]          (see p: "filter" Meta Block)
[meta block 2: index block]
[meta block 3: compression dictionary block]  (see p: "compression dictionary" Meta Block)
[meta block 4: range deletion block]      (see p: "range deletion" Meta Block)
[meta block 5: stats block]          (see p: "properties" Meta Block)
...
[meta block K: future extended block]  (we may add more meta blocks in the future)
[metaindex block]
[Footer]                (fixed size; starts at file_size - sizeof(Footer))

其中，index block 和 filter block 帮助用户快速定位目标 key 所在的 block。RocksDB 默认的 index 并没有考虑不同数据类型之间的差异，无法根据不同数据类型选择压缩效率和查询效率最高的索引结构，针对这个问题，我们构建了一种自适应的索引选择和构建机制。

对于输入的数据，我们会对其进行分段式探测，确定最高效的索引算法
对于这批数据进行单独索引并把索引放在 index block 中的

目前已经支持的额外索引算法有：

压缩 Trie 索引，针对字符串类型进行通用压缩
非降序整数索引，通过 bitmap 构建高度压缩的索引
......

通过多种索引结构的支持，为以后的长期优化提供了更多可能，甚至在 SST 中内嵌 B+ 树索引 data block 等等，更加灵活、模块化的结构让引擎的适应能力更强，面对不同的存储介质、访问模式可以有更佳的综合表现。

3.5 极致压缩

对于数据库应用来说，除了追求高性能外，成本控制也是一个很重要的话题，其中成本控制的重要一环就是数据压缩，对于 LSM 结构来说，默认是通过 block 进行压缩的，压缩率和块的尺寸强相关。

在这里为了解决块尺寸和压缩率的 tradeoff 问题，我们构建了一系列的压缩算法，其中最常用的是可以按记录抽取数据的全局压缩，其基本思路其实并不复杂，通过对 LZ 系列的改进，使用高效的手段保留每一个 Record 的 Offset 即可，而 Offset 表有很多种方法进行压缩存储（显然它是递增的非连续整数序列），利用 pfordelta 等方法进行优化变通存储不难办到。

图：全局压缩算法的概要流程

其大致流程是：

先对数据进行扫描采样构建数据字典

所以默认情况下需要对 Compaction SST 进行改造以提供两遍扫描的能力

根据数据字典，对原数据进行滑动窗口压缩
最后再进行一轮可选的熵压缩（Entropy Compression）

熵压缩业内主流的包括 ANS 和高阶 Huffman 等等，可以根据实际数据分布探测选择

在压缩过程中，将会保存每条原始数据的 offset 信息构成偏移表

图：偏移表的构建和保存

偏移表采用常见的类 pfordelta 算法压缩保存即可，需要注意的是因为偏移表会被频繁访问，这里的适宜有一阶差分表和二阶差分表，根据实际情况选择即可。

索引后续可以直接映射到这里具体的 record offset 中来，方便后续的直接按记录寻址。

3.6 新硬件支持

对目前流行的新硬件（如持久化内存、FPGA、QAT 等），我们同样进行了适配和优化，比如在在设备有 QAT 硬件的时候，我们在主机 CPU 负载较高时，选择放弃一部分 CPU 压缩 offload 到 QAT 中进行压缩，再比如我们将一部分数据放在持久化内存上实现真正的 Record 级别数据访问（我们采用的并非常见的块级别的索引结构，而是直接按记录索引）等等。

这里我们以 QAT 压缩为例来说明：

我们知道随着 PCIe NVMe SSD 的大范围普及，磁盘的带宽和 IOPS 大幅度提升
磁盘带宽的提升进而将系统瓶颈转移到了 CPU

CPU 要做的工作包括数据排序（SST 需要维护有序性）、CRC 校验、数据压缩、查询比对等等

我们初步目前的计划是把数据压缩和 CRC 校验卸载到专门的 QAT 硬件中进行加速

目前 QAT 硬件的性价比较高，甚至部分主板还自带

QAT 本身能支持的压缩算法有限，主要以 zlib 的 deflate 为主
当我们卸载了数据压缩和 CRC 校验后，就可以分配更多的 CPU 进行 SST 的 GC 和 Compaction，尽快将 SST 形态调整到最佳

目前 QAT 的使用还在测试阶段，还没有正式上线，下一步计划对 FPGA 的应用进行深度的调研。

4. 对比测试

我们使用 RocksDB 的 bench 工具进行了一些简单的测试，对比了 RocksDB、TitanDB 和 TerarkDB 的区别和差异，需要注意是，该工具使用的是随机生成的数据，对于 TerarkDB 的压缩算法不是很友好，所以压缩率差距并不大。

这次改进，我们重点关注的是 KV 分离的表现，所以只对比较大的 Value 进行 benchmark 确认其改进效果：

测试环境：

原始测试数据集大小为 256 GB，内存 128 GB
CPU : 48 Core
RAM : 128 GB
Disk : Intel NVMe 3.4T
测试程序为 db_bench
Linux version 4.14
GCC Version 6.3.0

测试内容：

fillrandom：多线程随机写入, 存在重复 key
readseq：多线程顺序 Scan
readrandom：多线程随机 Get
seekrandom：多线程随机 Seek

Value size = 4KB

Value size = 32KB

5. 后续

字节跳动在单机引擎上的投入会持续加大，同时也会考虑为各类特定业务构建针对性的专用引擎，其目标是在单机内为上层业务提供更强大的性能，更灵活的功能和更可靠的服务。

为了实现这些目标，后续我们还需要做的有很多，包括卸载单机引擎的 CPU 到集群上进行分布式 Compaction、引入 SPDK 相关的技术提升 IO 效率、引入 AI Tuning 针对不同负载做更灵活的 I/O 策略、引入新硬件（如持久化内存和 FPGA）等等。

为了实现字节跳动存储引擎的多样性和走向业界前沿，我们迫切的希望有志者能够加入我们一起做新的探索，我们也希望未来在主流的期刊上、开源社区中能够看到字节跳动的活跃身影，为技术社区贡献自己的力量。

6. 参考文献

WiscKey: Separating Keys from Values in SSD-conscious Storage
Bitcask A Log-Structured Hash Table for Fast Key/Value Data
LSM-trie: An LSM-tree-based Ultra-Large Key-Value Store for Small Data
Towards Accurate and Fast Evaluation of Multi-Stage Log-Structured Designs

字节跳动基础架构团队

字节跳动基础架构团队是支撑字节跳动旗下包括抖音、今日头条、西瓜视频、火山小视频在内的多款亿级规模用户产品平稳运行的重要团队，为字节跳动及旗下业务的快速稳定发展提供了保证和推动力。

公司内，基础架构团队主要负责字节跳动私有云建设，管理数以万计服务器规模的集群，负责数万台计算/存储混合部署和在线/离线混合部署，支持若干 EB 海量数据的稳定存储。

文化上，团队积极拥抱开源和创新的软硬件架构。我们长期招聘基础架构方向的同学，具体可参见 job.bytedance.com （点击左下角“阅读原文”直达官网），感兴趣可以联系邮箱 guoxinyu.0372@bytedance.com 。

欢迎关注「字节跳动技术团队」

点击阅读原文，快来加入我们吧！

羧基/氨基化sio2荧光微球：是一种表面修饰有羧基或氨基的荧光二氧化硅微球星贝爱科生物-xb 氨基化sio2荧光微球羧基化sio2荧光微球
羧基/氨基化SiO₂荧光微球是一种表面修饰有羧基或氨基的荧光二氧化硅微球，具有特别的物理化学性质和广泛的应用前景，以下为你详细介绍：基本信息外观：通常为白色粉末或胶体溶液，在特定波长的激发光下可发出荧光。粒径：粒径可在纳米到微米级别进行调控，常见的粒径范围包括20nm-200μm等。表面性质：表面修饰的羧基或氨基赋予微球良好的生物相容性和化学反应活性，使其能够与生物分子或其他材料进行特异性结合。制
Python数据可视化——Seaborn的基本用法（2）大数据张老师 tensorflow 人工智能 python
Seaborn库的安装与导入Seaborn是基于Matplotlib的高级数据可视化库，在使用前需要确保正确安装。通过以下命令可以安装最新版本的Seaborn：#使用pip包管理工具进行安装pipinstallseaborn安装完成后，在Python脚本中需要先导入相关库。建议同时导入Matplotlib以配合可视化输出：importseabornassns#导入Seaborn库并简写为snsim
Python常见的第三方库：requests、numpy、pandas 大数据张老师 python numpy pandas
常见的第三方库：requests、numpy、pandasPython拥有丰富的第三方库，涵盖了数据分析、网络爬取、人工智能、科学计算等多个领域。其中，requests、numpy和pandas是最常用的三个库，分别用于网络请求、数值计算和数据处理。本节将详细介绍它们的基本功能，并通过示例代码帮助理解它们的使用方法。requests：处理网络请求的库requests是Python中用于处理HTTP
Python数据可视化利器——Matplotlib绘图详解编码实践 python matplotlib 信息可视化
Python数据可视化利器——Matplotlib绘图详解Matplotlib是Python中最常用的数据可视化库之一，它提供了丰富的绘图函数和高度可定制的图形展示方式。本文将详细介绍Matplotlib的基础知识、常用的绘图函数、样式美化、子图绘制等内容，帮助读者快速掌握Matplotlib的使用技巧，轻松实现高质量的数据可视化。Matplotlib基础知识Matplotlib的基础是Figur
Spring Boot 基础日志打印（Logback 在 application.yaml 文件中的配置）我命由我12345 Java -简化库与框架编程 spring boot logback java-ee java intellij-idea 后端 spring
一、Logback在SpringBoot中，日志框架默认使用的是Logback，SpringBoot提供了对日志配置的简化SpringBoot默认会将日志输出到控制台，并且日志级别为INFO可以在application.yaml或application.properties文件中进行日志配置如果需要自定义日志配置，可以使用logback-spring.xml文件，SpringBoot会自动加载该文
antv/x6 实现框组功能 bigHead- antv/x6 javascript antv X6 vue3
前言：今天看到有小伙伴看到antv/x6多层嵌套下自动拓展父节点这篇文章后在底下留言怎么实现框组的功能，现在就单一摘出来讲解一下。首先要先注册组合节点exportclassNodeGroupextendsNode{privatecollapsed:boolean=true;protectedpostprocess(){this.toggleCollapse(true);}isCollapsed()
npm i 发生npm ERR! code 128 npm ERR An unknown git error occurred npm ERR! command g的错误（已解决）边关月＿合墨数据 npm git node.js
1.根据下图的提示先删除这样没用的文件和代码（有的没有就算了）2.然后继续npmi一次如果此时又发生报错：3.然后执行npmi--legacy-peer-deps亲测有效
80| Python可视化篇 —— Matplotlib数据可视化小刘要努力。 Python教程系列专栏可视化数据分析 python
文章目录Matplotlib和数据可视化安装matplotlib绘制折线图绘制散点图绘制正弦曲线绘制直方图使用Pygal绘制矢量图3D图Matplotlib和数据可视化数据的处理、分析和可视化已经成为Python近年来最为重要的应用领域之一，其中数据的可视化指的是将数据呈现为漂亮的统计图表，然后进一步发现数据中包含的规律以及隐藏的信息。数据可视化又跟数据挖掘和大数据分析紧密相关，而这些领域以及当下
新型模型架构（参数化状态空间模型、状态空间模型变种）三月七꧁ ꧂ LLM 语言模型 gpt 文心一言 prompt embedding AIGC agi
文章目录参数化状态空间模型状态空间模型变种 Transformer模型自问世以来，在自然语言处理、计算机视觉等多个领域得到了广泛应用，并展现出卓越的数据表示与建模能力。然而，Transformer的自注意力机制在计算每个词元时都需要利用到序列中所有词元的信息，这导致计算和存储复杂度随输入序列长度的平方级别增长。在处理长序列时，这种复杂性会消耗大量的计算资源与存储空间。为了解决这个问题，研究人
【GMT-学习4】比例尺背景透明度设置科熊小猪 GMT 学习
比例尺背景透明度设置通过修改-F+gwhite参数为-F+gwhite@50，可以将地图的白色填充设置为50%的透明度。可以根据需要调整透明度值（例如@30表示30%透明度，@80表示80%透明度）。
npm 常用指令指南风干牛肉巴旦木 npm
以下是一些常用的NPM（NodePackageManager）指令，它们在前端开发中非常实用：#NPM常用指令大全##包管理###安装依赖```bashnpminstall安装package.json中列出的所有依赖。安装开发依赖npminstall--save-dev安装并添加到devDependencies。安装特定版本的包npminstall@安装指定版本的包。全局安装包npminstal
极智芯 | 解读国产AI算力算能产品矩阵极智视界极智芯 AI芯片算力国产化算能算力人工智能 GPU TPU
欢迎关注我的公众号[极智视界]，获取我的更多经验分享大家好，我是极智视界，本文分享一下解读国产AI算力华为昇腾产品矩阵。邀您加入我的知识星球「极智视界」，星球内有超多好玩的项目实战源码和资源下载，链接：https://t.zsxq.com/0aiNxERDq算能属于自研TPU阵营，算能，有时候又叫比特大陆，有时候又叫算丰，我没有研究过他们公司的具体发展情况，所以关于称呼就不展开来。对于算能，我使用
【华为OD机试真题29.9¥】(E卷,100分) - IPv4地址转换成整数（Java & Python& JS & C++ & C ）小妖666 华为OD 华为od c++c语言
题目描述存在一种虚拟IPv4地址，由4小节组成，每节的范围为0~255，以#号间隔，虚拟IPv4地址可以转换为一个32位的整数，例如：128#0#255#255，转换为32位整数的结果为2147549183（0x8000FFFF）1#0#0#0，转换为32位整数的结果为16777216（0x01000000）现以字符串形式给出一个虚拟IPv4地址，限制第1小节的范围为1128，即每一节范围分别为(
awesome python 中文版相见恨晚！(pythonNB的第三方资源库) weixin_30788731
AwesomePython中文版来啦！原文链接：Python资源大全内容包括：Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等。GitHub-jobbole/awesome-python-cn:Python资源大全中文版环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单
ArcGIS 帮助 10.1 标识未知坐标系 weixin_30883777
标识未知坐标系指南坐标系信息通常从数据源获取，但并非总是如此，如历史遗留数据。下面介绍的方法有助于标识正确的坐标系。如果坐标系未知，当尝试向ArcMap添加图层时将收到此警告消息：以下添加的数据源缺少空间参考信息。虽然可以在ArcMap中绘制这些数据，但不能投影。术语“坐标系”可以指以十进制度数表示的数据，也可以指以米或英尺表示的投影坐标系。术语“投影”或PRJ是仍在使用的较旧术语，但它不精确。如
【机器学习】决策树 ( Decision Tree ) AI天才研究院 ChatGPT DeepSeek R1 &大数据AI人工智能大模型深度学习实战机器学习决策树算法支持向量机人工智能
【机器学习】决策树(DecisionTree)文章目录【机器学习】决策树(DecisionTree)1.ID3(1)信息增益(2)ID3的算法流程(3)实现ID32.C4.53.CART(1)决策桩DecisionStump(2)回归CART：最小二乘回归树leastsquaresregressiontree⚪回归CART的例子(3)分类CART(4)处理缺失值Handlemissingfeatu
python实用库依山临水 Python笔记
转自：https://github.com/jobbole/awesome-python-cn环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单的Python版本管理工具。Vex–可以在虚拟环境中执行命令。virtualenv–创建独立Python环境的工具。virtualenvwrapper-virtualenv的一组扩展。包管理管理包和依赖的
css表格宽度设置无效思想永无止境 Web前端 css html table
table-layout:fixedtable-layout:fixed，table和td设置宽度有效，但在第一行有合并列的情况时，列宽会被均分，从而导致td设置宽度无效（table宽度仍然有效）。table-layout:fixed的表格，各列宽度由第一行决定，后面指定的宽度会被忽略，当第一行合并后，所有列宽度会被均分。解决方法：在之后添加代码或者table-layout:autotable-l
【AI】YOLOv7部署在NVIDIA Jetson Nano上郭老二 AI 人工智能 YOLO
1、环境搭建参考博客：【AI】JetsonNano烧写SD卡镜像【AI】YOLOv7部署在NVIDIAJetsonTX2上2、下载编译2.1源码下载https://github.com/AlexeyAB/darknet2.2编译1）修改MakefileGPU=1CUDNN=1CUDNN_HALF=0
超实用计算机网络面试题，快来学习一下优人ovo 计算机网络学习
引言计算机网络作为程序员的内功，不仅要做到深入理解，面试题也要详细掌握，跟着作者的节奏好好复盘一下吧1.OSI模型和TCP/IP模型的区别是什么？各层的主要功能是什么？考察点：网络分层架构、协议栈理解答案方向：OSI分为7层（物理层→数据链路层→网络层→传输层→会话层→表示层→应用层），TCP/IP简化为4层（网络接口层→网络层→传输层→应用层）。关键区别：OSI是理论模型，TCP/IP是实际工业
华为OD机试-亲子游戏（Java/Python/C++）华为OD机试华为od 游戏 java python c++华为亲子游戏
一、题目描述题目描述：宝宝和妈妈参加亲子游戏，在一个二维矩阵（N*N）的格子地图上，宝宝和妈妈抽签决定各自的位置，地图上每个格子有不同的糖果数量，部分格子有障碍物。游戏规则是妈妈必须在最短的时间（每个单位时间只能走一步）到达宝宝的位置，路上的所有糖果都可以拿走，不能走障碍物的格子，只能上下左右走。请问妈妈在最短到达宝宝位置的时间内最多拿到多少糖果（优先考虑最短时间到达的情况下尽可能多拿糖果）。二、
OpenFlow 流表项漫谈网络网络技术进阶通途 openflow sdn 网络
OpenFlow的流表项（FlowEntry）是交换机数据转发的核心规则，定义了如何匹配和处理数据包。以下是流表项的详细组成、工作机制及其在不同OpenFlow版本中的演进：一、流表项的核心组成每个流表项由以下关键字段构成（以OpenFlow1.3为主）：字段说明MatchFields匹配数据包头部的条件（如MAC/IP地址、端口、协议类型等）。Priority优先级值，决定流表项的匹配顺序（值越
领域驱动设计中的核心概念能源革命技术技术 DDD 领域驱动
领域驱动设计（DDD）的核心概念是理解和构建复杂系统的基础。1.领域（Domain）定义：领域是软件所解决的业务问题所在的范围，是业务逻辑和规则的集合。理解：领域是DDD的出发点，它定义了软件需要解决的问题空间。例如，在一个电商系统中，领域可能包括订单管理、用户管理、支付处理、库存管理等。重要性：明确领域可以帮助开发团队聚焦于业务的核心问题，避免被技术细节分散注意力。2.领域模型（DomainMo
Vue入门常见指令星星不打輰前端 vue.js javascript 前端
Vue(视图信息与脚本数据双向绑定）Vue的基础入门Vue的实现流程：1、在HTML的body标签中引入需要通过Vue进行数据绑定的标签2、在HTML中的相关的视图标签中设置标签元素的id（）3、通过外链的形式将Vue的核心库进行导入：4、在另外一个script中书写对应的Vue–JS脚本--（1：创建对应的Vue对象，并且进行实例化）--（2：指定Vue对象绑定的标签元素–》el："#app"-
npm ERR! code 128 npm ERR! An unknown git error occurre如何解决 qq_57907803 git npm 前端
在git上下载下来的vue-element-admin安装依赖的时候报错。在网上查找到的资料说是node-sass下载失败，然后我们只需要在根目录下添加一个.npmrc文件，并在文件里面输入sass_binary_site=https://npm.taobao.org/mirrors/node-sass/registry=https://registry.npm.taobao.org然后再将nod
Java基础——泛型基础介绍新停浊酒杯 java 开发语言
在Java中，泛型是十分强大的功能，它允许我们在类、方法和接口中使用类型参数，提供安全且灵活的代码。反省通过让你指定通用类型参数来实现“类型独立性”，避免显式的类型转换（数据类型的强转肯定都用过），同时提高了代码的可读性和可维护性。1.在类上的应用泛型类指的是在类定义时使用类型参数（比如,,等）。这种类能够处理多种类型，而不必为每种类型编写多个相似的类。：泛型类型参数，表示任意类型。通常用于类、方
npm install的执行原理温暖前端 npm 前端 node.js
1.npminstall概述npminstall是Node.js的包管理工具npm提供的一个命令，主要用于安装package.json文件中列出的依赖包。npminstall可以用于安装单个包、多个包，或者是根据项目中的package.json自动安装所有依赖。通过npminstall，开发者可以下载并安装项目所依赖的各种库和工具，构建出一个完整的开发环境。在执行npminstall时，npm会从
如何在本地部署开源通用智能体OpenManus？技术方案全解析猫头虎猫头虎 AI 探索之路人工智能 AIGC AI-native gpt prompt agi agent
背景近期，中国团队推出的通用型AIAgent产品Manus因在GAIA基准测试中刷新性能记录引发行业关注，其"手脑协同"能力可完成简历筛选、旅行规划等复杂任务，内测邀请码一度被炒至数万元。但对于开发者而言，依赖商业产品存在技术黑箱与成本限制。值得庆幸的是，MetaGPT团队与Camel团队已分别开源了OpenManus和OpenManus-OWL，为开发者提供了自主部署的解决方案。本文将深入解析本
【有啥问啥】深入浅出：大模型应用工具 Ollama 技术详解有啥问啥大模型科普人工智能深度学习
深入浅出：大模型应用工具Ollama技术详解引言近年来，大型模型（LargeModels，LLMs）技术突飞猛进，在自然语言处理、计算机视觉、语音识别等领域展现出强大的能力。然而，部署和运行这些庞大的模型往往面临着环境配置复杂、资源需求高昂等挑战。为了解决这些痛点，Ollama应运而生。本文将深入探讨Ollama，一个旨在简化大模型本地运行和管理的开源工具，帮助读者理解其核心概念、优势以及应用场景
机器学习-随机森林解析 Mr终游机器学习机器学习随机森林人工智能
目录一、.随机森林的思想二、随机森林构建步骤1.自助采样2.特征随机选择3构建决策树4.集成预测三.随机森林的关键优势**(1)减少过拟合****(2)高效并行化****(3)特征重要性评估****(4)耐抗噪声**四.随机森林的优缺点优点缺点五.参数调优（以scikit-learn为例）波士顿房价预测一、.随机森林的思想1.通过组成多个弱学习器（决策树）形成一个学习器2.多样性增强：每颗决策树通
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那