SrcMiLe

LSM-Tree(一)：初识

写在前面：本篇博客为综述《LSM-based Storage Techniques: A Survey》的学习笔记（一），该综述介绍了 LSM-Tree 的前世今生、思想本质、性能权衡、面临问题、优化方案等等，也是我正式接触 LSTM-Tree 的入门导师。综述对 leveling、tiering、partition 等核心观念进行了较为详细的介绍，对 LSM-Tree 的本质理解还是很有帮助的。不过，毕竟只是一篇综述，想要看清 LSM-Tree 光靠这一篇肯定是不够的，所以还参考了其他的博客。

好了，我们开始。

文章目录

- LSM-Tree 诞生之前
- 早期 LSM-Tree
- LSM-Tree 基本结构
- - leveling & tiering
  - partition
  - - partitioned leveling
    - partitioned tiering
    - - vertical grouping
      - horizontal grouping
    - 为什么要分区
- 优化问题

都知道，现在的存储体系大多分为 SQL 和 NoSQL，后者即 K-V 存储，LSM-Tree 就是为它服务的一种底层数据结构。现行的大部分 K-V 存储，比如 Rocksdb、Badger 等底层用的都是 LSM-Tree，虽然进行了一定的优化与变式，但本质还是 LSM。所以，LSM-Tree 是什么？为什么要用到 LSM-Tree，要搞清楚这个问题，就需要先明白在 LSM-Tree 出现之前，K-V 存储是什么样的。

LSM-Tree 诞生之前

一般来讲，K-V 存储在更新时有两种方案供选择，一种叫就地更新（in-place），一种叫地外更新（out-of-place）。所谓就地更新，就是直接将原来的记录改了，换成新的记录，比如把改成，这样一来就没有这个记录了，查询 k1 的值会直接返回 v1，具有很高的读效率。同时，由于更新直接利用原来的空间，不会开辟新的空间，所有具有很高的空间利用率。但是，代价就是写放大，说人话就是写变慢了。在该策略中，每一次写都会造成随机的 I/O，即要先找到那个 key，然后再做更新，就会导致写速率变慢。

于此相反，地外更新不会直接更改原来的，而是将另外存储在一个新的地方，然后打上 version 表示这个记录才是 k1 最新的值。这样一来，写 k1 时，就无需采用随机 I/O 事先找到 k1，而是直接利用顺序 I/O 将新记录附加上去就行了，相比于就地更新，这种策略具有更好的读效率。同时，由于没有覆盖旧记录，所以是利于回滚的。但代价就是，具有读放大与空间放大，这两点很显然，因为同一个 key 对应的记录更多了。

地外更新随后成为主流，它为记录的存储提供了一种新的思路：顺序日志。比如早期的 Postgres 项目，会把所有的写操作附件到一个顺序日志中去，只有当原记录过时后才由垃圾回收机制清理，而不是当场覆盖原记录。

但是很明显，如果日志的结构仅仅是顺序的，那必然不是最优的，因为记录之间潜在的联系没有被利用，大家都像栈元素一样一个一个 push 进日志，肯定是不行的。所以就引出了新的问题，如何进行合理的日志结构化？这就是 LSM 中的 LS 所指的含义，Log-Structured。

那 Merge 指什么呢？实际上，对于某一个 key，除了最新的那条记录外，其他的记录都是冗余无用的，但是仍然占用了存储空间，所以需要不定期的去进行 Merge 来清除掉冗余的记录，而这就是 LSM-Tree 的核心内容。

早期 LSM-Tree

为了解决上面说的问题，LSM-Tree 诞生。就像其名字一样，LSM-Tree 设计的初衷，就是对日志进行一定的合并（merge），来进行冗余记录的清除，并利用合适的日志结构与合并策略来提高写性能。

最开始的 LSM-Tree，由一系列的组件构成，我们把它们记作 C0、C1 … Ck。每一个组件内部都是一个 B+ 树，（当然，到后期就不是了，不过这里先不管）。C0 驻留在内存中，为传入的写操作提供服务，而其余的所有 C 均驻留在磁盘中，进行真正的数据存储。所有的组件之间都是递进的，当且仅当 Ci 存满的时候，会触发合并进程，将 Ci 中的一系列叶页面（leaf page）合并到 Ci+1 中，然后 Ci 继续等待来自 Ci-1 的合并，以此类推。这种策略叫作滚动合并。

值得注意的是，只有当所有组件之间的大小比 Ti = |Ci + 1|/|Ci| 相同时，写入性能才得到优化。我不知道为什么，在 LSM-Tree 的原始论文中有推导，不过我没看，私以为记个结论就行。这一个结论，直接影响到后续有关 LSM-Tree 的实现与优化。

LSM-Tree 基本结构

如今的 LSM-Tree 实现仍然应用地外更新来减少随机 I/O。所有写操作都附加到内存组件中。插入或更新操作只是添加一个新条目，而删除操作则添加一个反事项条目，表明某个键已被删除。当组件满时，多个组件会合并为一个新的组件，而无需修改现有组件，这是前面提到的滚动合并是不一样的。

那么磁盘组件是如何组织并且合并的呢？LSM-Tree 提供了两种合并策略：leveling 和 tiering 。这两种策略都将磁盘组件组织为逻辑级别，级别之间的关系由一个 size ratio 控制，该参数名为 T。

leveling & tiering

leveling 策略中，每一层只有一个磁盘组件，每一个 SSTable 的空间容量满足比率 T，且保持不变。当位于级别 L 的组件被填满时，它就会和位于级别 L+1 的组件合并，注意，是覆盖性合并，即直接更改原 L+1 级的组件。用图来表示，如下：

与此相反，tiering 策略中每一层都有 T 个组件，意味着每层的组件数目都相同。同时，一层中的各个组件大小相同。当级别 L 被填满时（该级别出现了 T 个组件），该层的 T 个组件会合并为一个新的组件，进入级别 L+1。这也就解释了为什么每一层都只能有 T 个组件，因为只有这样才能保证层与层之间的空间容量比为 T。该策略用图来表示，如下：

通常，leveling 策略会优化读性能，因为每一层只有一个组件，搜索的组件数就会少。而 tiering 策略的则优化写性能，因为它降低了合并频率。

下面给出两种策略的各种操作复杂度，有些项的具体推导我暂时还没懂，个人觉得综述里写的推导有点泛，某些我还没看明白。都看懂了我再回来更新。

其中，T 如上文所述，L 表示层级的数量，B 表示页面大小（一页中存有多少个条目），P 表示一个磁盘组件中有多少个页面（虽然最后的结论中没有P）。Long/Short Range Query 指范围查询的长短，由范围中的唯一键数目决定。记查询范围中唯一键的数目为 s，如果 S/B > 2L，那么就称为 Long，反之为 short。此外，在单点查询中为什么 Zero-Result 和 Non-Zero-Result 差别会这么大，这是应为运用了布隆过滤器，这是用来快速判断某个 key 是否存在的工具，但是具有假阳性的概率。在另一篇博客中我会介绍它：布隆过滤器。

定性总结一下：

leveling：读优化、空间优化、写放大；
tiering：写优化、读放大、空间放大；

但实际上，我们现在用的并不是这两种策略，而是采用了分区（partition）的优化。

partition

在阐述 LSM-Tree 的分区策略之前，现简要提一嘴现在各个组件的常用数据结构，直接以 Rocksdb 为例。LSM-Tree有三个重要组成部分：MemTable、Immutable MemTable、SSTable。

MemTable：

MemTable 是在内存中的数据结构，直接服务传入的写操作，并暂存最近更新的数据，即上述提及的组件C0。它会按照 key 有序地组织这些数据，但具体如何组织，不同的存储引擎用的方式不一样。在 Rocksdb 中，采用 跳表（skip-list） 来保证内存中的 key 有序。

因为数据暂存在内存中，没有持久化，因此通常使用 WAL(Write-ahead logging) 的方式来保证数据的可靠性。

ps.）跳表，是个超级牛逼的查找数据结构，可以理解为一个能够实现二分查找的链表。我本来打算写一篇博客记录的，但搜到了一篇非常详细的跳表解析博客，增删查都写的很清晰，尤其是增加操作中的随机索引建立过程，写的很明白，所以这里就直接引用了：skip-list 详细分析
Immutable MemTable：

当 MemTable 达到一定大小后，会转变成 Immutable MemTable。这个东西是将 MemTable 转变为 SSTable 的一种中间状态。在转存过程中，新来的写操作由新的 MemTable 处理，并不会阻塞数据更新。
SSTable：

在 Rocksdb 中，每一个磁盘组件被分为若干个 SSTable。简要说一下，SSTable 包含数据块列表和索引块，数据块存储按 key 排序的键值对，索引块存储所有数据块的 key 范围。对 SSTable 的学习与分析，我也写在了另一篇博客中：SSTable 数据结构分析。

再来看一下，LSM-Tree 的基本结构如下图所示：

注意到，在红框中，已经不是磁盘组件了，而是被分为了多个 SSTable。分区也分为两种，分别针对 leveling 与 tiering，但是在开始介绍两种分区策略之前，请先记住分区的核心思想：

只合并带有重叠键的 SSTable

partitioned leveling

在 partitioned leveling 策略中，每一层依然只有一个磁盘组件，层与层之间的大小比率依然是 T，但是每个磁盘组件都被分为若干个互不重叠且大小相近的 SSTable，这就意味着每个 key 在一层中只会出现一次，不存在冗余。该策略的合并步骤为：

L1 的总大小超过自身空间限制。
从 L1 中至少选择一个 SSTable，然后把它跟 L2 中有重叠的部分进行合并。
合并后生成的新 SSTable 先不着急直接至于 L2 中。因为要保证每一个 SSTable 的大小相近，所以合并后需要先分化成多个小点的 SSTable，然后再置于 L2 中。
如果 L2 合并后的大小超过了自身限制，那么重复上述过程，向 L3 合并。

用一张图来表示，如下：

需要注意的是，L0 的磁盘组件没有分区，因为它们是直接从内存中刷新的。这种设计还可以帮助系统吸收写突发，因为它可以容忍 L0 上的多个未分区组件。

partitioned tiering

不同于 p-leveling，p-tiering 策略允许层级中包含多个键范围重叠的 SSTable，但是这些 SSTable 必须要通过一定的方式组织起来。在该策略中，有两种组织方式可供选择，分别为垂直分组（vertical grouping）与水平分组（horizontal grouping）。

vertical grouping

在垂直分组中，每一层级中具有重叠范围的 SSTable 会被分为一组，使得组与组之间不会产生重叠，这样看来，垂直分组像是 p-leveling 的一种变式。其合并流程为：

L1 的总大小超过自身空间限制。
从 L1 中至少选择一组，然后将该组内的所有 SSTable 合并。
合并后，根据 L2 的分组情况，将合并后的内容分为了多个不重叠的 SSTable。
每一个 SSTable 分别插入 L2 中对应范围的组。
如果 L2 合并后的大小超过了自身限制，那么重复上述过程，向 L3 合并。

用一张图来表示，如下：

horizontal grouping

在水平分组中，每一个磁盘组件都自成一组，组与组之间允许有重叠，但是组内的 SSTable 不会有重叠。其合并流程为：

L1 的总大小超过自身空间限制。
在 L1 的所有组中选择具有重叠键的 SSTable，将它们合并。
将合并后的内容分为了多个不重叠的 SSTable，然后放入 L2 中的某一个组中。
如果 L2 合并后的大小超过了自身限制，那么重复上述过程，向 L3 合并。

用一张图来表示，如下：

为什么要分区

无论是哪种分区策略，都有如下两大优点：

分区将一个大型组件拆分成多个较小的 SSTable，就意味着将原来的大型合并操作拆分为多个较小的合并操作，从而限制了每个合并操作的处理时间以及创建新组件所需的临时磁盘空间。
分区可以通过只合并具有重叠键的 SSTable 来优化顺序创建 key 的工作负载。对于按顺序创建的 key，基本上不执行合并，因为没有具有重叠键的 SSTable。

优化问题

可以看到，LSM-Tree 是一种可调性比较高的结构，但却没有一种合并策略能够同时满足读优化与写优化。上面提到的 leveling 和 tiering，前者牺牲了写换取了读，后者牺牲了读换取了写。实际上，现在所做的很多优化工作，都是在 leveling 和 tiering 中进行变式与结合，也面临着读/写/空间的权衡问题。

综述里一共提到了 7 种优化思路，分别为：

减少写放大
优化合并操作
更大的内存空间
更好的硬件支持
针对特殊的工作负载进行优化
自调和
二级索引

在下一篇博客（学习笔记（二））中，我会按照归类将综述中提到的各种优化办法都整理一遍。

MongoDB下载安装数据潜水员 mongodb
###MongoDB1.MongoDB是一种基于文档的非关系型（NoSQL）数据库，数据存储在灵活的JSON文档中，便于快速查询和索引。####二、MongoDB下载1.**官网下载**：-官网地址：(https://www.mongodb.com/)-下载页面：(https://www.mongodb.com/try/download)-**注意**：需要登录账号（可免费注册）后才能下载。2.*
Go 学习笔记整合进击的程序猿~ GO 容器技术数据库 golang 学习 docker 1024程序员节
包括go语言基础、Linux基础、docker、kubernetes、中间件、NoSQL等等。go语言基础：Golang基本数据结构：https://blog.csdn.net/qq_41822345/article/details/125350205Golang高级数据结构：https://blog.csdn.net/qq_41822345/article/details/125475150Go
全网最详细的Kafka应用教程【建议收藏】 Java布道者 kafka 分布式
Kafkakafka是什么？kafka仅仅是属于消息中间件吗？kafka在设计之初的时候开发人员们在除了消息中间件以外，还想吧kafka设计为一个能够存储数据的系统，有点像常见的非关系型数据库，比如说NoSql等。除此之外还希望kafka能支持持续变化，不断增长的数据流,可以发布和订阅数据流，还可以对于这些数据进行保存也就是说kafka的本质是一个数据存储平台，流平台，只是他在做消息发布，消息消费
【从零开始学习计算机科学】数据库系统（十一）云数据库、NoSQL 与 NewSQL 贫苦游商数据库学习 nosql newsql 云数据库 CAP sql
【从零开始学习计算机科学】数据库系统（十一）云数据库、NoSQL与NewSQL云数据库云服务器的服务云数据库和传统的分布式数据库的异同NoSQLNoSQL数据库的特点CAP定理NoSQL的特性NoSQL数据库的分类NoSQL的适用场景Nosql数据库实例-RedisRedis的优势MongoDBMongoDB的特点NewSQLNewSQL出现的背景NewSQL（新型分布式数据库）的概念NewSQL
MongoDB介绍与部署使用 zhangleijiutian mongodb
MongoDB的功能特性MongoDB是一个高性能、开源、无模式的文档型数据库，设计用于提供高性能、水平可扩性、高可用性和高级可查询性，为Web应用提供可扩展的高性能数据存储解决方案。MongoDB的名称取自单词”humogous”中间的几个字符，是很大、巨大的意思。该数据库由10gen公司开发并提供技术支持，它属于NoSQL数据库家族中的一员，在许多场景下可以用来替代传统关系型数据库或key/v
HBase2.6.1部署文档 CXH728 zookeeper hbase
1、HBase概述ApacheHBase是基于Hadoop分布式文件系统（HDFS）之上的分布式、列存储、NoSQL数据库。它适合处理结构化和半结构化数据，能够存储数十亿行和数百万列的数据，并支持实时读写操作。HBase通常应用于需要快速随机读写、低延迟访问以及高吞吐量的场景，例如大规模日志处理、社交网络数据存储等。HBase特性列存储模型：HBase的数据是按列族存储的，适合高稀疏数据。行键分区
MySQL 与 MongoDB 的区别 kse_music #DB mysql mongodb 数据库
文章目录前言一、如何选择二、索引总结前言在当今数据驱动的世界中，数据库技术扮演着至关重要的角色，它们为应用程序提供了存储、管理和检索数据的基础设施。MySQL和MongoDB作为两种广泛使用的数据库管理系统，分别代表了关系型数据库（SQL）和非关系型数据库（NoSQL）的典型范例。MySQL是一种成熟的关系型数据库管理系统（RDBMS），自1995年问世以来，凭借其稳定性、可靠性和易用性，成为了许
【存储中间件】MongoDB最热门NoSql数据库（一）：NoSQL、MongoDB介绍道友老李架构师进阶-存储中间件 nosql mongodb 中间件
文章目录1.MongoDb综述1.1.什么是Nosql1.2.什么是MongoDb**1.2.1核心特性****1.2.2典型应用场景****1.2.3与关系型数据库对比****1.2.4局限性及使用建议**个人主页：道友老李欢迎加入社区：道友老李的学习社区1.MongoDb综述1.1.什么是NosqlNoSQL（NotOnlySQL）是一类非关系型数据库的统称，其核心特征在于突破传统关系型数据库
【存储中间件】Redis核心技术与实战（一）：Redis入门与应用（技术全景、版本选择与安装、全局命令）道友老李架构师进阶-存储中间件 Redis核心技术与实战中间件 redis 数据库
文章目录Redis入门与应用Redis的技术全景两大维度三大主线Redis的版本选择与安装**Redis的linux安装**Redis的启动默认配置带参数启动配置文件启动操作停止Redis全局命令键名的生产实践个人主页：道友老李欢迎加入社区：道友老李的学习社区Redis入门与应用Redis的技术全景Redis一个开源的基于键值对（Key-Value）NoSQL数据库。使用ANSIC语言编写、支持网
使用Couchbase中的向量搜索进行智能查询 eahba python
技术背景介绍Couchbase是一种强大的分布式NoSQL数据库，广泛应用于云、移动、AI和边缘计算应用中。其向量搜索功能，作为全文搜索服务的一部分，支持在应用中进行高效的语义查询。这为开发者在实现AI驱动的应用时提供了极大的便利。核心原理解析Couchbase的向量搜索利用向量嵌入技术对文本进行处理，可以实现基于语义相似度的查询。这与传统的关键词匹配有根本的不同，更适合AI应用场景中模糊或语义相
物联网实时数据存储方案选择动亦定 MySQL 物联网数据库物联网时序数据库数据库
存储物联网设备发出的实时数据时，需考虑数据量、速度、类型和访问需求。以下是几种常见的存储方案：1.时序数据库适用场景:适合处理时间序列数据，如传感器数据。优点:高效存储和查询时间序列数据，支持高写入和查询吞吐量。常见选择:InfluxDB、TimescaleDB、Prometheus。2.NoSQL数据库适用场景:适合非结构化或半结构化数据，如JSON、XML。优点:灵活的数据模型，易于扩展，适合
MongoD和关系型数据库相关概念的对应 oliver.chau mongodb 数据库 mongodb
在MongoDB（NoSQL）中，文档（Document）、集合（Collection）等概念与关系型数据库（RDBMS）的表、行等概念有一定的对应关系。可以用下面的表格来对比它们的概念：MongoDB（NoSQL）关系型数据库（RDBMS）解释数据库（Database）数据库（Database）一个存储数据的整体，包含多个集合（表）集合（Collection）表（Table）由多个文档组成的集合
MongoDB 集群模式简单了解黑风风网络运维 NoSQL mongodb 数据库
MongoDB集群模式简单了解在现代应用架构中，数据库的扩展性和高可用性至关重要，而MongoDB作为NoSQL数据库的佼佼者，提供了多种集群模式来应对不同场景的需求。这篇文章将深入探讨MongoDB的主要集群模式，并分析它们的适用场景和优缺点。1.MongoDB的三大集群模式MongoDB主要提供以下三种集群模式，每种模式都有其独特的应用场景和优势：副本集（ReplicaSet）——高可用性与数
MongoDB基本操作徐诗 mongodb 数据库 nosql
前言MongoDB是一种非关系型数据库。所谓NoSQL，并不是指没有SQL，而是指“NotOnlySQL”，即非传统关系型数据库。这类数库的主要特点包括非关系型、水平可扩展、分布式与开源。另外它还具有模式自由、最终一致性。一、MongoDB简介1.简介MongoDB是属于NoSql的一种数据类型。MongoDB是一款强大、灵活、且易于扩展的通用型数据库。MongoDB是一个基于分布式文件存储的数据
MongoDB应用设计调优 hzulwy 数据库 mongodb 数据库
应用范式设计什么是范式数据库范式概念是数据库技术的基本理论，几乎是伴随着数据库软件产品的推出而产生的。在传统关系型数据库领域，应用开发中遵循范式是最基本的要求。但随着互联网行业的发展，NoSQL开始变得非常流行，在许多的应用实践中也涌现出一些反范式的做法。三范式的定义（1）第一范式：数据库表的每一列都是不可分割的原子项。如下表，所在地一列就是不符合第一范式的，其中对于“广东省、深圳市”这样的字符串
华为云数据库GaussDB(for Cassandra)揭秘：内存异常增长的排查经历科技说 jvm java 开发语言
内存异常增长的排查经历背景介绍华为云数据库GaussDB(forCassandra)是一款基于计算存储分离架构，兼容Cassandra生态的云原生NoSQL数据库；它依靠共享存储池实现了强一致，保证数据的安全可靠。核心特点是：存算分离、低成本、高性能。问题描述GaussDB(forCassandra)自研架构下遇到一些挑战性问题，比如cpu过高，内存泄漏，内存异常增长，时延高等问题，这些也都是开发
NoSQL数据库 Wlq0415 nosql 数据库
NoSQL数据库主要分为以下几类：文档型数据库(DocumentStore)特点：以文档的形式存储数据，通常使用JSON、BSON或XML等格式。每个文档自包含，支持动态的模式。适用场景：适合需要存储复杂数据结构和动态变化模式的应用，例如内容管理系统和用户配置管理。示例：MongoDB、CouchDB。键值存储(Key-ValueStore)特点：数据以键值对的形式存储，通过唯一的键快速访问相应的
项目中用到redis，为什么选用redis，了解其他NoSQL数据库吗？在你的项目中是如何运用redis的？key是什么，value是什么？「已注销」
为什么选用redis高效性：Redis读取的速度是110000次/s，写的速度是81000次/s原子性：Redis的所有操作都是原子性的，同时Redis还支持对几个操作全并后的原子性执行。支持多种数据结构：string（字符串）；list（列表）；hash（哈希），set（集合）；zset(有序集合)稳定性：持久化，主从复制（集群）其他特性：支持过期时间，支持事务，消息订阅。其他NoSQL数据库：
Python的那些事第三十九篇：MongoDB的Python驱动程序PyMongo 暮雨哀尘 Python的那些事 python 开发语言科技 mongodb 智能家居 PyMongo 数据加密
PyMongo：MongoDB的Python驱动程序摘要PyMongo是MongoDB的官方Python驱动程序，用于在Python应用程序中与MongoDB数据库进行交互。本文将详细介绍PyMongo的安装、基本操作、高级功能以及实际应用案例，并通过示例代码和表格展示其强大的功能和灵活性。1.引言MongoDB是一种流行的NoSQL数据库，以其灵活的文档模型和高性能而闻名。PyMongo作为Mo
【每日八股】MySQL篇（三）：索引（上） YGGP 后端 mysql 数据库
目录MySQL为什么使用B+树来做索引，它的优势是什么？特性和定义B+树和B树的对比拓展：既然B+树相较于B树优势如此之大，为什么nosql的MongoDB底层仍采用B树而不是B+树？使用B+树做索引的优势补充：为什么说B+树的插入和删除效率高？B+树的冗余结点是如何形成的？它们的作用是什么？冗余结点是如何帮助提高插入和删除效率的？冗余结点指的是叶子节点冗余还是用做索引的非叶子节点冗余？为什么说B
文件系统、关系型数据库、NoSQL 和数据湖晴天彩虹雨数据库 nosql 大数据 hadoop
数据存储是信息技术中的基础组成部分，它对数据的管理、存储、处理和检索起着至关重要的作用。在现代数据系统中，根据数据的类型、规模、使用场景等因素，不同的存储方式可以提供不同的优点和解决方案。本文将介绍四种主要的数据存储方式：文件系统、关系型数据库（RDBMS）、NoSQL和数据湖。1.文件系统文件系统（FileSystem）是一种将数据按文件形式进行存储和管理的技术。在文件系统中，数据以文件的形式组
腾讯集团软件开发-后台开发方向内推飞300 业界资讯 mysql java
熟练掌握C/C++/Java/Go等其中一门开发语言；TCP/UDP网络协议及相关编程、进程间通讯编程；专业软件知识，包括算法、操作系统、软件工程、设计模式、数据结构、数据库系统、网络安全等有一定了解的：1、Python、Shell、Perl等脚本语言；2、MySQL及SQL语言、编程；3、NoSQL,Key-value存储原理。1、深入理解业务需求和产品设计，高效地实现并优化产品功能；2、持续优
Spring Boot中使用MongoDB聚合管道进行数据查询操作 BitCodeW spring boot mongodb 后端数据库
SpringBoot中使用MongoDB聚合管道进行数据查询操作MongoDB是一种流行的NoSQL数据库，它提供了强大的聚合管道功能，可以用于在数据库中执行复杂的数据查询和分析操作。在SpringBoot中，我们可以利用MongoTemplate类来执行MongoDB的聚合管道查询。本文将介绍如何在SpringBoot应用程序中使用MongoDB的聚合管道查询操作，包括facet、facet、f
Redis :01---Redis简介和安装前网易架构师-高司机 2025年最新-数据库运维数据库数据结构大数据分布式
一、Redis简介·Redis官网：https://redis.io/·Redis是一种基于键值对（key-value）的NoSQL数据库·与很多键值对数据库不同的是，Redis中的值可以是由string（字符串）、hash（哈希）、list（列表）、set（集合）、zset（有序集合）、Bitmaps（位图）、HyperLogLog、GEO（地理信息定位）等多种数据结构和算法组成，因此Redis
深入解析Redis：核心特性与应用场景月落星还在 redis redis 数据库缓存
1.Redis的本质与定位Redis（RemoteDictionaryServer）是一个开源的、基于内存的键值对存储系统，属于NoSQL数据库的范畴。与传统的关系型数据库（如MySQL）不同，Redis以极致的性能和灵活的数据结构为核心设计目标，被广泛应用于缓存、实时数据分析、消息队列等场景。核心定位：Redis并非替代传统数据库，而是作为高性能的数据中间层，解决磁盘存储无法满足的高并发、低延迟
redis基础知识整理以及案例分析小鹿的周先生
redis基础知识整理以及案例分析1.redis1.概念2.下载安装3.命令操作1.数据结构4.持久化操作5.使用Java客户端操作redisRedis1.概念：redis是一款高性能的NOSQL系列的非关系型数据库1.1.什么是NOSQLNoSQL(NoSQL=NotOnlySQL)，意即“不仅仅是SQL”，是一项全新的数据库理念，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关
在 Windows 11 上安装 MongoDB D0ublecl1ck #MongoDB windows mongodb 数据库
MongoDB是一个流行的NoSQL数据库，它提供了灵活的数据存储方案，而MongoDBCompass则是一个可视化管理工具，可以更轻松地与MongoDB数据库交互和管理。在本文中，我们将介绍如何在Windows11上安装MongoDB，并配置MongoDBCompass进行可视化管理。1.下载MongoDB首先，我们需要下载MongoDB安装包。你可以从MongoDB官方网站下载最新版本的Mon
redis 快速入门栀夏613 数据库 redis 数据库缓存
目录数据库的分类NoSQL非结构化认识redis特征安装redis单机安装Docker安装redis的基本配置启动redis关闭redisredis开机自启redis客户端redis数据结构介绍基本类型String的基础操作List基本操作Set基本操作SortedSet基本操作Hash基本操作redis通用命令key的层级格式数据库的分类关系型数据库结构化数据表中存储的数据格式是一样的数据与数据
一文速通MongoDB C__C.. 数据库 mongodb nosql
MongoDB是一个开源的、面向文档的NoSQL数据库管理系统，与传统的关系型数据库（如MySQL）不同，MongoDB存储数据的方式更加灵活，不需要固定的表结构和模式。MongoDB的一些关键特性：文档型存储：MongoDB使用BSON（二进制JSON）格式存储数据，数据以文档的形式组织。每个文档类似于JSON对象，可以包含键值对、数组、嵌套文档等多种结构。无模式设计：MongoDB不要求事先定
MongoDB快速入门南枝杜鹃 mongodb 数据库
目录1什么是MongoDB1.1MongoDB的特点2基本概念3安装与配置4MongoDB操作指令连接与数据库操作集合操作文档操作索引操作聚合操作1什么是MongoDBMongoDB是一个基于分布式文件存储的开源数据库系统属于NOSQL（非关系型数据库）的范畴，它以高性能，高可扩展性和灵活的数据模型而受到广泛关注。1.1MongoDB的特点1，灵活的数据模型：采用文档型数据模型，模型以BSON（二
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

LSM-Tree(一)：初识

文章目录

LSM-Tree 诞生之前

早期 LSM-Tree

LSM-Tree 基本结构

leveling & tiering

partition

partitioned leveling

partitioned tiering

vertical grouping

horizontal grouping

为什么要分区

优化问题

你可能感兴趣的:(nosql)