wangxin201492

MongoDB sharding中分布式锁机制

2020-03-24 19:11:00

文章目录

- 分布式锁原理
- - 1. `config.lockpings` 和 `config.locks` 集合中存储的内容
  - - config.lockpings
    - config.locks
  - 2. 与 `config.lockpings` 和 `config.locks` 的基本交互
  - 3. 分布式锁获取逻辑
  - 4. 加锁的场景
  - 5. 解锁场景
- 分布式锁代码解析
- - 1. 核心类说明
  - - `DistLockCatalogImpl : DistLockCatalog` : 对分布式锁的一些具体操作
    - `ReplSetDistLockManager : DistLockManager` : 分布式锁的一些接口，主要封装DistLockCatalogImpl而实现
  - 2. 初始化
  - 3. replSetDistLockPinger线程
  - - 线程启动
    - 线程逻辑 : doTask
  - 4. 触发分布式锁的场景
  - - collection 操作
    - database 操作
    - chunk 操作
    - map-reduce操作

sharding实例在 createCollection/dropCollection 等场景下，为了规避并发问题引入了分布式锁机制。分布式锁的信息记录在 config.locks 集合中，结合 config.lockpings 中的信息来完成相关逻辑实现。

分布式锁原理

1. `config.lockpings` 和 `config.locks` 集合中存储的内容

config.lockpings

config.lockpings 集合跟踪记录分片集群中所有活跃的组件。

如果一个 mongos 运行在 example.com:30000 ，那么 config.lockpings 关于这个mongos的记录是这个样子的

{ 
	"_id" : "example.com:30000:1350047994:16807", // 记录组件的标识， mongos 和 shard 节点均需要定期和 config 节点保持心跳
	"ping" : ISODate("2020-07-12T18:32:54.892Z") // 组件定期与 `lockpings` 集合保持心跳，即更新 `ping` 字段
}

_id 字段内部称为 processID 。processID 对于 config 节点固定为"ConfigServer"；对于 mongos / shard 节点，则是以":"分隔的四段信息分别为：hostname / port / timestamp / 随机int64值。该4项信息在进程启动时即已决定，进程存活期间不会被修改。

config.locks

config.locks 集合存储了分布式锁信息。

{
   "_id" : "test.myShardedCollection", // 锁的名称，下文简称 lockName。对 database 或者 namespace 的部分场景操作需要获取分布式锁，所以一般 database 或者 namespace
   "state" : 2, // 锁的状态。0 表示 UNLOCKED，2 表示 LOCKED，1 表示 LOCK_PREP（仅对老版本3个config节点，目前代码中已无相关逻辑）
   "process" : "ConfigServer", // 即 processID。与上文讲到的 config.lockpings 集合中 _id 字段的取值是一样的
   "ts" : ObjectId("5be0b9ede46e4f441a60d891"), // 锁ID，下文简称 lockID。每次尝试获取分布式锁时的 锁ID 都是独有的。
   "when" : ISODate("2020-07-12T21:52:00.846Z"), // 获取锁的时间
   "who" : "ConfigServer:Balancer", // 获取锁的角色。  以":"分隔，第一段与 process字段 相同， 第二段 进程获取锁的线程名称。 ConfigServer:Balancer 表示 config进程的Balancer线程
   "why" : "Migrating chunk(s) in collection test.myShardedCollection" // 获取锁的原因
}

_id 下文简称 lockName, process 下文简称 processID，ts 下文简称 lockID

2. 与 `config.lockpings` 和 `config.locks` 的基本交互

与上述2个集合的基础交互（DistLockCatalog 提供了与上述2个集合的基础交互动作，而 DistLockCatalogImpl 则是接口的具体实现）

与 config.lockpings 的交互有 3 种场景：

replSetDistLockPinger 线程每隔 30s 通过一个 upsert: true 的 findAndModify 请求更新ping字段
系统 shutdown 时，会构造一个 update: {} 的 findAndModify 请求清理掉对应的document
此外在尝试获取分布式锁时，会获取对应组件上次心跳的时间，基于此判断组件是否已经丢失心跳，进而判断是否需要抢占锁

与 config.locks 交互便是我们关心的分布式锁交互过程：

组件获取到分布式锁有2种方式：
- grabLock : 没有期望的 lockName 记录或者有期望的 lockName 记录且 state = 0(UNLOCKED) ，通过更新 state = 2(LOCKED), 同时更新processID/lockID/who/when/why字段的方式获取锁
- overtakeLock : 对于**期望 lockName记录，其 state = 0(UNLOCKED) 或者 lockID = oldTS **，通过更新 state = 2(LOCKED)、更新 lockID = newTS、更新processID/who/when/why字段的方式抢占锁

3. 分布式锁获取逻辑

主要是通过 ReplSetDistLockManager::lockWithSessionID() 来完成的

在预期情况下，应不存在对应的锁或者锁的状态应该是 UNLOCKED。所以首先通过 grabLock 的方式来获取锁
如通过 grabLock 获取失败，则说明可能存在锁竞争的情况。则通过锁的名称来获取目前 config.locks 集合中记录的对应锁的信息
基于锁的信息来判断：如果 当前记录的分布式锁已经超时 或者 其对应的 processID 为当前请求的processID，则通过 overtakeLock 的方式抢占锁
1. 当前记录的分布式锁已经超时：ReplSetDistLockManager 内部维护一个 _pingHistory 用于协助判断 config.locks 中记录的锁是否超时。_pingHistory 中记录了 processID/pingValue/config节点的serverTime/lockID/config节点的electionId。
  1. 无法在 config.lockpings 集合中找到对应组件的心跳记录，则认为锁未超时
  2. 如果 _pingHistory 中不存在对应 lockName 的记录，则认为锁未超时，并将相关结果记录到 _pingHistor中
  3. 如果与 _pingHistory 中记录相比，锁的持有者心跳正常(pingValue字段持续更新) 或者 锁的lockID发生变化 或者 config发生主节点变更(electionId发生变化) 则认为锁未超时，同时将相关结果记录到 _pingHistory 便于下次对比
  4. 最后，如果上述情况都没有发生，而 _pingHistory 中记录的 config节点的serverTime 时间与当前时间超过 15min，则认为锁已经超时
2. 锁的信息中对应的 ts 为当前请求的ts
如上述操作均失败，则等待后重新执行上述操作。直到超出指定的等待时间（waitFor）则返回LockBusy

借助简要代码看下：

入参中：name 为锁的名称（即 _id 字段），lockSessionID 为获取锁唯一的锁ID（即 ts 字段），waitFor 为预期等待锁的时间。

StatusWith ReplSetDistLockManager::lockWithSessionID(OperationContext* opCtx,
                                                                     StringData name,
                                                                     StringData whyMessage,
                                                                     const OID& lockSessionID,
                                                                     Milliseconds waitFor) {
    ...

    // Distributed lock acquisition works by tring to update the state of the lock to 'taken'. If
    // the lock is currently taken, we will back off and try the acquisition again, repeating this
    // until the lockTryInterval has been reached. If a network error occurs at each lock
    // acquisition attempt, the lock acquisition will be retried immediately.
    while (waitFor <= Milliseconds::zero() || Milliseconds(timer.millis()) < waitFor) {
        ...

        auto lockResult = _catalog->grabLock(
            opCtx, name, lockSessionID, who, _processID, Date_t::now(), whyMessage.toString());

        auto status = lockResult.getStatus();

        if (status.isOK()) {
            ...
            return lockSessionID;
        }

        // Get info from current lock and check if we can overtake it.
        auto getLockStatusResult = _catalog->getLockByName(opCtx, name);
        const auto& getLockStatus = getLockStatusResult.getStatus();
        ...

        // Note: Only attempt to overtake locks that actually exists. If lock was not
        // found, use the normal grab lock path to acquire it.
        if (getLockStatusResult.isOK()) {
            auto currentLock = getLockStatusResult.getValue();
            auto isLockExpiredResult = isLockExpired(opCtx, currentLock, lockExpiration);

            if (isLockExpiredResult.getValue() || (lockSessionID == currentLock.getLockID())) {
                auto overtakeResult = _catalog->overtakeLock(xxx);
                ...
            }
        }
        ...

        if (waitFor == Milliseconds::zero()) {
            break;
        }

        const Milliseconds timeRemaining = std::max(Milliseconds::zero(), waitFor - Milliseconds(timer.millis()));
        sleepFor(std::min(kLockRetryInterval, timeRemaining));
    }

    return {ErrorCodes::LockBusy, str::stream() << "timed out waiting for " << name};
}

4. 加锁的场景

collectin操作：createCollection / dropCollection / shardCollection 会同时对 collection 的 namespace 和 database 加锁
database操作：movePrimary / enableSharding / createDatabase / dropDatabase 时会对 database 加锁，dropDatabase 还会依次对 db 下所有的 collection 加锁(dropCollection)
chunk操作：Migrating chunk(s) in collection / merging chunks / splitting chunk
map-reduce操作：mr-post-process

5. 解锁场景

一般情况在需要获取分布式锁的场景下，获取分布式锁成功会获得到一个 DistLockManager::ScopedDistLock 的对象，并在锁使用完成后触发该对象的析构函数，释放锁（修改state=UNLOCKED）。
另外如果 grabLock 时，如果获取失败返回异常是由于 config节点状态异常导致，那么也会进行 unlock 方便下次可以直接 grabLock 完成加锁。
MigrationManager 一些场景触发 // TODO
如果在上述任何场景触发的unlock失败 或者 一些操作导致锁的状态未知 后，都会加入到 _unlockList 队列，在 replSetDistLockPinger 定期执行时也会重新进行 unlock 操作

分布式锁代码解析

1. 核心类说明

`DistLockCatalogImpl : DistLockCatalog` : 对分布式锁的一些具体操作

/**
 * Interface for the distributed lock operations.
 */
class DistLockCatalog {}

对config.lockpings的基础操作：ping/getPing/stopPing
获取分布式锁or config的信息：getServerInfo/getLockByTS/getLockByname
对锁的操作(config.locks)：grabLock/overtakeLock/unlock/unlockAll

其中grabLock 和 overtakeLock 是两个核心的获取锁的方法：

grabLock : 将lockID的锁更新为指定的lockSessionID
overtakeLock : 强制将锁的持有者从currentHolderTS更改为lockSessionID

`ReplSetDistLockManager : DistLockManager` : 分布式锁的一些接口，主要封装DistLockCatalogImpl而实现

/**
 * Interface for handling distributed locks.
 *
 * Usage:
 *
 * auto scopedDistLock = mgr->lock(...);
 *
 * if (!scopedDistLock.isOK()) {
 *   // Did not get lock. scopedLockStatus destructor will not call unlock.
 * }
 *
 * // To check if lock is still owned:
 * auto status = scopedDistLock.getValue().checkStatus();
 *
 * if (!status.isOK()) {
 *   // Someone took over the lock! Unlock will still be called at destructor, but will
 *   // practically be a no-op since it doesn't own the lock anymore.
 * }
 */
class DistLockManager {}

持有一个线程replSetDistLockPinger，用户定时与config.lockpings心跳，并对需要unlock的锁进行unlock
提供对锁处理的一些方法：
1. 加锁：lock/lockWithSessionID/tryLockWithLocalWriteConcern
  1. lock通过调用lockWithSessionID来实现
2. 解锁：unlock/unlockAll
持有一个内部类ScopedDistLock : 一个RAII风格的类，持有锁的基础信息

2. 初始化

mongos初始化时会生成一个与host、port、时间戳、随机值有关的一个distLockProcessId作为ReplSetDistLockManager的唯一标识，并在makeCatalogClient中完成对DistLockCatalogImpl、ReplSetDistLockManager、ShardingCatalogClientImpl的初始化

DistLockCatalogImpl : 是DistLockCatalog的具体实现。默认初始化方法存储了config.locks，config.lockpings表名
ReplSetDistLockManager : 是DistLockManager的具体实现。初始化方法存储了上面提到的distLockProcessId, DistLockCatalog并完成了pingInterval, lockExpiration的初始化，其中pingInterval默认为30s，lockExpiration默认为15min
ShardingCatalogClientImpl : 是ShardingCatalogClient的具体实现。初始化方法存储了上面提到的DistLockManager。(该类只提供了一个获取DistLockManager的方式及start、shutdown的方法，与DistLockManager无其他关系)

然后将ShardingCatalogClientImpl作为一个数据成员存储在全局的Grid中

3. replSetDistLockPinger线程

线程启动

grid初始化完成后，紧接着会调用grid->catalogClient()->startup();，该语句实际上最终调用到ReplSetDistLockManager::startUp()，启动一个replSetDistLockPinger线程，线程的具体执行在ReplSetDistLockManager::doTask()中

线程逻辑 : doTask

config.lockpings交互：调用DistLockCatalog::ping()，构造一个findAndModify请求根据processID更新ping字段(upsert=true)。并更新本地的elapsedSincelastPing，如果与上次ping时间超过_pingInterval*10 则打印warning日志
unlock：遍历本地的 _unlockList ，对需要unlock的锁调用DistLockCatalog::unlock()。如果返回失败则打印warning日志并重新加入_unlockList中
sleep _pingInterval 即15s

4. 触发分布式锁的场景

chunk操作：Migrating chunk(s) in collection / merging chunks / splitting chunk
db or collection操作：movePrimary/enableSharding/dropCollection …
map-reduce操作：mr-post-process

collection 操作

whyMessage	_id	function	file
“createCollection”	database	lock	src/mongo/db/s/config/configsvr_create_collection_command.cpp
“createCollection”	namespace	lock	src/mongo/db/s/config/configsvr_create_collection_command.cpp
“dropCollection”	database	lock	src/mongo/db/s/config/configsvr_drop_collection_command.cpp
“dropCollection”	namespace	lock	src/mongo/db/s/config/configsvr_drop_collection_command.cpp
“shardCollection”	database	lock	src/mongo/db/s/config/configsvr_shard_collection_command.cpp
“shardCollection”	namespace	lock	src/mongo/db/s/config/configsvr_shard_collection_command.cpp

database 操作

whyMessage	_id	function	file
“movePrimary”	database	lock	src/mongo/db/s/config/configsvr_move_primary_command.cpp
“enableSharding”	database	lock	src/mongo/db/s/config/configsvr_enable_sharding_command.cpp
“createDatabase”	database	lock	src/mongo/db/s/config/configsvr_create_database_command.cpp
“dropDatabase”	database	lock	src/mongo/db/s/config/configsvr_drop_database_command.cpp
“dropCollection”	namespace	lock	src/mongo/db/s/config/configsvr_drop_database_command.cpp

chunk 操作

whyMessage	_id	function	file
"splitting chunk " << chunkRange.toString() << " in " << nss.toString()	namespace	lock	src/mongo/db/s/split_chunk.cpp
"merging chunks in " << nss.ns() << " from " << minKey << " to " << maxKey	namespace	lock	src/mongo/db/s/merge_chunks_command.cpp
"Migrating chunk(s) in collection " << migrateType.getNss().ns())	namespace	tryLockWithLocalWriteConcern	src/mongo/db/s/balancer/migration_manager.cpp
"Migrating chunk(s) in collection " << nss.ns()	namespace	lockWithSessionID	src/mongo/db/s/balancer/migration_manager.cpp

map-reduce操作

whyMessage	_id	function	file
“mr-post-process”	namespace	lock	src/mongo/s/commands/cluster_map_reduce_cmd.cpp

你可能感兴趣的:(MongoDB,mongodb,sharding)

mongodb替代品SequoiaDB的安装使用码农下的天桥 mongodb sequoiadb 数据库
前言1、为什么不直接使用mongodb啊？答：mongodb的使用协议是SSPL，一旦使用需要将你服务器程序都开源处理–或者给钱。非常不好，而SequoiaDB号称能够兼容mongodb协议，这次来安装试试。mongodb-SSPL，SequoiaDB是AGPL3，勉强比mongodb的协议可用。至少不修改则不用开源。准备工作首先去官网下载：www.sequoiadb.com我下载的版本是：也不知
MongoDB与Redis有哪些区别相遇在春风里经验分享
MongoDB和Redis是两种不同类型的数据库，它们存在以下区别：一、数据模型MongoDBMongoDB是一个文档型数据库，它使用BSON（BinaryJSON）格式存储数据。数据以类似JSON的文档形式组织，每个文档可以有不同的结构（即模式自由）。例如，在一个存储用户信息的集合中，一个用户文档可能包含姓名、年龄、地址等字段，而另一个用户文档可能还包含额外的兴趣爱好字段。这种数据模型非常适合处
mongodb和redis的区别： huangbfeng mongodb redis 数据库
1、内存管理机制Redis数据全部存在内存，定期写入磁盘，当内存不够时，可以选择指定的LRU算法删除数据。MongoDB数据存在内存，由linux系统mmap实现，当内存不够时，只将热点数据放入内存，其他数据存在磁盘。2、支持的数据结构Redis支持的数据结构丰富，包括hash、set、list等。MongoDB数据结构比较单一，但是支持丰富的数据表达，索引，最类似关系型数据库，支持的查询语言非常
Akka Persistence MongoDB 驱动：高效持久化解决方案韩烨琰
AkkaPersistenceMongoDB驱动：高效持久化解决方案akka-persistence-mongoImplementationofakka-persistencestoragepluginsformongodb项目地址:https://gitcode.com/gh_mirrors/ak/akka-persistence-mongo项目介绍AkkaPersistenceMongoDB驱
MongoDB框架零基础入门码农研究僧 Python 100天精通全栈 mongodb nosql 数据库
目录前言1.安装配置2.关启配置3.基本概念4.基本操作4.1创建集合4.2删除集合4.3插入文档4.4更新文档4.5删除文档4.6查询文档前言先科普讲解一下NoSQL（notonlysql）本身NoSQL非关系型数据库就具备了ACID（原子性、一致性、持久性、隔离性）数据持久化一般还是要使用关系型数据库，内存的数据库使用检索MongoDB是C++编写，一个基于分布式文件存储的开源数据库系统。将其
AWS DocumentDB vs MongoDB：数据库的技术抉择在云上（oncloudai）数据库 aws mongodb
随着非关系型数据库在现代应用中的广泛应用，文档型数据库因其灵活的结构与出色的扩展性，逐渐成为企业开发与架构设计中的核心选择。在众多文档数据库中，MongoDB凭借其成熟生态与社区支持占据主导地位；与此同时，AWS提供的AmazonDocumentDB（withMongoDBcompatibility）也成为云原生架构下的重要选项。那么，AmazonDocumentDB与MongoDB究竟有何异同？
MongoDB 高性能应用场景与实践 AI自闭实验者 mongodb 数据库
```htmlMongoDB高性能应用场景与实践MongoDB高性能应用场景与实践随着大数据时代的到来，数据库作为数据存储和管理的核心工具，其性能和可扩展性显得尤为重要。在众多的数据库解决方案中，MongoDB凭借其灵活的数据模型、高性能和易于扩展的特点，在许多场景下成为开发者的首选。什么是MongoDB？MongoDB是一个开源的、面向文档的NoSQL数据库管理系统。它以JSON样式的文档存储数
缓存与加速技术实践-MongoDB数据库应用曼汐 . 数据库缓存 mongodb
一.什么是MongoDBMongoDB是一个文档型数据库，数据以类似JSON的文档形式存储。MongoDB的设计理念是为了应对大数据量、高性能和灵活性需求。MongoDB使用集合（Collections）来组织文档（Documents），每个文档都是由键值对组成的。数据库（Database）：存储数据的容器，类似于关系型数据库中的数据库。集合（Collection）：数据库中的一个集合，类似于关系
（mysql、oracle、pgsql、mongodb、redis、es）主流数据库的核心差异不愿意透露姓名的樊同学数据库 mysql oracle postgresql
以下是主流数据库的核心差异及适用场景的全面对比，结合技术特性和实际应用需求整理：一、数据库分类与核心差异1.关系型数据库（RDBMS）数据库核心特点适用场景MySQL开源、读写性能均衡，易用性高，但复杂查询较弱Web应用（博客/电商）、中小企业OLTP系统（如用户管理）Oracle商业级、强事务支持（RAC集群）、功能全面，成本高金融核心系统（银行交易）、大型ERP（复杂事务）PostgreSQL
分库分表之-ShardingJDBC技术详解
ShardingJDBC技术详解一、ShardingJDBC简介ShardingJDBC是一款轻量级的分布式数据库中间件，定位为在Java的JDBC层提供额外服务。它以客户端直连数据库的方式，以jar包形式提供服务，无需额外部署和依赖，可理解为增强版的JDBC驱动，完全兼容JDBC和各种ORM框架。适用于任何基于JDBC的ORM框架，如JPA、Hibernate、Mybatis、SpringJDB
MongoDB入门指南：从零开始掌握NoSQL数据库辗转.953 mongodb nosql 数据库
目录一、MongoDB简介（一）什么是MongoDB？（二）MongoDB的特点（三）MongoDB的应用场景二、安装MongoDB（一）安装MongoDBServer1.Windows安装2.Linux安装（以Ubuntu为例）3.macOS安装（使用Homebrew）（二）安装MongoDB客户端安装MongoDBCompass三、MongoDB基本概念（一）数据库（Database）（二）集
【MongoDB】MongoDB从零开始详细教程核心概念与原理环境搭建基础操作夜雨hiyeyu.com mongodb 数据库 java spring boot 数据库架构 spring cloud sql
MongoDB从零开始详细教程核心概念与原理环境搭建基础操作一、核心概念与原理1.核心组件2.MongoDBvs关系型数据库二、环境搭建（Windows/Linux/CentOS）1.Windows安装2.CentOS安装3.连接验证三、基础操作（CRUD）1.数据库与集合操作2.文档增删改查四、高级特性与优化1.索引优化2.聚合管道（Aggregation）3.分片集群与副本集五、编程语言集成（
NoSQL保障MongoDB数据库副本集和MongoDB副本集操作覃炳文20230322027 数据库 nosql mongodb
MongoDB是一个基于文档的NoSQL数据库，它支持多种数据存储模型，包括副本集（ReplicaSets）。副本集是MongoDB的一种高可用性和数据冗余机制，它由一组MongoDB实例组成，其中包含一个主节点（Primary）和多个从节点（Secondary）。副本集的主要目的是提供数据的冗余和高可用性，确保在主节点发生故障时，从节点可以接管服务。NoSQL保障通常指的是非关系型数据库（如Mo
Linux - firewall week@eight Linux linux 运维服务器
使用firewall-cmd管理Linux防火墙的实用指南在Linux系统中，尤其是基于RedHat的发行版（如CentOS、Fedora、RHEL），firewalld是默认的动态防火墙管理工具。它通过firewall-cmd命令提供了一个灵活的方式来管理网络规则和端口访问控制。本文将介绍如何使用firewall-cmd来查看和配置防火墙规则，并结合MongoDB和SSH服务进行示例说明。一、查
mongodb 新手入门，原理，优化，详细介绍附上代码夜雨hiyeyu.com java mongodb 数据库 nosql sql 数据库架构 java springboot
mongodb新手入门，原理，优化，详细介绍附上代码一、新手入门指南1.核心概念2.安装与启动3.基础操作（Shell命令）二、核心原理详解1.数据模型与存储2.集群架构3.索引机制三、性能优化策略1.查询优化2.资源配置3.设计模式优化四、实战代码示例Node.js操作MongoDBPython操作MongoDB总结一、新手入门指南1.核心概念文档（Document）：MongoDB的基本数据单
Docker 常见容器第三方镜像地址 Docker国内镜像 docker国内镜像 docker镜像头上一片天空 Docker docker 容器运维
Docker常见容器第三方镜像地址Docker国内镜像docker国内镜像docker镜像Docker常见容器第三方镜像地址Docker国内镜像docker国内镜像docker镜像注意这里提供的镜像需要区分Inter和AMD架构，等后面会慢慢补齐amd架构镜像1、MySQLInter平台AMD平台2、SQLServer(mssql)3、Oracle4、MongoDBInter/AMD平台5、Red
Sharding-Sphere，Sharding-JDBC_介绍_Sharding-Sphere，Sharding-JDBC分布式_分库分表工作笔记001 添柴程序猿
技术交流QQ群【JAVA,C++,Python,.NET,BigData,AI】：170933152因为公司最近在做多租户的智慧城市相关的产品,这里,偶然看到这个框架,应该是可以用到,所以就看了一些,记录下来.先看一下我们要看的内容.去网站看看shardingsphere,是一套开源的分布式数据库中间件,解决方案包括3个产品点击了解更多去看一下
docker 安装mongodb 启航挨踢 docker docker 容器运维
docker安装mongodbdocker安装mongodb前，需要在服务器上先安装docker运行环境，可参考博文：linux搭建docker和docker-compose运行环境-CSDN博客1.上传mongo_latest.tar镜像到/home/datamongo_latest.tar可自行下载或到我的博客资源中心下载2.使用命令：dockerload-imongo_latest.tar加
MongoDb 有必要分库么旷野说数据库 mongodb 数据库
在MongoDB中，数据分散在‌多个数据库（DB）‌中查询与集中在‌单个数据库‌中查询的性能差异主要取决于资源分配、并发操作和系统负载。以下是关键区别：‌资源隔离vs.资源共享‌多个数据库‌：优势‌：每个数据库拥有独立的文件、锁和内存缓存（WiredTiger缓存）。在高并发场景下，不同数据库的查询可减少资源竞争（如锁争用）。劣势‌：若物理资源（CPU、内存、磁盘I/O）有限，多个数据库可能分散缓
Node.js 后端开发实战：项目搭建与优化 AI大模型应用实战 Java开发实战 node.js ai
Node.js后端开发实战：项目搭建与优化关键词：Node.js、后端开发、项目搭建、性能优化、Express框架、MongoDB、RESTfulAPI摘要：本文深入探讨Node.js后端开发的实战技巧，从项目搭建到性能优化的完整流程。我们将从基础架构设计开始，逐步深入到核心算法实现、数据库优化策略，最后分享实际项目中的性能调优经验。通过本文，读者将掌握构建高性能Node.js后端服务的关键技术和
分库分表之数据库分片分类软件编程在线接单（需要可私）分库分表数据库 sql mysql
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之优缺点分析前情摘要：本文章目录（一）垂直分库分表优化方案一
分库分表之策略软件编程在线接单（需要可私）分库分表数据库后端 spring boot
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之数据库分片分类前情摘要：1、数据库性能优化2、分库分表之优
Sharding-JDBC分库分表之SpringBoot分片策略 JingAi_jia917 Sharding-JDBC ShardingJDBC 分库分表 Spring分库分表分库分表策略自定义分片策略 Sharding JDBC
Sharding-JDBC系列1、Sharding-JDBC分库分表的基本使用2、Sharding-JDBC分库分表之SpringBoot分片策略3、Sharding-JDBC分库分表之SpringBoot主从配置前言前一篇以一个示例分享了Sharding-JDBC的基本使用。在进行分库分表时，可以设置分库分表的分片策略，在示例中，使用的是最简单的inline分片策略。本篇详细的给大家分享一下Sh
分库分表下的 ID 冲突问题与雪花算法讲解软件编程在线接单（需要可私）分库分表面试数据库 mysql 分布式
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表技术栈讲解-Sharding-JDBC前情摘要：1、数据库性
MongoDB官方文档V4.0详细解读与实践偏偏无理取闹
本文还有配套的精品资源，点击获取简介：MongoDB是一个流行的开源文档数据库，特别适合处理大规模非结构化数据。版本4.0在性能、可扩展性和功能上都有显著提升，包括了对ACID事务的支持、变更流的引入、分片功能的加强以及WiredTiger存储引擎的更新。本官方文档详细介绍了这些特性以及聚合框架的增强、安全性提升等，为开发者提供了学习和掌握MongoDB的宝贵资料。文档涵盖了从基础知识到高级特性，
Docker Desktop 4.42集成的MCP工具包深海科技服务行业发展 IT应用探讨 docker 容器运维
一、介绍DockerDesktop4.42集成了MCP（Model‑Client‑Plugin）Toolkit，无需额外安装扩展即可直接使用。MCPToolkit集成细节内置于DockerDesktop：你可以直接打开应用，在设置中启用MCP服务器，比如GitHub、MongoDB、HashiCorp等，连接客户端（如ClaudeDesktop、Cursor）或Docker自家的AI代理Gordo
Python爬虫进阶：Scrapy+Playwright+智能解析高效爬取B站游戏实况视频数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫 scrapy 笔记开发语言游戏音视频
摘要本文将深入讲解如何构建一个高性能B站游戏实况视频爬虫系统，涵盖从逆向工程到分布式部署的全流程。项目采用Scrapy框架作为核心，集成Playwright处理动态渲染，使用智能解析技术应对B站反爬机制，结合MongoDB和Elasticsearch构建数据存储与检索系统，最终实现每小时可处理10万+视频数据的专业级采集方案。1.B站数据生态分析1.1游戏区数据价值热门游戏实时监测UP主影响力评估
ShardingJdbc分库分表+连表查询(超简单) 宇宙超级勇猛无敌暴龙战神 spring boot
下载依赖这边建议所有的依赖版本都和我同步，因为我被版本冲突折磨了好久...org.springframework.bootspring-boot-starter-parent2.2.1.RELEASEorg.springframework.bootspring-boot-starter-weborg.springframework.bootspring-boot-starterorg.spring
DBeaver和Navicat哪个功能更强大？ java
从功能和适用场景来看，DBeaver与Navicat各有优势，具体取决于用户需求：‌1.数据库支持范围‌‌DBeaver‌：支持超过‌50种数据库‌，包括主流关系型数据库（MySQL、Oracle等）及NoSQL（Cassandra、MongoDB等）和云数据库，通过JDBC驱动扩展兼容性极强。‌Navicat‌：覆盖主流数据库（MySQL、PostgreSQL、SQLServer等）及部分云数据
java spark 操作 mongo实践哆啦A梦00 spark java spark
javaspark操作mongo实践按照官方文档配置https://docs.mongodb.com/spark-connector/master/java-api/需要说明一下，官方文档中要求引入的pom文件不全如果你是用IDEA创建的springboot项目要注意不要引入spring-boot-starter-data-mongodb下面是完整的pom引用,里面的exclusions主要是解决
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag