崔康

NoSQL性能测试白皮书

编者按

最近，bankmark公司针对目前市面上流行的NoSQ数据库SequoiaDB、Cassandra、MongoDB进行了详细的性能测试，InfoQ经授权发布中文版白皮书。

正文

1.简介

作为一项快速发展的极具创新性的IT技术，NoSQL 技术在大数据和实时网页应用中的运用在最近几年呈现了大量的增长。因为NoSQL数据库的存储允许更灵活的开发方式和执行方式，这些NoSQL数据库能够在许多的工商业应用领域很好地替代传统关系型数据库（RDBMS）。因为弱化了RDBMS的一些特征，如一致性和关系型数据模型，NoSQL技术大大提高了数据库的可扩展能力和可用性。

在这份报告中，bankmark针对一系列的基准测试实验做了报告，这些测试是为了对比SequoiaDB和现在市面上的其他一些NoSQL产品在不同的负载情境下的性能表现。因此，bankmark的测试团队使用了 Yahoo Cloud Serving Benchmark（YCSB）方案作为测试的工具。bankmark团队针对所有的系统使用了可能出现的所有配置方案，最终选择了哪些造成了较大的性能瓶颈的配置方案，在此过程中，我们参考了所有这些数据库的官方文档，和其他所有公开的技术资料。所有的主要方案我们都会在报告中详细记录，一份完全详细的报告还会包括所有的配置细节。

现在的这一份报告，bankmark着重于每款数据库在不同的用例下的性能表现，同时也保证了不同结果间的最大可比性。这些大量测试的一个目的之一就是得到这些产品最真实的性能表现。另一方面，分布式的测试环境需要一定的优化来满足数据库集群环境运行的需要。所有的被测试系统都按照集群的需求来进行配置，其中还有一些针对分区操作进行的优化，以满足结果的可比较性。

所有的测试都由bankmark团队完成，所有重要的细节包括物理环境、测试配置信息等都在测试报告中有详细的记录，我们还将一份详细版本的报告，这份报告将能确保我们进行的实验都是可重复的。

2.测试结果概述

在我们的测试中，对三款数据库产品进行了比较，SequoiaDB[1]、Cassandra[2]以及 MongoDB[3]。所有的产品都在一个10节点集群的“全内存环境”（原始数据大小为总RAM大小的1/4）或是“大部分内存环境”（原始数据大小为总RAM大小的1/2）的环境下进行安装测试。我们选用业界广泛使用的YCSB工具作为基准性能测试的平台。在所有测试中，所有的数据都进行3次复制备份，以应对容错操作。复制测试则使用了倾斜负载（Zipfian或是最新的分发版）。详细的配置将在下面展示，也会在之后的详细版报告中记录。

所有测试的结果没有显示出三款之中一个完全的最优者。

我们的“大部分内存环境”下的测试显示Cassandra 使用了最多的内存，因此也需要在多读少写负载的情况下，进行更多的磁盘I/O操作，这也导致了其严重的性能下降。在“大部分内存环境”的设定下，SequoiaDB的性能在大多数情境下都大大优于其他的产品，除了在Cassandra的强项多写少读负载。

在“全内存环境”（原始数据大小为总RAM大小的1/4）下，SequoiaDB在读请求下表现更好，而Cassandra在写请求下表现稍好。MongoDB则几乎在所有的测试情境下都垫底。

3.硬件和软件配置

这一个部分，我们将介绍这次测试中我们所使用的软件和硬件环境。这次的测试是在SequoiaDB的实验室中一个集群上进行的，所有的测试都在物理硬件上进行，没有使用任何虚拟化的层级。基本系统的搭建以及MongoDB和SequoiaDB的基本安装操作都是由训练有素的专业人员进行的。bankmark有着完全的访问集群和查看配置信息的权限。Cassandra则由bankmark来进行安装。

3.1集群硬件

所有的数据库测试都在一个10节点的集群上进行（5台 Dell PowerEdge R520 服务器，5台Dell PowerEdge R720 服务器），另外还有5台HP ProLiant BL465c刀片机作为YCSB客户端。详细硬件信息如下：

3.1.1 5x Dell PowerEdge R520 (server)

1x Intel Xeon E5-2420, 6 cores/12 threads, 1.9 GHz
47 GB RAM
6x 2 TB HDD, JBOD

3.1.2 5x Dell PowerEdge R720 (server)

1x Intel Xeon E5-2620, 6 cores/12 threads, 2.0 GHz
47 GB RAM
6x 2 TB HDD, JBOD

3.1.3 5x HP ProLiant BL465c (clients)

1x AMD Opteron 2378
4 GB RAM
300 GB logical HDD on a HP Smart Array E200i Controller, RAID 0

3.2集群软件

集群以上述的硬件为物理系统，而其中则配置了不同的软件。所有的软件实用信息以及对应的软件版本信息如下：

3.2.1 Dell PowerEdge R520 and R720 (used as server)

操作系统（OS）: Red Hat Enterprise Linux Server 6.4
架构（Architecture）: x86_64
内核（Kernel）: 2.6.32
Apache Cassandra: 2.1.2
MongoDB: 2.6.5
SequoiaDB: 1.8
YCSB: 0.1.4 master (brianfrankcooper version at Github) with bankmark changes (see 4.1)

3.2.2 HP ProLiant BL465c (used as client)

操作系统（OS）: SUSE Linux Enterprise Server 11
架构（Architecture）: x86_64
内核（Kernel）: 3.0.13
YCSB: 0.1.4 master (brianfrankcooper version at Github) with bankmark changes (see 4.1)

4.安装过程

三款数据库系统使用YCSB进行基准测试，分别是Apache Cassandra、MongoDB 以及 SequoiaDB。下来这一部分，分别介绍了这三者如何安装。集群上运行的数据库系统使用3组副本以及3组不同的磁盘。压缩性能的比较只在带有此功能的系统上进行。

4.1集群内核参数

下面的配置参数为三款数据库系统共同使用：

vm.swappiness = 0
vm.dirty_ratio = 100
vm.dirty_background_ratio = 40
vm.dirty_expire_centisecs = 3000
vm.vfs_cache_pressure = 200
vm.min_free_kbytes = 3949963

4.2 APACHE CASSANDRA

Apache Cassandra在所有服务器上都按照官方文档^[4]进行安装，其配置也按照推荐的产品配置^[5] 进行。提交的日志和数据在不同的磁盘进行存储（disk1 存储提交的日志，disk5和disk6 存储数据）。

4.3 MONGODB

MongoDB由专业的工作人员安装。为了使用三个数据磁盘以及在集群上运行复制组，我们根据官方文档有关集群安装的介绍^[6]，使用了一套复杂的方案。3个集群点上都启动了配置服务器。在十台服务器上，每台一个mongos实例（用于分区操作）也同时启动。每一个分区都被加入集群当中。为了使用所有三个集群以及三个复制备份，10个复制组的分布按照下表进行配置（列为集群节点）：

	Node1	Node2	Node3	Node4	Node5	Node6	Node7	Node8	Node9	Node10
Disk3	dg0	dg0	dg0	dg1	dg1	dg1	dg2	dg2	dg2	dg3
Disk4	dg3	dg3	dg4	dg4	dg4	dg5	dg5	dg5	dg6	dg6
Disk5	dg6	dg7	dg7	dg7	dg8	dg8	dg8	dg9	dg9	dg9

MongoDB没有提供自动启动已分区节点的机制，我们专门为了10个集群节点将手动启动的步骤写入了YCSB工具当中。

4.4 SEQUOIADB

SequoiaDB由专业的工作人员按照官方文档进行安装^[7]。安装设置按照了广泛文档中有关集群安装和配置^[8]的部分进行。SequoiaDB可以用一个统一的集群管理器启动所有的实例，内置的脚本 “sdbcm”能用来启动所有服务。三个数据库系统的节点由catalog节点进行选择。三个SequoiaDB的实例在每个节点启动，访问自己的磁盘。

4.5 YCSB

YCSB在使用中存在一些不足。它并不能很好的支持不同主机的多个YCSB实例运行的情况，也不能很好支持多核物理机上的连续运行和高OPS负载。此外，YCSB也不是很方便温服。bankmark根据这些情况，对资源库中的YCSB 0,1,14版本其做了扩展和一些修改优化。较大的改动如下：

增加了自动测试的脚本
Cassandra的jbellis驱动（https://github.com/jbellis/YCSB ）
MongoDB的achille驱动（https://github.com/achille/YCSB ）
增加批插入功能（SequoiaDB提供）
更新了MongoDB 2_12的驱动借口，同时增加了flag属性来使用批处理模式中的”无序插入“操作。
SequoiaDB驱动
针对多节点安装配置以及批量加载选项的一些改动

5.基准测试安装

如下的通用和专用参数为了基准测试而进行运行：

十台服务器（R520、R720）作为数据库系统的主机，五台刀片机作为客户端。
使用第六台刀片机作为运行控制脚本的系统
每个数据库系统将数据写入3块独立的磁盘
所有测试运行都以3作为复制备份常数

bankmark的YCSB工具，根据工作说明中的测试内容提供了负载文件：

workload1	warmup	Single load	Zipfian distribution	100% read
workload1		bulk load (1k records)	Zipfian distribution	100% read
workload2	warmup	Single load	Zipfian distribution	50% read, 50% update
workload2		bulk load (1k records)	Zipfian distribution	50% read, 50% insert
workload3	warmup	Single load	Zipfian distribution	5% read, 95% update
workload3		bulk load (1k records)	Zipfian distribution	5% read, 95% update
workload4	warmup	Single load	Zipfian distribution	95% read, 5% update
workload4		bulk load (1k records)	Zipfian distribution	95% read, 5% update
workload5	warmup	Single load	latest distribution	95% read, 5% update
workload6		bulk load (1k records)	latest distribution	95% read, 5% insert

对于数据载入，workload[1-5]-warmup或者workload[1-5]文件都可以使用，需要根据具体的需求载入类型选择。5种负载中的每一个都会被分为一个针对最终结果的负载文件和一个在真正运行测试之前运行的预热文件。为了避免和YCSB的内部访问记录控制部分冲突，预热阶段将不会进行插入操作。通过一个线程扩展的测试，我们发现每个YCSB实例将会使用64个线程对于所有的3个系统都是表现最好的。

如下是测试中用到的其他的参数：

尽可能的使用压缩功能
每个YCSB客户端的线程数：64
产生：
- 测试用例1：2亿（2000万每个节点）记录
- 测试用例2：1亿（1000万每个节点）记录
- 每条记录由键user<ID> 和十个域 Field<ID> 组成。YCSB默认的记录大小为100byte，最终的平均记录大小为1128 Bytes （10 fields + field names + key）
每个key value存储的通用基准测试步骤为：
- 启动数据库服务器
- 迭代提供的负载文件中的5个负载：
  - 运行单数据载入（无时间限制，负载文件中的 workload[1-5]-warmup）
  - 暂停30分钟给每个系统进行清空等操作
  - 运行30分钟的负载预热操作（负载文件中的 workload[1-5]-warmup）
  - 运行30分钟的负载（负载文件中的 workload[1-5]）
- 停止数据库服务器

5.1指导方针/ 步骤

所有的系统都运行一次单条载入，一次预热还有一次正式测试。对于支持批量载入的系统，MongoDB和SequoiaDB，还有一项批量载入的测试要运行。

5.2配置信息矩阵

Database Options	Cassandra	MongoDB	SequoiaDB
Nodes	10 instances (1 per node)	10 “mongos” instances (1 per node) 30 “mongod” replica instances (3 per node) 3 configuration Servers (every 3^rd node)	10 SequoiaDB instances 30 Replica instances (3 per node)
Disks	Log :disk1 Data: disk5,disk6	Replicas: disk3,disk4,disk5	Replicas: disk3,disk4,disk5
Sharding/ Replication	3replicas(on db creation)	10 shards with 3 replicas each	10 shards with 3 replicas each
Compression	Yes	No(not support)	Yes
Consistency	Read/write/scan/ delete:ONE	Read preference: nearest, Write concern: Journaled	Write concern: Journaled (not changeable)
Bulk	No	Yes(1k records per batch)	Yes(1k records per batch)

6.基准测试结果

6.1测试用例1（2亿记录/ 2000万每节点）

在此测试中，原始数据大约为总系统RAM的45%。

1.载入

2. 批量载入（1000条记录一批次）

3. 负载1，Zipfian，100%读

4. 负载2，Zipfian，50%读，50%更新

5. 负载3，Zipfian，5%读，95%更新

6. 负载4，Zipfian，95%读，5%更新

7. 负载5，最新的分布，95%读，5%插入

6.2测试用例2（1亿记录/ 1000万每节点）

在此测试中，原始数据大约为总系统RAM的22%。

1. 载入

2. 批量载入

3. 负载1，Zipfian，100%读

4. 负载2，Zipfian，50%读，50%更新

5. 负载3，Zipfian，5%读，95%更新

6. 负载4，Zipfian，95%读，5%更新

7. 负载5，最新的分布，95%读，5%插入

7.关于作者

Tilmann Rabl是多伦多大学（University of Toronto）的博士后以及bankmark公司的CEO。他的研究主要针对于大数据的基准测试以及大数据系统方面。Michael Frank是bankmark公司的CTO，他是工业标准的基准测试方案Parallel Data Generation Framework(PDGF)的核心开发成员之一。ManuelDanisch是bankmark公司的COO。他是BigBench大数据分析基准测试系统的主要开发者之一，此外他还是Transaction Processing Performance Council(TPC) 基准测试 TPC-DI的数据贡献者。

bankmark是一家独立的基准测评机构，公司为大数据提供了革命性的基准测试方案。受创新技术的推动，bankmark产生了许多优秀而有质量的测试，同时还对很多概念系统进行了验证并成功的将这些概念系统进行生产力模拟以及成本模拟。以前沿科学研究为基础的技术，保证了史无前例的质量和速度。

bankmark是工业基准测试标准化协会SPEC和TPC的独立成员之一，他们的技术基于TPC-DI和BigBench等基准测试标准。

8.参考资料

[1] http://www.sequoiadb.com/
[2] http://cassandra.apache.org/
[3] http://www.mongodb.org/
[4] http://www.datastax.com/documentation/cassandra/2.1/cassandra/install/installRHEL_t.html
[5] http://www.datastax.com/documentation/cassandra/2.1/cassandra/install/installRecommendSettings.html
[6] http://docs.mongodb.org/manual/tutorial/deploy-shard-cluster/
[7] http://www.sequoiadb.com/en/document/1.8/installation/server_installation/topics/linux_en.html
[8] http://www.sequoiadb.com/en/document/1.8/installation/configuration_start/topics/cluster_en.html

测试报告原文：

http://msrg.utoronto.ca/papers/NoSQLBenchmark
http://www.bankmark.de/wp-content/uploads/2014/12/bankmark-20141201-WP-NoSQLBenchmark.pdf

Pktgen-DPDK：开源网络测试工具的深度解析与应用艾古力斯
本文还有配套的精品资源，点击获取简介：Pktgen-DPDK是基于DPDK的高性能流量生成工具，适用于网络性能测试、硬件验证及协议栈开发。它支持多种网络协议，能够模拟高吞吐量的数据包发送。本项目通过利用DPDK的高速数据包处理能力，允许用户自定义数据包内容，并实现高效的数据包管理与传输。文章将指导如何安装DPDK、编译Pktgen、配置工具以及使用方法，最终帮助开发者和网络管理员深入理解并优化网络
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
零基础学习性能测试第八章：高并发-redis缓存架构介绍试着性能测试缓存学习 redis 性能测试零基础
目录一、Redis在高并发中的核心价值二、Redis核心架构模式▶1.缓存穿透防御架构▶2.热点数据多级缓存三、Redis集群高可用方案▶1.RedisCluster分片架构▶2.读写分离方案四、Redis性能压测实战▶1.基准测试工具▶2.关键性能指标五、典型瓶颈分析与优化案例1：缓存雪崩案例2：热Key阻塞六、电商秒杀实战架构七、必须掌握的进阶技巧八、学习路径与工具推荐以下是为零基础学习者设计
高铁站违规撑伞识别误检率↓79%：陌讯多模态融合算法实战解析 2501_92722744 算法人工智能目标检测计算机视觉目标跟踪
原创声明本文为原创技术解析，核心技术参数与架构参考自《陌讯技术白皮书》，禁止未经授权的转载与改编。一、行业痛点：密集场景下的违规撑伞识别难题在高铁站、地铁站等交通枢纽，违规撑伞（如非雨天在站台、通道内持伞）可能引发客流拥堵、设备刮擦等安全隐患。然而，传统视觉识别方案面临三大核心挑战：环境干扰大：进出站口光线突变（正午强光/夜间弱光）导致伞面特征提取不稳定，某枢纽站点实测数据显示，阴雨天违规撑伞识别
建筑施工场景下漏检率↓76%！陌讯多模态融合算法在工程安全监控的落地实践 2501_92722744 大数据算法目标跟踪人工智能计算机视觉目标检测
原创声明本文为原创技术解析，核心技术参数与架构设计引用自《陌讯技术白皮书》，转载请注明来源。一、行业痛点：建筑施工监控的技术瓶颈建筑施工场景的安全监控长期面临多重技术挑战：数据支撑：据《2023建筑施工安全自动化监控报告》显示，传统监控系统对“未佩戴安全帽”“高空抛物”等危险行为的漏检率超35%，误报率高达42%，导致安全事故响应滞后[7]。场景难点：工地存在强光直射（正午阳光）、动态遮挡（塔吊/
还款流程设计测试用例 lifewange 测试用例
设计还款流程的测试用例时，需覆盖正常还款、异常还款、部分还款、提前还款、逾期还款等场景，并验证系统处理、账务核对、通知提醒、风控拦截等功能。以下是详细的测试用例设计思路和示例：一、核心测试维度测试类型关键验证点功能测试还款金额计算、账务更新、状态变更、通知触发异常测试失败还款（余额不足、账户异常）、重复还款、非法操作合规测试利息/违约金计算是否符合监管要求（如年化利率上限）性能测试批量还款时系统并
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
零基础学习性能测试第六章：性能难点-Jmeter实现海量用户压测
目录一、海量压测核心挑战与解决思路二、分布式压测集群搭建（百倍性能提升）1.架构设计2.实战步骤三、百万级用户参数化方案1.Redis预生成测试数据2.JMeter分段读取（避免内存溢出）3.CSV分片策略四、高并发优化配置模板1.`jmeter.properties`关键修改2.线程组配置技巧五、结果收集与监控方案1.轻量级结果存储2.实时监控看板六、海量压测实战案例：双11级流量模拟测试目标：
百思可瑞教育告诉您职场情绪管理不及格？3步学会非暴力沟通北京百思可瑞教育北京百思可瑞教育北京百思可瑞教育咨询有限公司百思可瑞教育职场和发展百思可瑞教育北京百思可瑞教育心理咨询师
引言：当情绪成为职场隐形成本在竞争激烈的职场中，情绪管理能力已成为衡量职业成熟度的重要标尺。某权威机构发布的《2025职场情绪管理白皮书》显示，85.7%的职场人曾因情绪失控做出非理性行为，其中30%导致项目延期或人际破裂。这些数据背后，藏着被忽视的真相：情绪不是敌人，而是未被解码的需求信号。本文将结合非暴力沟通（NVC）创始人马歇尔·卢森堡的经典理论，拆解职场情绪管理的三步法则，助你实现从"情绪
redis性能测试报告结果无级程序员数据库大数据 redis 性能
redis性能测试1.环境配置：2.测试准备：2.1每服务器一个Redis的结果：2.2每服务器两个Redis的结果：3.结论：由于项目需要，要查询一个数量巨大的键值对，数据量大约6亿。先是在内存中用hashmap，虽然速度很快，但数据量不到1亿就直接死机了，而且无法持久，每次重新加载，也不合理。于是就想到了redis。测试方法：1.环境配置：主机配置：机器用途配置数量Redis服务器XeonE5
LoaRunner性能测试系统学习教程：SQL Server等待类型 82a7fe2508f4
上期我们讲到LoadRunner性能测CPU瓶颈，这期我们讲LoadRunner性能测试SQLserver等待类型。SQLServer等待类型通常可能更多的去监控每个查询执行步骤所消耗的时间，但其实这些还不够，因为每个执行计划在执行前可能需要等待，而这些等待的时间是被消耗了，没有任何作用，所以如果能缩短等待时间显然可以提高SQLServer的性能。SQL等待类型SQLServer通过SQLOS（S
零基础学习性能测试第九章：全链路追踪-项目实操试着性能测试学习性能测试零基础
目录一、实战项目架构（电商下单系统）二、环境搭建（30分钟）1.使用DockerCompose一键部署2.启动命令三、项目集成SkyWalking1.SpringBoot项目添加Agent2.关键业务代码埋点四、全链路压测实战1.JMeter压测脚本配置2.执行压测命令五、全链路追踪分析实战1.在SkyWalking中定位瓶颈2.真实瓶颈分析案例六、中间件性能分析1.Redis性能分析2.MySQ
零基础学习性能测试第九章：全链路追踪-系统中间件节点监控试着性能测试学习中间件性能测试零基础
目录一、为什么需要监控中间件节点？二、主流中间件监控方案1.监控体系架构2.监控工具矩阵三、环境搭建实战1.部署Prometheus2.部署Grafana四、中间件监控配置实战1.Nginx监控2.Redis监控3.Kafka监控4.MySQL监控五、全链路追踪中的中间件监控1.SkyWalking与Prometheus集成2.全链路视角的中间件监控六、性能瓶颈定位实战1.瓶颈分析流程图2.典型瓶
linux电源管理——C-state,P-state,turbo Xu_297c
最近在进行网络性能测试的时候进程会遇到系统C-state，P-state以及turbo的相关设置，虽然知道都是和CPU功耗有关，但具体有什么联系以及对当前进程的影响并不是很清楚，于是查了一下相关资料做一个总结记录。首先C-state和P-state是完全不同的概念和维度，官方解释是“C-statesareidlestatesandP-statesareoperationalstates”。，此外C
python性能检测工具函数运行内存及运行时间程序员Baby~ python 软件测试程序员接口测试自动化测试测试工程师
前言：python虽然是一门'慢语言'，但是也有着比较多的性能检测工具来帮助我们优化程序的运行效率。这里总结了五个比较好的python性能检测工具，包括内存使用、运行时间、执行次数等方面。首先，来编写一个基础的python函数用于在后面的各种性能测试。123defbase_func():forninrange(10000):print('当前n的值是：{}'.format(n))1、memory_
打电话识别误报率↓82%：陌讯轻量化部署算法实战解析 2501_92474790 人工智能算法智慧城市计算机视觉目标检测目标跟踪
原创声明：本文内容基于独立技术解析，部分数据引用自“陌讯技术白皮书”，严禁未经授权转载。摘要：针对边缘计算优化和复杂场景鲁棒性挑战，本文解析陌讯视觉算法在打电话识别中的轻量化部署方案。实测显示，该方案在误报率指标上较基线提升显著，适用于安防监控等场景。一、行业痛点打电话识别在安防监控中面临严峻挑战。行业报告显示，公共场所有效行为识别误报率超35%（来源：2024年《智能安防白皮书》）。具体难点包括
电线杆鸟巢识别误报率↓72%：陌讯多模态融合算法实战解析 2501_92474779 算法人工智能目标跟踪计算机视觉机器学习
原创声明本文为原创技术解析文章，核心技术参数与架构描述参考自《陌讯技术白皮书》，转载请注明来源。一、行业痛点：电线杆鸟巢识别的现实挑战电力巡检领域中，电线杆鸟巢被列为重要安全隐患之一。据电力行业运维报告显示，传统机器视觉系统在该场景下存在三大核心问题：复杂背景干扰：鸟巢与枯枝、塑料杂物的视觉特征高度相似，导致误报率超35%环境适应性差：逆光、阴雨等天气下识别准确率骤降40%以上边缘部署瓶颈：变电站
驾乘场景下漏检率↓76%！陌讯动态特征融合算法在安全带穿戴识别中的实战优化 2501_92474779 人工智能目标跟踪计算机视觉算法目标检测
原创声明本文为原创技术解析，核心技术参数与架构设计引用自《陌讯技术白皮书》，禁止未经授权的转载与篡改。一、行业痛点：安全带穿戴识别的现实挑战据交通部2023年道路运输安全报告显示，货运车辆与网约车的安全带穿戴识别场景中，传统算法存在三大核心问题：复杂光照干扰：逆光场景下（如清晨/傍晚行车），安全带特征被强光淹没，误报率高达52%；动态遮挡难题：驾驶员衣物（如外套、背包）覆盖安全带时，漏检率常超35
岸边垃圾识别准确率↑32%：陌讯多模态融合算法实战解析 2501_92474745 深度学习人工智能算法目标检测计算机视觉视觉检测
原创声明本文为原创技术解析，核心技术参数与架构设计引用自《陌讯技术白皮书》，转载请注明来源。一、行业痛点：岸边垃圾识别的三大技术瓶颈岸边垃圾监测是水环境治理的重要环节，但传统视觉方案始终面临难以突破的技术壁垒：复杂背景干扰：岸边植被、岩石、水面反光等与垃圾目标特征高度相似，某环保机构报告显示，传统模型误将水草识别为塑料袋的概率超35%；动态环境鲁棒性不足：早晚光照差异（逆光场景亮度差可达2000l
动态客流分析新突破！陌讯多模态融合算法在智慧零售的落地优化
原创声明：本文技术方案解析基于陌讯视觉算法技术白皮书V3.2版本一、行业痛点：零售场景的精准感知困境据麦肯锡《2024零售数字化报告》显示，传统客流统计方案在复杂场景下存在显著瓶颈：误检率超35%：镜面反射、密集遮挡导致的顾客计数偏差（如图1）动态追踪失效：购物车/儿童跟随场景ID切换频率高达2.3次/秒[7]graphLRA[强反光地板]-->B[特征点丢失]C[亲子群体粘连]-->D[ID分配
强干扰下误报率↓85%！陌讯动态感知算法在工业消防的实战解析 2501_92473287 算法目标检测计算机视觉深度学习人工智能
摘要：针对工业场景明火烟雾检测的边缘计算优化，实测显示陌讯动态感知算法在强干扰环境下较基线模型误报率↓85%，[email protected]达87.6%。一、行业痛点：工业消防的监测困境据《工业安全监测白皮书2025》统计，石化厂区因蒸汽干扰导致的火灾误报率高达38.7%[7]。核心挑战包括：光学干扰：高温蒸汽与金属反光产生伪烟雾特征形态多变：明火在通风环境下呈现非稳态扩散实时性要求：响应延迟>200ms将导致连
AI营销从探索到落地：2025 企业增长的新转折点 JasmineChzI 人工智能营销内容运营
引言：2025，为什么AI营销变得更迫切？进入2025年，企业普遍面临市场增长疲软、营销预算紧缩等现实压力。与此同时，数字营销环境却愈加复杂，用户触点日益碎片化，内容生产需求呈指数级上升。于是一个问题摆在了所有营销人面前：“面对增长焦虑，如何更快、更准、更低成本地触达目标用户？”答案越来越清晰：AI营销正在成为解决内容与效率困境的现实方案。根据《2025年AI营销趋势白皮书》数据显示，全球超过70
零基础学习性能测试第五章：JVM性能分析与调优-多线程检测与瓶颈分析试着性能测试学习 jvm 零基础性能测试
目录**一、多线程性能问题典型症状****二、核心分析工具链****1.基础诊断命令****2.高级可视化工具****三、多线程瓶颈四步分析法****步骤1：定位高负载线程****步骤2：分析线程阻塞原因****步骤3：锁竞争分析****步骤4：并发数据结构分析****四、高频瓶颈场景与调优方案****场景1：锁竞争激烈****场景2：线程池配置不当****场景3：ThreadLocal内存泄漏*
零基础学习性能测试第五章：JVM性能分析与调优-多线程机制与运行原理试着性能测试学习 jvm 零基础性能测试
目录一、JVM线程模型全景图二、线程生命周期与状态转换三、线程调度核心机制1.**协作式vs抢占式**2.**优先级调度**3.**上下文切换代价**四、JVM线程实现关键结构1.**线程栈（StackFrame）**2.**栈帧组成**五、多线程性能瓶颈分析1.**锁竞争（LockContention）**2.**上下文切换风暴**3.**伪共享（FalseSharing）**六、线程池运行原理
MySql数据库基础
数据库相关概念•数据库是按数据结构组织、存储和管理数据的仓库，本质是文件系统；数据库管理系统是操纵和管理数据库的大型软件，用户和管理员通过它访问和维护数据库。•介绍了关系型数据库管理系统（如MySQL、Oracle等）和NoSQL数据库（如Redis、MongoDB等），前者基于关系模型用表格存储数据，后者非关系型，有键值、列族等多种类型。MySQL简介与安装配置•MySQL是开源的关系型数据库管
MYSQL 知识点总结代码o>_ mysql 数据库 nosql
第一章MYSQL基础数据库（database）是一个按照结构来组织存储和管理数据的仓库一般由软件，数据库和管理员组成。数据模型：数据库由层次，网状，关系，面向对象，NOSQL五个模型组成数据库系统：一般由软件,数据库和管理员组成。当前主流的数据库：MySQL，Oracle，SQLServer，PostgreSQL，MongoDB,Redis当前使用较多是MySQL，版本为5.7MySQL的特点：运
Hbase简介三五a hbase 数据库大数据
一.非关系型数据库：1.1介绍：非关系型数据库（NoSQLDatabase）是相对于传统关系型数据库而言的一类新型数据库技术，其设计目的是解决大规模数据存储、高并发访问、灵活数据结构等场景下的问题。与关系型数据库（如MySQL、Oracle）依赖固定表结构和SQL查询不同，非关系型数据库通常采用更灵活的数据模型，且不强制遵循ACID（原子性、一致性、隔离性、持久性）事务特性的严格约束。1.2分类：
零基础学习性能测试第三章：jmeter构建性能业务场景
目录**一、性能场景构建核心四要素****二、四步构建电商性能场景（含截图级配置）****场景需求**：模拟100用户并发操作，其中：**步骤1：创建基础结构****步骤2：设置用户比例（吞吐量控制器）****步骤3：添加操作间隔（高斯随机定时器）****步骤4：参数化关键数据（CSV驱动）****三、增强场景真实性的关键技巧****1.处理动态Token（关联提取）****2.模拟热点数据（80
零基础学习性能测试第四章：从0到1学会编写性能测试报告试着性能测试学习零基础性能测试 jmeter
目录核心知识体系与实战路径第一阶段：筑基篇-理解核心概念(零基础入门)第二阶段：工具篇-选择并学习工具(推荐JMeter)第三阶段：实战篇-设计、执行、分析与调优第四阶段：报告篇-编写性能测试报告给初学者的关键建议推荐学习资源性能测试能力在软件行业越来越重要。别担心零基础的问题，我会带你一步步拆解这个看似复杂的过程，就像组装乐高积木一样，从最基础的模块开始，最终完成一份专业的性能测试报告。核心知识
JMeter测试入门到实践：构建高性能应用的必备指南
在当今快速迭代的软件开发中，性能测试是确保应用稳定性和用户体验的关键环节。ApacheJMeter作为一款开源的性能测试工具，凭借其灵活性和强大的功能，成为开发者和测试工程师的首选工具之一。本文将从基础概念到实战技巧，带你全面掌握JMeter的使用方法。一、JMeter是什么？为什么选择它？JMeter是一款基于Java的开源工具，最初设计用于Web应用测试，现已扩展支持多种协议（HTTP、FTP
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

NoSQL性能测试白皮书

1.简介

2.测试结果概述

3.硬件和软件配置

3.1集群硬件

3.1.1 5x Dell PowerEdge R520 (server)

3.1.2 5x Dell PowerEdge R720 (server)

3.1.3 5x HP ProLiant BL465c (clients)

3.2集群软件

3.2.1 Dell PowerEdge R520 and R720 (used as server)

3.2.2 HP ProLiant BL465c (used as client)

4.安装过程

4.1集群内核参数

4.2 APACHE CASSANDRA

4.3 MONGODB

4.4 SEQUOIADB

4.5 YCSB

5.基准测试安装

5.1指导方针/ 步骤

5.2配置信息矩阵

6.基准测试结果

6.1测试用例1（2亿记录/ 2000万每节点）

1.载入

2. 批量载入（1000条记录一批次）

3. 负载1，Zipfian，100%读

4. 负载2，Zipfian，50%读，50%更新

5. 负载3，Zipfian，5%读，95%更新

6. 负载4，Zipfian，95%读，5%更新

7. 负载5，最新的分布，95%读，5%插入

6.2测试用例2（1亿记录/ 1000万每节点）

1. 载入

2. 批量载入

3. 负载1，Zipfian，100%读

4. 负载2，Zipfian，50%读，50%更新

5. 负载3，Zipfian，5%读，95%更新

6. 负载4，Zipfian，95%读，5%更新

7. 负载5，最新的分布，95%读，5%插入

7.关于作者

8.参考资料

你可能感兴趣的:(NoSQL性能测试白皮书)