海边的Ivan

NoSQL性能测试工具YCSB-Running a Workload

写在前面

目前，在系统设计中引入了越来越多的NoSQL产品，例如Redis/ MongoDB/ HBase等，其中性能指标往往会成为权衡不同NoSQL产品的关键因素。对这些产品在性能表现和产品选择上的争论，Ivan碰到不止一次。虽然通过对系统架构原理方面的分析可以大致判断出其在不同读写场景下的表现，但一是对受众有较高的要求，也来的不那么直接。这时候，没有什么比一次性能测试更有说服力。有什么好的性能测试工具呢？这就是今天的主角YCSB。YCSB是Yahoo开源的一套分布式性能测试工具，方便易用，拓展性强。Ivan最近研究HBase二级索引时用它来做性能测试，感觉还是非常顺手的。虽然网上已经有很多YCSB的介绍文章，但用来指导实际操作还是有些不便。Ivan会用两三篇文章来介绍一下YCSB的实际使用。本文是官方文章的译文，选择这篇文章是因为其与具体操作的关系比较紧密，感兴趣的同学可以了解一下。

原文地址：https://github.com/brianfrankcooper/YCSB/wiki/Running-a-Workload

正文

运行workload有六个步骤

安装待测试的数据库系统
选择适当的DB接口层
选择适当的工作负载
选择适当的运行参数（客户端线程数量，目标吞吐等）
加载数据
执行工作负载（workload）

这些步骤描述都假定你运行一个单客户端。这可以满足中小规模集群（10台左右）的测试需要。对于更大规模的集群，你必须在不同的服务器上运行多个客户端来生成足够的负载。类似地，在某些场景下，多客户机加载数据库可能更快。多客户端并行运行的更多细节，可以查看Running a Workload in Parallel

Setp 1.安装待测试的数据库

第一步是安装你希望测试的数据库。可能是单机或者集群，依赖于你要测试的配置。
你必须create 或 set up tables/keyspaces/storage buckkets用于存储记录。这些细节对于每个数据库都不同，依赖于希望运行的负载情况。在YCSB客户端运行前，数据表必须被创建，因为客户端自身是不会请求创建数据库表的。这是因为对于某些系统创建表一个手工操作，而对于其他系统，表必须在集群启动前被创建。
workload所依赖的table必须被创建。对于核心负载，YCSB客户端将假定存在一个名为'usertable'的table，且具有灵活的schema：运行时可以根据需要增加列。'usertable'可以被映射为适当的存储容器。例如，在MySQL中，你可以create table，在Cassandra你可以在配置中定义keyspace。数据库接口层（Step 2描述）会收到读写usertable的请求，将其转换为你所指定的实际存储的请求。这意味着你必须提供数据库接口层帮助它理解下层存储的结构。例如，在Cassandra中，你必须定义在keyspace中定义列族column families。这样，必须创建一个列族并命名（例如，你可以使用values）。然后，数据库访问层需要理解指向values列族，或者将字符串“values”设置为一个属性，或者在数据库接口层中硬编码。

Step 2. 选择适当的数据库接口层

数据库接口层是一个可执行的java类，实现read、write、update、delete和scan调用，它由YCSB客户端生成，调用你的数据库API。这个类是com.yahoo.ycsb包下抽象类DB的子类。在运行YCSB客户端时，你要通过命令行指定类名，客户端会动态加载你的接口类。命令行中指定的任何属性或指定的参数文件，将会传递给数据库接口层实例，用于配置该层（例如，告诉它你要测试的数据库主机名hostname）

YCSB客户端自带一个简单的虚拟接口层，com.yahoo.ycsb.BasicDB。这层会把执行的操作通过System.out打印。这可以用于确认客户端在正常运行，用于debug 你的workload。

如何使用YCSB客户端的细节可以查看 Using the Database Libraries。更多实现数据库接口层的细节，可以查看 Adding a Database

你可以使用YCSB命令，直接运行数据库命令。客户端使用DB接口层发送命令给数据库。你可以使用客户端确定DB层运行正常，你的数据库正确安装，DB层可以连接到数据库等等。它为大量的数据库提供了命令行接口，可以用于检验数据库的数据。运行命令行：

$ ./bin/ycsb shell basic
help
Commands:
  read key [field1 field2 ...] - Read a record
  scan key recordcount [field1 field2 ...] - Scan starting at key
  insert key name1=value1 [name2=value2 ...] - Insert a new record
  update key name1=value1 [name2=value2 ...] - Update a record
  delete key - Delete a record
  table [tablename] - Get or [set] the name of the table
  quit - Quit

Step 3 选择适当的工作负载

工作负载定义了在loading阶段将被加载进数据库的数据，在transaction阶段在数据集上执行的操作。
典型的工作负载包括以下内容：

Workload java class（com.yahoo.ycsb.Workload的子类）
Parameter file（Java Properties格式）

因为数据集的参数属性必须在两个阶段被获得，在loading阶段用于构造和插入适当类型的记录，在transaction阶段用于指定正确的记录id和field，所以参数文件在两个阶段都会使用。workload java class使用这些属性插入记录（loading phase）或操作那些记录（transaction phase）。选择哪个阶段要看你运行YCSB命令行时指定的参数。

在运行YCSB客户端的命令行时，你可以指定java class和参数文件。客户端将动态加载你的workload class，从参数文件解析参数（和任何命令行的附加参数）并执行workload。在loading和transaction两个阶段，需要同样的属性和workload逻辑应用。例如，如果loading阶段创建10个field的记录，而后在transaction阶段必须知道有10个field可以被查询和修改。

YCSB自带的CoreWorkload 是标准workload包可以直接使用。CoreWorkload定义了简单的read/insert/update/scan操作组合。在参数文件中定义了每种操作的相应频率，以及其他workload属性。这样，修改参数文件可以执行不同的workload。更多CoreWorkload的细节，可以查看Core Workloads

如果CoreWorkload不能满足你的需求，你可以基于com.yahoo.ycsb.Workload定义自己的workload子类。细节可以查看 Implementing New Workloads

Step 4 选择适当的运行参数

虽然workload class和参数文件定义了具体的workload，还有一些在运行特定测试时，你可能希望指定附加的设置。这些设置可以通过YCSB客户端命令行实现。设置包括

-threads: 客户端线程数量。默认，YCSB客户端使用一个worker线程，但可以指定。这通常用来根据数据库增加负载数量。
-target:每秒操作目标数量。默认，YCSB客户端会尝试尽可能多的操作。例如，每个操作平均花费100ms,客户端将在每个线程中每秒执行10个操作。然而，你可以限流每秒操作的数量。例如，产生一个延迟与吞吐量的曲线，你可以尝试不同的目标吞吐量，衡量每次产生的延迟。
-s :status. 对于一个长时间运行的workload，它是有用的，可以获得客户端状态报告，判断他是否崩溃并给你一些过程中的信息。通过命令行指定"-s"，客户端可以每10秒报告状态到stderr。

Step 5. 加载数据

Workload有两个执行阶段：loading阶段（定义待插入的数据）和transaction阶段（定义数据集上的操作）。为了加载数据，你要运行YCSB客户端并告诉它执行loading阶段。
例如，考虑workload A的benchmark（更多标准workloads细节在Core Workloads）。加载标准数据集

$ ./bin/ycsb load basic -P workloads/workloada

这个命令的关注点

load 参数告诉客户端执行loading 阶段
basic 参数告诉客户端使用BasicDB层。你可以在参数文件中指定这个属性，使用'db'属性（例如db=com.yahoo.ycsb.BasicDB）
-P参数用来加载property文件。这个例子中，我们用来加载workload参数文件。

加载HBase数据集：

$ ./bin/ycsb load hbase -P workloads/workloada -p columnfamily=family

这个命令的关注点

load 参数是告诉Client执行loading阶段操作。
hbase 参数是告诉Client使用HBase layer
-P 参数是用来加载参数文件，例子中我们用来加载workload参数文件
-p 参数用于设置参数，在这个HBase例子中，我们用来设置数据库的列。你数据库中存在usertable带有family列，以执行这个命令。而后所有数据被加载到数据库 usertable 带有family列。
执行命令前，确定你已经启动了 Hadoop和 HBase

如果你使用BasicDB，你将看到数据库的insert语句。如果是你用一个实际的DB接口层，记录会被加载到数据库中。

标准workload参数文件创建很小的数据库，例如，workload仅创建1000条记录。这用于调试你的安装。然而，运行一个实际的benchmark你需要创建一个更大的数据库。例如，想象你需要加载100百万记录。然后，你需要修改workload文件中默认的“recordcount”属性。有两个办法实现。

指定一个新的属性文件，包含recordcount的新值。在命令行中，如果这个文件在workload文件后被指定，它会覆盖workload的任何属性。例如创建"large.dat"文件，仅有一行内容

recordcount=100000000

然后，client执行以下内容

$ ./bin/ycsb load basic -P workloads/workloada -P large.dat

Client会加载所有的属性文件，但使用最后加载的一个文件large.dat中的recordcount值，

通过命令行指定recordcount属性的新值。在命令行指定的任何属性都会覆盖配置文件中的属性。如下执行

$ ./bin/ycsb load basic -P workloads/workloada -p recordcount=100000000

一般来说，好的实践是在新的参数文件中存储任何重要的参数，代替通过命令行指定它们。这使得你的benchmark结果可以被复现。不用必须重建你使用的命令行，你重用参数文件即可。注意，当它开始执行时，YCSB Client会打印处他的命令行，所以如果你将Client的输出存储到一个数据文件，你可以很容易重新执行命令行。
因为一个大数据库加载需要很长时间，你可能希望1.需要Client输出状态，2.直接将输出写入数据文件。这样，你可以执行以下命令加载数据库。

$ ./bin/ycsb load basic -P workloads/workloada -P large.dat -s > load.dat

-s 参数将要求Client向stderr输出状态报告。这样命令行的输出可能是这样

$ ./bin/ycsb load basic -P workloads/workloada -P large.dat -s > load.dat
Loading workload... (might take a few minutes in some cases for large data sets)
Starting test.
0 sec: 0 operations
10 sec: 61731 operations; 6170.6317473010795 operations/sec
20 sec: 129054 operations; 6450.76477056883 operations/sec
...

这个状态输出会帮助你看到加载操作执行得多快（这样你可以估计加载的完成时间），确认load正在执行。当load完成时，Client会报告load的性能统计数据。这些统计与transaction阶段一样，所以看后续介绍

Step 6 执行workload

一旦数据被加载，你就可以执行workload。告诉Client执行transaction操作。执行workload，可以使用以下命令

$ ./bin/ycsb run basic -P workloads/workloada -P large.dat -s > transactions.dat

主要差别是我们使用run参数时，告诉Client执行transaction阶段而不是loading阶段。如果你使用BasicDB，检查结果文件 transactions.dat，你会看到一个read和update混合的请求，与统计数据一致。

典型情况下，你会希望使用 -threads 和 -target 参数控制负荷量。例如，你可能希望10个线程每秒总数100个操作。平均操作延时不高于100ms，每个线程能够携带每秒10此操作。一般来说，你需要足够的线程因为没有线程尝试每秒更多的操作，否则你达到的吞吐量将小于指定的目标吞吐量。
这个例子，我们可以执行

$ ./bin/ycsb run basic -P workloads/workloada -P large.dat -s -threads 10 -target 100 > transactions.dat

注意这个例子，我们使用 -threads 10 命令参数指定10个线程， -target 100 命令参数指定每秒100次操作。否则，两个值可以设置在你的参数文件中，使用threadcount 和 target 属性代替。例如

threadcount=10
target=100

run的结尾，Client会向stdout报告性能统计数据。上面的例子，统计数据会写入transaction.dat文件。默认包括每个操作类型延时的average,min,max,95th,99th。每次操作返回代码的统计，每类操作的直方图。返回值被你的DB接口层定义，允许你看到workload过程中的任何错误。上述例子中，我们可以得到输出：

[OVERALL],RunTime(ms), 10110
[OVERALL],Throughput(ops/sec), 98.91196834817013
[UPDATE], Operations, 491
[UPDATE], AverageLatency(ms), 0.054989816700611
[UPDATE], MinLatency(ms), 0
[UPDATE], MaxLatency(ms), 1
[UPDATE], 95thPercentileLatency(ms), 1
[UPDATE], 99thPercentileLatency(ms), 1
[UPDATE], Return=0, 491
[UPDATE], 0, 464
[UPDATE], 1, 27
[UPDATE], 2, 0
[UPDATE], 3, 0
[UPDATE], 4, 0
...

这个输出指标

总体执行时间为10.11秒
平均吞吐量98.9 ops（所有线程）
491次修改操作，附带average,min,max,95th,99th %延迟情况
所有491次修改操作都返回0（成功）
464次操作在1ms内完成，27次在1至2ms内完成。

读操作有与之接近的统计数值

延时信息的直方图通常是有用的，时序图的形式有时更有用。请求一个时序，需要在Client命令行或在属性文件指定"measureenttype=timeseries"属性。默认情况下，Client会每间隔1000ms，报告一次平均延时。你可以对报告指定不同的间隔粒度，使用 timeseries.granularity属性，例如。

$ ./bin/ycsb run basic -P workloads/workloada -P large.dat -s -threads 10 -target 100 -p \measurementtype=timeseries -p timeseries.granularity=2000 > transactions.dat

将会报告一个时序，间隔2000ms读一次，结果将是。

[OVERALL],RunTime(ms), 10077
[OVERALL],Throughput(ops/sec), 9923.58836955443
[UPDATE], Operations, 50396
[UPDATE], AverageLatency(ms), 0.04339630129375347
[UPDATE], MinLatency(ms), 0
[UPDATE], MaxLatency(ms), 338
[UPDATE], Return=0, 50396
[UPDATE], 0, 0.10264765784114054
[UPDATE], 2000, 0.026989343690867442
[UPDATE], 4000, 0.0352882703777336
[UPDATE], 6000, 0.004238958990536277
[UPDATE], 8000, 0.052813085033008175
[UPDATE], 10000, 0.0
[READ], Operations, 49604
[READ], AverageLatency(ms), 0.038242883638416256
[READ], MinLatency(ms), 0
[READ], MaxLatency(ms), 230
[READ], Return=0, 49604
[READ], 0, 0.08997245741099663
[READ], 2000, 0.02207505518763797
[READ], 4000, 0.03188493260913297
[READ], 6000, 0.004869141813755326
[READ], 8000, 0.04355329949238579
[READ], 10000, 0.005405405405405406

这个输出分开显示了update和read操作的时间序列，每2000ms的数据。数据报告的时点是仅包括前一个2000ms的均值。（这个例子，我们做了100,000次操作，目标是每秒10,000次操作）。一个关于延时度量的关注点：Client度量，特定操作对数据库的端到端的执行延时。那样，它在调用DB接口层class适当方法前会启动启动一个时钟，方法返回时会停止时钟。延时包括：执行包括接口层，到数据库服务器的网络延迟，数据库的执行时间。不包括用于控制吞吐量的延迟。就是说，如果你指定目标是每秒10次操作（单线程）Client会在每100ms仅执行1次操作。如果操作耗费了12ms，Client会在下一次操作前额外等待88ms。然而，报告延时不会包括这个等待时间，报告会显示延迟是12ms而不是100.

MongoDB框架零基础入门码农研究僧 Python 100天精通全栈 mongodb nosql 数据库
目录前言1.安装配置2.关启配置3.基本概念4.基本操作4.1创建集合4.2删除集合4.3插入文档4.4更新文档4.5删除文档4.6查询文档前言先科普讲解一下NoSQL（notonlysql）本身NoSQL非关系型数据库就具备了ACID（原子性、一致性、持久性、隔离性）数据持久化一般还是要使用关系型数据库，内存的数据库使用检索MongoDB是C++编写，一个基于分布式文件存储的开源数据库系统。将其
MongoDB 高性能应用场景与实践 AI自闭实验者 mongodb 数据库
```htmlMongoDB高性能应用场景与实践MongoDB高性能应用场景与实践随着大数据时代的到来，数据库作为数据存储和管理的核心工具，其性能和可扩展性显得尤为重要。在众多的数据库解决方案中，MongoDB凭借其灵活的数据模型、高性能和易于扩展的特点，在许多场景下成为开发者的首选。什么是MongoDB？MongoDB是一个开源的、面向文档的NoSQL数据库管理系统。它以JSON样式的文档存储数
NoSQL 之 Redis 配置与优化天空之城夢主 nosql redis 数据库
这里写目录标题Redis介绍关系数据库与非关系型数据库关系型数据库非关系型数据库非关系型数据库产关系型数据库已经诞生很久了，而且一直在使用。面对这样的情况，为什么还会产生NoSQL?那么，下面就来介绍一下NoSQL产生的背景。Highperformance--对数据库高并发读写需求HugeStorage--对海量数据高效存储与访问需求HighScalability&&HighAvailabilit
MongoDB入门指南：从零开始掌握NoSQL数据库辗转.953 mongodb nosql 数据库
目录一、MongoDB简介（一）什么是MongoDB？（二）MongoDB的特点（三）MongoDB的应用场景二、安装MongoDB（一）安装MongoDBServer1.Windows安装2.Linux安装（以Ubuntu为例）3.macOS安装（使用Homebrew）（二）安装MongoDB客户端安装MongoDBCompass三、MongoDB基本概念（一）数据库（Database）（二）集
No Sql之 Redis配置与优化牛爷爷敲代码 sql redis 数据库
NoSql之Redis配置与优化Redis核心技术笔记一、基础概念定义Redis（RemoteDictionaryServer）是开源的内存键值对数据库，支持多种数据结构（字符串、哈希、列表、集合、有序集合等）。特性：高性能（单线程+多路复用）、持久化、集群、发布订阅。典型应用场景缓存：热点数据加速查询（如电商商品详情页缓存）。计数器：点赞数、访问量（原子性INCR操作）。消息队列：基于LPUSH
NoSQL保障MongoDB数据库副本集和MongoDB副本集操作覃炳文20230322027 数据库 nosql mongodb
MongoDB是一个基于文档的NoSQL数据库，它支持多种数据存储模型，包括副本集（ReplicaSets）。副本集是MongoDB的一种高可用性和数据冗余机制，它由一组MongoDB实例组成，其中包含一个主节点（Primary）和多个从节点（Secondary）。副本集的主要目的是提供数据的冗余和高可用性，确保在主节点发生故障时，从节点可以接管服务。NoSQL保障通常指的是非关系型数据库（如Mo
azure 使用_在Azure中使用Redis Enterprise cxu0262 数据库大数据 python java mysql
azure使用NoSQL存储有很多类型。一些是文档数据库，另一些存储键/值对，它们都支持许多不同类型的索引和查询。有基于磁盘的系统和旨在在内存中工作的系统。有些可以有效处理大量数据；其他人则专注于提高速度。拥有如此众多的不同产品，有时很难选择一种。较流行的内存系统之一是Redis，即RemoteDictionaryServer。它基于RedisLabs赞助的开源Redis服务器构建，具有一系列商业
【软考高级系统架构论文】论NoSQL数据库技术及其应用 _Richard_ 软考高级系统架构论文 2025年软考系统架构师系统架构 nosql 数据库
论文真题随着互联网web2.0网站的兴起，传统关系数据库在应对web2.0网站，特别是超大规模和高并发的web2.0纯动态SNS网站上已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL(NotonlySQL)的产生就是为了解决大规模数据集合及多种数据类型带来的挑战，尤其是大数据应用难题。目前NoSQL数据库并没有一个统一的架构，根据其所
NoSQL之Redis配置与优化（缓存加速） Jay&& 缓存 nosql redis 缓存加速
一、非关系型数据库产生背景Highperformance————对数据库高并发读写需求HugeStorage———对海量数据高效存储与访问需求HighScalability&&HighAvailability——对数据库高可扩展性与高可用性需求二、Redis简介基于内存运行并支持持久化采用key-value(键值对)的存储形式1、优点速度快:10WQPS,基于内存,C语言实现单线程使用epoll（
【IndexDB】前端IndexedDB终极指南 Vesper63 前端前端
前端IndexedDB详细教程IndexedDB是一个浏览器内置的NoSQL数据库系统，允许在客户端存储大量结构化数据，并支持高性能搜索。相比localStorage，IndexedDB更适合存储大量数据并提供更复杂的查询功能。基本概念数据库：每个源（协议+域名+端口）可以创建多个数据库对象存储（ObjectStore）：类似于数据库中的表索引（Index）：用于快速查找数据事务（Transact
NoSQL之Redis配置与优化归梧谣 nosql redis 数据库
Redis介绍Redis数据库是一个非关系型数据库，在正式学习Redis之前，先来了解关系型数据库与非关系型数据库的概念。关系数据库与非关系型数据库数据库按照数据库的结构可以分为关系型数据库与其他数据库，而这些其他数据库我们将其统称为非关系型数据库。关系型数据库关系型数据库是一个结构化的数据库，创建在关系模型基础上，一般面向于记录。它借助于集合代数等数学概念和方法来处理数据库中的数据。关系模型就是
NoSQL 之 Redis 配置与优化 @暗冥 linux
一、Redis介绍1.关系数据库与非关系型数据库数据库按照数据库的结构可以分为关系型数据库与其他数据库，而这些其他数据库我们将其统称为非关系型数据库。1.1关系型数据库关系型数据库是一个结构化的数据库，创建在关系模型基础上，一般面向于记录。它借助于集合代数等数学概念和方法来处理数据库中的数据。关系模型就是指二维表格模型，因而一个关系型数据库就是由二维表及其之间的联系组成的一个数据组织。现实世界中，
iperf3使用方法 liuluyang530 开发语言网络 iperf iperf3 打流
iperf是一款非常强大的开源网络性能测试工具，用于测量TCP和UDP带宽、延迟、抖动和丢包率。“打流”通常指的是进行持续、大流量的网络传输测试，以评估网络的吞吐量、稳定性和承载能力。以下是iperf用于打流（主要是测量最大带宽）的常用命令详解，分为服务端和客户端两部分：一、服务端(Server)-接收数据在需要接收流量的机器上运行。通常只需指定监听端口。基本命令：iperf3-s-s:以服务器模
YashanDB的性能测试工具，评估数据库效率的利器数据库
在现代数据库管理系统中，性能优化一直是IT行业面临的重要挑战之一。数据库性能直接影响到应用程序的响应速度和用户体验，因此企业必须重视如何提高数据库的查询速度和处理效率。如何优化查询速度是当前数据库技术面临的普遍问题。为此，YashanDB开发了针对性能测试的工具，以便从各个维度评估数据库的效率，提升整体系统性能。YashanDB性能测试工具的核心技术点基于SQL性能统计YashanDB的性能测试工
DBeaver和Navicat哪个功能更强大？ java
从功能和适用场景来看，DBeaver与Navicat各有优势，具体取决于用户需求：‌1.数据库支持范围‌‌DBeaver‌：支持超过‌50种数据库‌，包括主流关系型数据库（MySQL、Oracle等）及NoSQL（Cassandra、MongoDB等）和云数据库，通过JDBC驱动扩展兼容性极强。‌Navicat‌：覆盖主流数据库（MySQL、PostgreSQL、SQLServer等）及部分云数据
DBeaver和Navicat哪个更好？ java
以下是DBeaver与Navicat的深度对比分析，结合功能、成本、适用场景等核心维度，助您精准选型：‌一、核心差异全景对比‌‌维度‌‌DBeaver‌‌Navicat‌‌授权模式‌开源免费（社区版）商业付费（基础版$199/年）‌数据库兼容性‌支持50+种数据库（含NoSQL）主流关系型数据库（MySQL/Oracle等）‌操作体验‌功能强大但界面复杂，需学习适应图形化设计直观，新手友好‌高级功
【赵渝强老师】HBase的体系架构赵渝强老师 NoSQL数据库 hbase 架构数据库大数据 hadoop hdfs nosql
HBase是大表（BigTable）思想的一个具体实现。它是一个列式存储的NoSQL数据库，适合执行数据的分析和处理。简单来说，就是适合执行查询操作。从体系架构的角度看，HBase是一种主从架构，包含：HBaseHMaster、RegionServer和ZooKeeper，下图展示了这一架构。其中：HBaseHMaster负责Region的分配及数据库的创建和删除等操作。Regionserver负
HTB Redeemer lally. 数据库
RedisRedis（RemoteDictionaryServer）是一个开源的内存型非关系型（NoSQL）键值对数据库，以高性能、低延迟和灵活性著称，广泛用于缓存、会话管理和实时数据处理。核心特点内存存储：数据存储在内存，读写速度极快（微秒级）。键值存储：支持多种数据类型，如字符串、哈希、列表、集合、有序集合等。持久化：支持将数据保存到磁盘（RDB快照或AOF日志）。高可用性：支持主从复制、哨兵
SPL轻量级多源混合计算 LuckJudy 数据计算多源混算 esProcSPL
多样性数据源混合计算是常态需求，同构或异构数据库之间、文件与数据库、NoSQL与文件等，理论上任何数据存储之间都涉及数据混合计算和分析。但混算需求目前技术解决的并不好，同构库之间某些数据库还能支持，而完全异构的数据源实施混算就比较麻烦。经常要借助逻辑数据仓库，但基于SQL的逻辑数仓不仅能力有限，而且体系过于沉重，经常会比应用本身还复杂，只适合应用于大型场景中，并不适合众多日常的轻量多源混算场景。S
Ascend如何测试集合通信（HCCL）的功能正确性以及性能？ zjun3021 ascend hccltest hccl 带框测试
1适用场景分布式训练场景下，开发者可以通过此工具测试HCCL（HuaweiCollectiveCommunicationLibrary）集合通信的功能正确性以及性能。此工具仅支持基于HCCL单算子API实现集合通信的网络性能测试。2MPI安装与配置HCCL性能测试工具依赖MPI拉起多个进程，所以需要先安装MPI软件。具体的安装步骤，可以参考：MPICH安装配置３工具编译安装完MPI软件后，需要进行
【昇腾】HCCL性能测试工具：HCCL TEST使用 waterlts 昇腾HCCL 昇腾 HCCL性能测试工具 hccl test 多机通信
HCCLTEST简介HCCLTEST主要是在多机（也可以单机）多卡上面，运行通信算子，验证多机多卡hccl通信功能以及性能。HCCL_TEST主要是提供一些通信算子的可执行文件，真正要调度到多机多卡上，需要借助MPICH。HCCLTEST路径及内容：/usr/local/Ascend/ascend-toolkit/latest/toolkit/tools/hccl_testMPICH介绍HCCL性
常用软件测试工具，赶紧收藏可可爱爱的程序员软件测试功能测试测试基础测试工具单元测试功能测试压力测试
随着软件测试的地位逐步提高，测试的重要性逐步显现，测试工具的应用已经成为了普遍的趋势。目前用于测试的工具已经比较多了，这些测试工具一般可分为白盒测试工具、黑盒测试工具、性能测试工具，另外还有用于测试管理(测试流程管理、缺陷跟踪管理、测试用例管理)的工具。总的来说，测试工具的应用可以提高测试的质量、测试的效率。但是在选择和使用测试工具的时候，我们也应该看到，在测试过程中，并不是所有的测试工具都适合我
Istio 的授权认证和 OAuth2/OIDC 欧先生^_^ istio 数据库 sql
Istio的授权认证和OAuth2/OIDC（如Keycloak或SpringAuthorizationServer）解决的是不同层面的安全问题。OAuth2/OIDC：关注的是“用户身份”和“应用授权”。它回答的问题是：“你是谁？（认证）”，“你（或代表你的应用）被允许做什么？（授权）”。Istio的授权：关注的是“服务到服务（Workload-to-Workload）”的通信安全。它回答的问题
时序数据管理的新维度：解析IoTDB与HBase的技术边界时序数据说 iotdb hbase 数据库时序数据库分布式开源
在物联网与工业大数据场景中，数据的时序特性对存储与计算提出了独特挑战。面对海量设备生成的高频时序数据，如何在有限的资源内实现高效写入、灵活查询与实时分析，成为企业技术选型的核心考量。本文将从架构设计、数据建模、性能表现及场景适配等角度，对比分析IoTDB与HBase的技术差异，探索时序数据库的演进方向。一、设计哲学的分野：专用时序与通用存储HBase作为经典的NoSQL数据库，以宽表模型和LSM-
Sysbench flyair_China 功能测试
Sysbench作为开源性能测试工具，其标准化测试场景和指标定义已形成行业共识sysbench附带以下捆绑的基准测试：oltp_*.lua：类似OLTP的数据库基准测试的集合fileio：文件系统级基准cpu：简单的CPU基准测试memory：内存访问基准threads：基于线程的调度程序基准mutex：POSIX互斥基准测试一、标准化测试类型Sysbench提供六大内置测试类型，每类均有规范化的
自学导航页（待续ing） weixin_30736301
1博客导航1.1linuxlinux全线教程–提供了linux教程，服务器管理教程，BSD教程，还有编程语言（C/Java/Python/Perl），以及网络等全栈学习教程1.2存储技术NoSQLFan–关注NoSQL相关的新闻与技术刘爱贵的专栏–中科院博士，长期从事存储领域研发工作，分式存储资深理论研究与实践者，GlusterFS技术专家，当前专注于ServerSAN。gnuhpc的百草园和三味
浅谈NewSQL 深海科技服务行业发展数据库 ibm oracle 微软人工智能 ai 程序人生
一、什么是NewSQLNewSQL是一种现代关系型数据库管理系统(RDBMS)的统称，旨在结合传统关系型数据库的事务完整性(ACID)和SQL兼容性，以及NoSQL数据库的高可扩展性和高性能。简单来说，NewSQL就是希望在分布式环境下，既能像传统SQL数据库那样保证数据的一致性和可靠性，又能像NoSQL数据库那样处理海量数据和高并发请求。NewSQL出现的背景传统的关系型数据库（如MySQL、P
系统性能优化的关键手段 Wendy_robot 性能优化面试
系统性能的提升方向服务器并发处理能力：通过优化内存管理策略、选择合适的连接模式（长连接或短连接）、改进I/O模型（如epoll、IOCP）、以及采用高效的服务器并发策略（如多线程、事件驱动等），可以有效提升服务器的并发响应能力。数据库性能优化：包括合理设计索引、使用连接池减少连接开销、借助临时表提升中间数据处理效率、根据需求进行反范式化设计，以及引入各类NoSQL技术（如Redis、MongoDB
AB（apache benchmark）——压力测试 Yplayer001
AB（apachebenchmark）为Apache自带的性能测试工具在APACHE的bin目录下。通过CMD进入apache的bin目录下，本例以windows下的apache为例。C:\ProgramFiles\ApacheSoftwareFoundation\Apache2.2\bin>格式：ab[options][http://]hostname[:port]/path参数：-nreque
探秘基础数据库：从架构到实践的全维度解析 st0173 oracle 数据库
一、数据库基础：数据世界的底层逻辑数据库是数字化时代的“数字粮仓”，其核心使命是实现数据的高效存储、管理与检索。从本质上讲，数据库通过数据模型对现实世界进行抽象建模，常见的模型包括层次模型、网状模型和关系模型。其中，关系型数据库（如MySQL、Oracle）凭借结构化查询语言（SQL）的标准化优势，成为企业级应用的主流选择，而NoSQL数据库（如MongoDB、Redis）则以灵活的数据模型在互联
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end