taoewang

NoSQL标准性能测试

1 概述

随着IT技术的不断发展和革新，近年来，一种称之为“NoSQL”的技术渐渐成为业界的新宠，在很多不同的行业和应用领域能够替代传统的关系型数据库，提供更敏捷的开发效率与执行效率。NoSQL技术通过弱化一部分关系型数据库的特性，例如一致性和关系模型等，来提升其可扩展性以及高可用性，弥补了关系型数据库在很多互联网类应用中的不足。

在本篇测试报告中，我们使用Yahoo发布的标准YCSB测试规则，对包括几款国外的NoSQL数据库产品和SequoiaDB进行对比，并尝试给出每种不同产品所适用的应用场景。在测试配置中，我们尽可能对全部产品做到高可用配置，而在一致性级别上则使用最终一致性。

在测试中我们会对两种类型的NoSQL数据库做横向对比，包括Document-Oriented文档类数据库、以及Big-Table宽表类数据库。由于每种类型的数据库具有很多自己独特的特性，我们不能将每种特性一一表现在该测评结果中。本测试主要针对数据库在不同任务类型下的性能指标进行，且仅依赖YCSB所提供的标准测试流程。

本测试由SequoiaDB开发团队完成，并在文档中详细列出本测试的物理环境以及配置信息，以便于读者能够使用自己的环境独立验证结果。

2 测试概要

2.1 测试产品

本测试主要对比两种类型的NoSQL数据库，包括四款不同的产品：

MongoDB （文档类，V2.6.1）
SequoiaDB （文档类，V1.8）
HBase （宽表类，V0.94.6-CDH4.5.0）
Cassandra （宽表类，V1.1.12）

其中MongoDB作为当前市场占有率最高的数据库，可能是众多读者所关心的产品，提供丰富的数据库功能，号称是最接近关系型数据库的NoSQL产品；而SequoiaDB作为我国新兴的文档类数据库产品，由前IBM DB2团队的研发人员创建，据称在性能和功能上能够与MongoDB做正面抗衡，同样提供很多MongoDB所提供的功能（例如分片、多索引等特性）。

HBase则是Hadoop框架的一员，也已经被广大企业和互联网用户所接受，我们使用的版本0.94.6是跟随CDH 4.5.0安装包的版本；而Cassandra则是与HBase类似的产品，由Facebook研发并进行开源，同样拥有广大的用户市场。

我们的测试使用由Yahoo!研究院发布的Yahoo Cloud Serving Benchmark （YCSB）基准测试，并将接口对各自产品的最新版进行了修改和适配。我们在正文后的附录中也提供了SequoiaDB的YCSB测试接口。

需要重新强调的是，每种不同的产品都有各自的应用场景。YCSB测试尽管是Yahoo!研究院提供的测试框架，但是在很多场景下并不能完全发挥出每个产品各自的特点。在本测试中，我们尝试使用YCSB框架给出最为客观的评估结果。如果对于该测试结果或配置存在疑问，我们欢迎广大读者根据自身需要重新调整，并将结果共享给我们SequoiaDB的开发团队作为参考。

2.2 测试场景

YCSB测试框架提供了丰富的场景配置机制，允许用户根据需要选择需要导入的数据量和增删改查之间相应的比例。在本测试中，我们导入一亿条数据，并对如下场景进行对比。

场景编号	场景分类	描述
1	单条记录导入	单条记录导入
2	批量记录导入	批量记录导入
3	单纯查询	100%查询
4	查询导入平衡	50%导入，50%查询
5	更新为主	95%更新，5%查询
6	查询为主	95%查询，5%更新
7	查询最新	95%查询，5%导入

对于数据导入的场景，我们对单条记录插入和批量插入两个场景进行了区分。对于一些数据库来说，默认配置会在客户端将一批记录打包并统一发送给服务器，对于这类产品，尽管其接口为单条记录操作，我们依然将其归类为批量记录导入模式。

写入和查询的数据模拟典型日志记录的长度，具有以下特性：

特性	描述
字段数	10字段
字段名长度	6字节
记录总大小	100Bytes
全部字段类型	字符串
主键长度	23字节
总记录数	1亿条
总裸数据量	大约100GB
数据副本份数	3

其中，SequoiaDB与MongoDB的分片均配置为一主两从；HBase所在的HDFS设置复制份数为3；Cassandra建表时使用参数replication_factor=2。

一致性级别上，我们使用最弱的最终一致性，读写的write concern均设置为1。

2.3 测试环境

本测试中，测试环境总共包含4台Dell R520物理机作为数据存储。生成数据的YCSB程序与数据库运行在同一物理环境。

注：如使用独立服务器进行YCSB的数据生成，会导致千兆网瓶颈。

整个集群的拓扑结构如图1所示：

图1：测试集群拓扑

2.3.1 服务器环境

本测试数据库服务器使用4台Dell R520物理机环境，每台物理机配置如下：

类型	参数
CPU	Intel(R) Xeon® CPU E5-2420 1.9GHZ (6 core)
内存	DDR3 48GB
磁盘	6块内置SATA硬盘，2TB/块
网络	千兆以太网
操作系统	Red Hat Enterprise Linux Server release 6.4 kernel-release:2.6.32-358.e16.x86_64
JDK	Oracle JDK 1.6

2.4 测试方法

本测试使用YCSB标准，基于四台物理机执行。对于每种不同产品的测试流程如下：

1 安装软件

2 基于四节点部署集群，配置时尽可能基于以下准则：

高可用配置
最终一致性
功能与单节点环境保持一致
充分利用硬件资源

3 在四台物理机中部署YCSB集群，向本地集群写入读取数据

4 进行数据操作时通过YCSB产生记录的统计数量

5 根据结果生成Excel文件

6 针对其他场景重复以上步骤

并发性方面则基于以下规则：

单条记录插入每服务器24条线程
批量记录插入每服务器8条线程
其他所有操作每服务器36条线程

3 测试结果

3.1 场景1：单条记录导入

图2：单条记录导入场景

在单条记录导入场景中，SequoiaDB与MongoDB使用insert方法，writeConcern设置为Normal；HBase则设置客户端缓冲区为2KB。而在错误检验方式上，由于是单条记录插入，所以MongoDB必须在每次操作后检测返回值是否成功，因此不可以使用异步插入方式。

在图2的结果中可以看到，单条记录导入操作SequoiaDB最高，总吞吐量可以达到每秒钟近7万。而HBase与Cassandra则比较接近，在5-6万之间。MongoDB在该场景中表现较差，总吞吐量不到每秒1万。

在该场景中，YCSB在4台服务器上各启动24条线程，总共并发量为96线程。

3.2 场景2：批量记录导入

图3：批量记录导入场景

批量记录导入场景的结果见图3。在该场景中，SequoiaDB与MongoDB使用各自提供的bulk insert方法；HBase则设置client buffer为4MB；Cassandra不提供批量数据导入方式。

在该测试中，批量导入数据为每批次3000条记录，每节点启动8条线程，总数32线程。

测试结果显示，SequoiaDB可以达到每秒钟近19万的导入速度，而MongoDB则与单线程导入的性能接近（1万左右），HBase也没有本质提升。

3.3 场景3：单纯查询

图4：单纯查询场景

图4显示单纯随机查询的场景。在该场景中MongoDB表现最为突出，整体吞吐量达到每秒钟8万以上。SequoiaDB和Cassandra类似，大约为MongoDB的一半，在4万至5万之间徘徊。而HBase表现最差，未达到每秒1万的指标。

该场景每台物理服务器使用36条客户端线程，总数144条线程。

3.4 场景4：查询导入平衡

图5：查询导入平衡场景

该场景主要模拟50%的插入和50%的查询业务（图5）。其中插入业务使用单条记录插入。

最终的结果显示，SequoiaDB的整体表现最优，平均达到每秒钟超过14000TPS，而MongoDB/HBase/Cassandra则比较接近，各自不到10000TPS。

3.5 场景5：更新为主

图6：更新为主场景

如图6所示，更新为主场景模拟95%更新与5%查询的场景。该场景中，SequoiaDB表现最优，结果介于5万到6万之间每秒。

而MongoDB表现相对较弱，大约在5千每秒左右的数量级。

3.6 场景6：查询为主

图7：查询为主场景

在查询为主的场景中，模拟95%查询+5%更新。在该测试中，SequoiaDB与Cassandra的性能接近单纯查询的场景，而更新操作对MongoDB的损耗相对较大，使其性能仅不到3万每秒。

HBase在随机读为主的场景下相对较慢。

3.7 场景7：查询最新

图8：查询最新场景

查询最新场景为95%读+5%插入，并且读取的数据尽可能是刚刚写入的数据。

从图8中可以看出，SequoiaDB对于刚刚写入至内存中便读取的场景性能最佳，达到近4万每秒。

而MongoDB和Cassandra则相比场景6有明显下降，HBase依然性能较低。

4 结论

从第三部分的各个场景对比中可以看出，SequoiaDB数据库在数据插入场景中表现最为突出，甚至超过本身以插入性能著称的Cassandra。而业界普及率最高的MongoDB则在单纯读取性能上最为抢眼，远远超过HBase和Cassandra。

总体来看，SequoiaDB在性能表现上较为出色，与其他主流NoSQL数据库相比在多个指标上明显胜出，并且不存在明显的短板。

HBase与Cassandra虽然在写入性能上远高于MongoDB，但是和SequoiaDB相比仍然逊色一筹；而在主键随机读操作方面，Cassandra的新版本和之前的版本比起来性能大幅度上升，基本做到和MongoDB/SequoiaDB处于同一水平线，而HBase则远不能和其他产品相比。

当然，这些比较也仅仅局限于YCSB所做的测试，而文档类数据库能够提供的二级索引等机制并非是YCSB所测试的。因此，文档类数据库能够提供比宽表类数据库更多的应用场景。

如此看来，对于宽表类数据库来说，如果在其最有优势的主场都败给了SequoiaDB文档类数据库，这是否意味着，HBase和Cassandra最大的优势已经不再，文档类数据库会在各个领域的性能表现超越宽表呢？

5 附录A：配置信息

5.1 MongoDB

mongodb的分片分布如图9，不同颜色代表不同的分片，我们采用的是多个副本的分片。

图9：MongoDB环境部署

mongodb的部署脚本如下(deploy.sh)：

#!/bin/bash
sshperftest-1 "mongod --configsvr --logpath/data/disk1/mongodb-cfg/configsvr.log --dbpath /data/disk1/mongodb-cfg/ --port37019 --journal --fork"
sshperftest-2 "mongod --configsvr --logpath /data/disk1/mongodb-cfg/configsvr.log--dbpath /data/disk1/mongodb-cfg/ --port 37019 --journal --fork"
sshperftest-3 "mongod --configsvr --logpath/data/disk1/mongodb-cfg/configsvr.log --dbpath /data/disk1/mongodb-cfg/ --port37019 --journal --fork"
 
sshperftest-1 "mongos --configdb perftest-0:37019,perftest-1:37019,perftest-2:37019--logpath /data/disk1/mongodb-data/mongos.log --fork"
sshperftest-2 "mongos --configdbperftest-0:37019,perftest-1:37019,perftest-2:37019 --logpath/data/disk1/mongodb-data/mongos.log --fork"
sshperftest-3 "mongos --configdbperftest-0:37019,perftest-1:37019,perftest-2:37019 --logpath/data/disk1/mongodb-data/mongos.log --fork"
sshperftest-4 "mongos --configdbperftest-0:37019,perftest-1:37019,perftest-2:37019 --logpath/data/disk1/mongodb-data/mongos.log --fork"
 
 
hostno=0
hosts=("perftest-1""perftest-2" "perftest-3" "perftest-4")
disknos=(11 1 1)
port=37017
for((i=0;i<8;++i))
do
   for ((j=0;j<3;++j))
   do
     ssh ${hosts[$hostno]} "mongod--replSet dg$i --logpath /data/disk${disknos[$hostno]}/mongodb-data/mongd.log--dbpath /data/disk${disknos[$hostno]}/mongodb-data/ --logappend --quiet --port$port --fork"
 
      letdisknos[$hostno]=${disknos[$hostno]}+1
      let hostno=hostno+1
      if [ $hostno -eq ${#hosts[@]} ];then
         let hostno=0
      fi
   done
   let port=port+10
 
done

mongodb的分片添加脚本如下(addshard.js)：

varport=37017
varhosts=[" perftest-1"," perftest-2"," perftest-3","perftest-4"];
var hostid=0;
for(i=0;i<8;++i)
{
   var conf = new Object();
   conf._id = 'dg'+i;
   conf.members = new Array();
   for (j=0;j<3;++j)
   {
      var member = new Object();
      member._id = j;
      member.host = hosts[hostid] +":" + port;
      conf.members[j] = member;
      hostid=hostid+1;
      if (hostid == hosts.length)
      {
         hostid = 0;
      }
   }
  var db = connect(conf.members[0].host+"/test");
  rs.initiate(conf);
  rs.conf();
  port =port + 10
  var db2 = connect(conf.members[0].host +'/test');
  sh.addShard('dg'+i+'/'+conf.members[0].host )
}

mongodb的集合创建脚本如下(createcl.sh)：

mongo<<EOF
sh.stopBalancer();
useycsb;
db.dropDatabase();
useadmin;
db.runCommand({enableSharding:"ycsb"});
useadmin;
db.runCommand({shardcollection:"ycsb.usertable",key:{_id:'hashed'},numInitialChunks:4096});
exit
EOF

所有的writeConcern都为normal。

5.2 SequoiaDB

sequoiadb的数据组分布情况如图10，其中不同颜色代表不同的分片。

图10：SequoiaDB部署架构图

sequoiadb的部署脚本如下(deploy.js)：

try
{
   var db = new Sdb();
   db.createCataRG('perftest-1',11820,'/opt/sequoiadb/database/cata/11820');
   db.getRG(1).createNode('perftest-2',11820,'/opt/sequoiadb/database/cata/11820');
   db.getRG(1).createNode('perftest-3',11820,'/opt/sequoiadb/database/cata/11820');
   db.getRG(1).getNode('perftest-2',11820).start();
   db.getRG(1).getNode('perftest-3',11820).start();
 
   // group number is 8
   var port=11830;
   var hostid = 0;
   var diskno = 1;
   var diskids = [1,1,1,1];
   for(i=0;i<8;++i)
   {
      db.createRG('dg'+i);
      // 3 nodes of per group
      for (j=0;j<3;++j)
      {
        db.getRG('dg'+i).createNode('perftest-'+( hostid+1), port,'/data/disk' +diskids[hostid] + '/sequoiadb/database/data'+port);
         diskids[hostid] += 1;
         hostid += 1;
         if (hostid > 3)
         {
            hostid = 0;
         }
      }
      db.getRG('dg'+i).start();
      port += 10;
   }
}catch(e)
{
   throw e;
}

创建分区集合的脚本如下(createcl.js)：

try
{
   var db = new Sdb()
   db.dropCS('ycsb')
}catch(e)
{
   if (e != -34)
   {
      throw "drop cs failure" + e;
   }
}
 
try
{
   db.createCS('ycsb')
  db.ycsb.createCL('usertable',{ShardingType:'hash',ShardingKey:{_id:1},EnsureShardingIndex:false})
   var snapshot8 =db.snapshot(8,{Name:'ycsb.usertable'}).toArray();
   var obj = eval ( "(" +snapshot8[0] + ")" );
   var srcgroup =obj["CataInfo"][0]["GroupName"];
   var partition = obj["Partition"];
 
   var groupnames = new Array()
   var groups = db.list(7).toArray();
   for(i=0;i<groups.length;++i)
   {
      var group = eval("(" +groups[i] + ")");
      if (group["GroupName"] =="SYSCatalogGroup")
      {
         continue;
      }
     groupnames.push(group["GroupName"]);
   }
 
   var remainderpart = partition %groupnames.length ;
   var part = (partition - remainderpart) /groupnames.length
   for(i=0;i<groupnames.length;++i)
   {
      if (groupnames[i] == srcgroup )
      {
         continue;
      }
      println("spliting from " +srcgroup + " to " + groupnames[i]+ "........");
      db.ycsb.usertable.split(srcgroup,groupnames[i], {Partition: (i*part)},{Partition:(i+1)*part});
      if (remainderpart > 1)
      {
         db.ycsb.usertable.split(srcgroup,groupnames[i], {Partition: endpart},{Partition: (endpart + 1)})
         endpart += 1;
         remainderpart -= 1;
      }
   }
}catch(e)
{
   throw e;
}

5.3 HBase

HBase的数据分布情况如图11：

图11：HBase部署架构图

创始表语句使用：

create'usertable', 'cf', {SPLITS => ['user1', 'user2', 'user3', 'user4', 'user5', 'user6','user7', 'user8', 'user9' ]}

5.4 Cassandra

图12是一个Cassandra四节点集群。我们采用使用二十四块硬盘同时处理数据和提交日志。

图12：Cassandra部署架构图

与测试的其他数据库不同，Cassandra在配置中使用环形拓扑，节点需要被明确地视为“种子”节点（这有助于它们加入到环中）。在配置时，必须指定哪些令牌将映射到哪些实例。

我们使用了https://raw.github.com/riptano/ComboAMI/2.2/tokentoolv2.py提供的令牌生成工具来创建节点配置。

$ ./tokentoolv2.py 4
{
"0":{
"0":0,
"1":42535295865117307932921825928971026432,
"2":85070591730234615865843651857942052864,
"3":127605887595351923798765477786913079296
}
}

Cassandra 的一致性级别可以调节。每次读取和写入都可以明确地说明该操作需要什么级别的数据库一致性。由于这是一个基准测试项目，因此我们使用了最弱和最快的一致性级别（ONE）来进行读取和写入。

对于所有数据库，我们使用的复制因子都是 2。其他主要设置为：

内容	值
分区工具	RandomPartitioner
初始令牌空间	2^127 / 4
内存表空间	4GB
并发读取	48
并发写入	48
压缩	SnappyCompressor
提交日志同步	10000 ms

以下内容为 conf/cassandra.yaml的设置：

cluster_name:'Test'
initial_token:0
 
hinted_handoff_enabled:true
max_hint_window_in_ms:3600000 # one hour
hinted_handoff_throttle_delay_in_ms:1
authenticator:org.apache.cassandra.auth.AllowAllAuthenticator
authority:org.apache.cassandra.auth.AllowAllAuthority
partitioner:org.apache.cassandra.dht.RandomPartitioner
data_file_directories:
    - /data/disk1/cassandra-data
    - /data/disk2/cassandra-data
    - /data/disk3/cassandra-data
    - /data/disk4/cassandra-data
    -/data/disk5/cassandra-data
    - /data/disk6/cassandra-data
 
commitlog_directory:
    /data/disk1/cassandra-log/,/data/disk2/cassandra-log/,/data/disk3/cassandra-log/,/data/disk4/cassandra-log/
    ,/data/disk5/cassandra-log/,/data/disk6/cassandra-log/
 
saved_caches_directory:/data/disk1/apache-cassandra/saved_caches
commitlog_sync:periodic
commitlog_sync_period_in_ms:10000
 
seed_provider:
    - class_name:org.apache.cassandra.locator.SimpleSeedProvider
      parameter s:
          - seeds: "192.168.30.62,192.168.30.64,192.168.30.65,192.168.30.67"
 
 
flush_largest_memtables_at:0.75
 
reduce_cache_sizes_at:0.85
reduce_cache_capacity_to:0.6
 
concurrent_reads:48
concurrent_writes:48
 
memtable_flush_queue_size:4
 
sliced_buffer_size_in_kb:64
 
storage_port:7000
 
ssl_storage_port:7001
 
listen_address:192.168.30.62
 
rpc_address:0.0.0.0
rpc_port:9160
 
rpc_keepalive:true
 
rpc_server_type:sync
thrift_framed_transport_size_in_mb:15
 
thrift_max_message_length_in_mb:16
 
incremental_backups:false
 
snapshot_before_compaction:false
column_index_size_in_kb:64
 
in_memory_compaction_limit_in_mb:64
 
multithreaded_compaction:false
 
compaction_throughput_mb_per_sec:16
 
compaction_preheat_key_cache:true
 
rpc_timeout_in_ms:10000
endpoint_snitch:org.apache.cassandra.locator.SimpleSnitch
 
dynamic_snitch_update_interval_in_ms:100
 
dynamic_snitch_reset_interval_in_ms:600000
dynamic_snitch_badness_threshold:0.1
request_scheduler:org.apache.cassandra.scheduler.NoScheduler
 
index_interval:128
 
encryption_options:
    internode_encryption: none
    keystore: conf/.keystore
    keystore_password: cassandra
    truststore: conf/.truststore
    truststore_password: cassandra

使用以下命令对数据库进行初始化：

CREATE KEYSPACE usertable
WITH placement_strategy ='org.apache.cassandra.locator.SimpleStrategy' AND strategy_options ={replication_factor:2};
use usertable;
CREATE COLUMN FAMILY data WITHcomparator = UTF8Type
AND key_validation_class = UTF8Type

6 附录B：YCSB调整

6.1 驱动调整

6.1.1 MongoDB

默认没有采用连接池的形式实现，调整为连接池形式
默认不支持批量插入，增加支持批量插入
默认不支持选择查询接口，增加支持选择查询接口
默认不支持选择readpreference,增加支持选择readpreference
为适应2.12.1版本的driver作了些调整

详细调整如下：

  void init()
   {
    ...
      Properties props = getProperties();
      String url =props.getProperty("mongodb.url",
                                          "mongodb://localhost:27017");
      database =props.getProperty("mongodb.database", "ycsb");
      StringwriteConcernType = props.getProperty("mongodb.writeConcern",
                                                       "safe").toLowerCase();
      //final StringmaxConnections = props.getProperty(
      //        "mongodb.maxconnections","100");
      insertmode =props.getProperty("mongodb.insertmode", "single");
      readpreference =props.getProperty("mongodb.readpreference",
                                                    "primary");
     bulknumber=Integer.parseInt(props.getProperty("mongodb.bulknumber",
                                                               "5000"));
      final String find =props.getProperty("mongodb.usefindinterface",
                                                       "false");
    if (replWriteNum != 1){
                writeConcern= new WriteConcern(replWriteNum);
            }
           
            try {
                // strip out prefix since Javadriver doesn't currently support
                // standard connection formatURL yet
                //http://www.mongodb.org/display/DOCS/Connections
               /* if(url.startsWith("mongodb://")) {
                    url = url.substring(10);
                }*/
                // need to append db to url.
                url += "/" +database;
                System.out.println("newdatabase url = " + url);
                MongoClientURI uri = new MongoClientURI(url);
                mongo =new MongoClient(uri);
               mongo.setReadPreference(ReadPreference.valueOf(readpreference));
               mongo.setWriteConcern(writeConcern);
                System.out.println("mongoconnection created with " + url);
            }
            catch (Exception e1) {
                System.err
                        .println("Couldnot initialize MongoDB connection pool for Loader: "
                                + e1.toString());
                e1.printStackTrace();
                return;
            }
}
publicint insert(String table, String key,
            HashMap<String, ByteIterator>values) {
        com.mongodb.DB db = null;
        try {
            db = mongo.getDB(database);
            if (!outputclientflag){
                CommandResult commandResult =db.command("buildInfo");
                    if(commandResult.containsField("tokumxVersion")){
                             System.out.println("tokumx");
                    }
                    else{
                             System.out.println("mongodb");
                    }
                    outputclientflag= true;
                }
            db.requestStart();
 
            DBCollection collection =db.getCollection(table);
            DBObject r = newBasicDBObject().append("_id", key);
            for (String k : values.keySet()) {
                r.put(k,values.get(k).toArray());
            }
            //WriteResult res = null;
            if(insertmode.equals("bulk")){
                objs.add(r);
        
                //bulkwrite.insert(r);
                if (objs.size() == bulknumber){
                         //res =
                         collection.insert(objs);
                         objs.clear();
                         //return 0;
                }
            }else{
                //res =
                collection.insert(r);
            }
           
            //return res.getN() == replWriteNum? 0:1;
            return 0;
     
        }
        catch (Exception e) {
            e.printStackTrace();
            return 1;
        }
        finally {
            if (db != null) {
                db.requestDone();
            }
        }
    }
 
publicint read(String table, String key, Set<String> fields,
            HashMap<String, ByteIterator>result) {
        com.mongodb.DB db = null;
        DBCursor cursor = null;
        try {
            db = mongo.getDB(database);
            db.requestStart();
           //getCollection(table);
            DBCollection collection =db.getCollection(table);
            DBObject q = newBasicDBObject().append("_id", key);
            DBObject fieldsToReturn = newBasicDBObject();
 
            DBObject queryResult = null;
            //DBCursor cursor = null;
            if (fields != null) {
                Iterator<String> iter =fields.iterator();
                while (iter.hasNext()) {
                   fieldsToReturn.put(iter.next(), INCLUDE);
                }
                if(findone){
                     queryResult = collection.findOne(q,fieldsToReturn);
                }
                else{
                     cursor = collection.find(q,fieldsToReturn);
                }
            }
            else {
                if(findone){
                         queryResult= collection.findOne(q);
                }
                else{
                         cursor= collection.find(q).setReadPreference(ReadPreference.secondaryPreferred());
                }
            }
           
            if (cursor != null &&cursor.hasNext()){
                queryResult= cursor.next();
            }
 
            if (queryResult != null) {
               result.putAll(queryResult.toMap());
            }
            return queryResult != null ? 0 : 1;
        }
        catch (Exception e) {
            System.err.println(e.toString());
            return 1;
        }
        finally {
            if (db != null) {
                db.requestDone();
            }
            if (cursor != null){
                cursor.close();
            }   
        }
    }

6.1.2 HBase

1 支持通过参数控制WriteBufferSize

2 适应驱动做微调

详细如下：

publicvoid init() throws DBException
{
        if ((getProperties().getProperty("debug")!=null) &&
               (getProperties().getProperty("debug").compareTo("true")==0))
        {
            _debug=true;
        }
 
        _columnFamily =getProperties().getProperty("columnfamily");
        if (_columnFamily == null)
        {
            System.err.println("Error,must specify a columnfamily for HBase table");
            throw new DBException("Nocolumnfamily specified");
        }
        _columnFamilyBytes =Bytes.toBytes(_columnFamily);
       
        clientbufsize =Integer.parseInt(getProperties().getProperty("clientbuffersize"));
 }
 
 
publicvoid getHTable(String table) throws IOException
    {
        synchronized (tableLock) {
            _hTable = new HTable(config,table);
            //2 suggestions fromhttp://ryantwopointoh.blogspot.com/2009/01/performance-of-hbase-importing.html
            _hTable.setAutoFlush(false);
            _hTable.setWriteBufferSize(clientbufsize*1024);
            //return hTable;
        }
 
    }

6.2 统计数据收集

从原有的Measurements派生出ExcelMeasurementsExporter用于将生成的统计数据导出到excel文件中，ExcelMeasurementsExporter调用jxl.jar开源库实现。

统计数据由Overalloperresult、Overallresult,Periodresult这几个类存储，为了保存统计数据原来的Measurements，StatusThread都相应作了些调整。

6.3 预热

增加如下xml配置文件：

<?xmlversion="1.0" encoding="utf-8"?>
<Test>
<load>
    <transactionname="bulkload_concurrent" />
    <!--transactionname="bulkload" /-->
    <transactionname="singleload_concurrent" />
    <!--transactionname="singleload" /-->       
</load>
<run> 
 <transactionname="readonly_concurrent" />
 <transactionname="readheavy_concurrent" />
 <transactionname="updateheavy_concurrent" />
<transactionname="insertheavy_concurrent" />
 <transaction name="readlastest_concurrent"/>
</run>
</Test>

我们增加了如下python脚本用于连续运行：

#!/usr/bin/python
#!/bin/envpython
 
importos
importsys
importsubprocess
fromxml.etree import ElementTree
importycsb
fromycsb import (DATABASES,COMMANDS,BASE_URL,
                  get_ycsb_home, find_jars)
 
defgetloadtrans(workloadpath,root):
   load = []
   lst_node = root.find("load")
   for node in lst_node:
      load.append(workloadpath +node.attrib['name'])
   return load
 
defgetruntrans(workloadpath,root):
   run = []
   lst_node = root.find("run")
   for node in lst_node:
      run.append(workloadpath +node.attrib['name'])
   return run
 
defushelp():
   print "Usage: %s database  " % sys.argv[0]
   print "\nDatabases:"
   for db in sorted(DATABASES.keys()):
      print "    %s %s" % (db.ljust(13), BASE_URL +db.split("-")[0])
   sys.exit(1)
 
defrunscene(trans, cmd, db_classname, pervscene):
   curscene = ""
   for item in trans:
      curscene = os.path.basename(item)
      command =COMMANDS[cmd]["command"]
      options=["-s", "-P",item]
      ycsb_command = ["java","-cp", ":".join(find_jars(ycsb_home, database)), \
                      COMMANDS[cmd]["main"], "-db", db_classname] +options
      if command:
         ycsb_command.append(command)
         #print "".join(ycsb_command)
      subprocess.call(ycsb_command)
      pervscene = curscene
   return pervscene
 
iflen(sys.argv) < 2:
    ushelp()
ifsys.argv[1] not in DATABASES:
    print "ERROR: Database '%s' notfound" % sys.argv[1]
    ushelp()
 
os.chdir('..')
conffile   = os.getcwd()+"/conf/workload.xml"
resultfile= os.getcwd()+"/result/report_output.xls"
resultdir  = os.getcwd()+"/result/"
workloadsdir= os.getcwd()+"/workloads/"
 
ifFalse == os.path.exists(conffile):
   print conffile + "not exist";
   sys.exit(1)
 
root =ElementTree.parse(conffile)
loadtrans= getloadtrans(workloadsdir, root)
runtrans= getruntrans(workloadsdir, root)
 
os.chdir('bin')
ycsb_home= get_ycsb_home()
database= sys.argv[1]
db_classname= DATABASES[database]
 
runscene(loadtrans,"load", db_classname, pervscene)
runscene(runtrans,"run", db_classname, pervscene)
 
importtime
curtime=time.strftime("%Y-%m-%d_%H_%M_%S",time.localtime(time.time()))
newreportfile=resultdir+ "report_" + curtime +".xls"
os.rename(resultfile,newreportfile)

为尽量保证后续的查询、更新操作是基于前续的load操作，以保证缓存的高命中率。

6.4 数据类型

本次测试的数据皆为字符串类型：

fieldcount=10
fieldlength=10
key字段由单词"user"后面加上64位的Fowler-Noll-Vo哈希值构成
key大小为23字节
所有字段的值采用zipfian算法生成

7 附录C：SequoiaDB接口

package com.yahoo.ycsb.db;
import com.yahoo.ycsb.ByteArrayByteIterator;
import com.yahoo.ycsb.ByteIterator;
import com.yahoo.ycsb.DB;
import com.yahoo.ycsb.DBException;


import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
import java.util.Properties;
import java.util.Set;
import java.util.Vector;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;


import org.bson.BSONObject;
import org.bson.BasicBSONObject;
import org.bson.types.BasicBSONList;


import com.sequoiadb.base.SequoiadbOption;
import com.sequoiadb.base.SequoiadbDatasource;
import com.sequoiadb.base.CollectionSpace;
import com.sequoiadb.base.DBCollection;
import com.sequoiadb.base.DBCursor;
import com.sequoiadb.base.Sequoiadb;




public class SequoiaDBClient extends DB {


	/** Used to include a field in a response. */
	protected static final Integer INCLUDE = Integer.valueOf(1);


	/** The key field name */
	//private static final String KEY_FILED = "key";
	private static final String KEY_FILED   = "_id";
	private static final String DEFAULT_INSERTMODE="single";
    
	/**
	 * Count the number of times initialized to teardown on the last
	 * {@link #cleanup()}.
	 */
	private static final AtomicInteger initCount = new AtomicInteger(0);
	private static int bulknum = 0;


	/** Sequoiadb instance. */
	private static SequoiadbDatasource sdbpools = null;
	private Sequoiadb sdb = null;
  
	/** CollectionSpace instance. */
	private CollectionSpace cs = null;
	private DBCollection cl       = null;
	private static String keyfield   = null;
	private static String insertmode = null;
	private List<BSONObject> objs    = new ArrayList<BSONObject>(); 
	//private int callnumber =0;
	private static String spacename = "ycsb";
	
	//private DBCollection collection = null;


	/**
	 * Initialize any state for this DB. Called once per DB instance; there is
	 * one DB instance per client thread.
	 */
	public void init() throws DBException {
		initCount.incrementAndGet();
		synchronized (INCLUDE) {
			if (sdb != null) {
				return;
			}
			
			try{
			   if (sdbpools != null){
				   sdb = sdbpools.getConnection();
				   cs = sdb.getCollectionSpace(spacename);
				   return;
			   }
			}catch(Exception e){
				e.printStackTrace();
				return;
			}
			
			// initialize sequoiadb driver
			Properties props = getProperties();
			String host = props.getProperty("sequoiadb.host", "localhost");
			String port = props.getProperty("sequoiadb.port", "11810");
			keyfield = props.getProperty("sequoiadb.keyfield", "_id");
			int maxConnectionnum = Integer.parseInt(props.getProperty("sequoiadb.maxConnectionnum","100"));
			int maxidleconnnum = Integer.parseInt(props.getProperty("sequoiadb.maxConnectionnum","10"));
			int period = Integer.parseInt(props.getProperty("sequoiadb.maxConnectionnum","300"));


			//String 
			spacename = props.getProperty("sequoiadb.space", spacename);
			insertmode=props.getProperty("sequoiadb.insertmode", DEFAULT_INSERTMODE);
			bulknum = Integer.parseInt(props.getProperty("sequoiadb.bulknumber","5000"));
			
			try {
				SequoiadbOption sdbOption = new SequoiadbOption();
				sdbOption.setMaxConnectionNum(maxConnectionnum);
				sdbOption.setMaxIdeNum(maxidleconnnum);
				sdbOption.setRecheckCyclePeriod(period*1000);
				
				sdbpools = new SequoiadbDatasource(host+":"+port,"","",sdbOption);
				// need to append db to url.
				//sdb = new Sequoiadb(host, Integer.parseInt(port), "", "");
				sdb = sdbpools.getConnection();
				if (!sdb.isCollectionSpaceExist(spacename)) {
					cs = sdb.createCollectionSpace(spacename);
				} else {
					cs = sdb.getCollectionSpace(spacename);
				}
				System.out.println("sequoiadb connection created with " + host
						+ ":" + port);


			} catch (Exception e1) {
				System.err
						.println("Could not initialize Sequoiadb connection pool for Loader: "
								+ e1.toString());
				e1.printStackTrace();
				throw new DBException(e1.toString());
			}
		}
	}


	/**
	 * Cleanup any state for this DB. Called once per DB instance; there is one
	 * DB instance per client thread.
	 */
	public void cleanup() throws DBException {
		initCount.decrementAndGet();
		try {
			if (0 != objs.size()){
				cl.bulkInsert(objs, DBCollection.FLG_INSERT_CONTONDUP);
			}
			sdbpools.close(sdb);
		} catch (Exception e1) {
			System.err.println("Could not close Sequoiadb connection pool: "
					+ e1.toString());
			e1.printStackTrace();
			return;
		}
	}
	private List<String> getAllDataGroup(){
		// 获取数据组的数量
		List<String> groups = new ArrayList<String>();
		DBCursor cursor = sdb.getList(Sequoiadb.SDB_LIST_GROUPS, null, null, null);
		while (cursor.hasNext()){
			BSONObject obj = cursor.getNext();
			String groupname = (String)obj.get("GroupName");
			if (!groupname.equals("SYSCatalogGroup")){
				groups.add(groupname);
			}	
		}
		return groups;
	}
	
	private int getPartition(String spacename, String tablename){
		//获取源数据组
		BSONObject condition = new BasicBSONObject();
		condition.put("Name", spacename + "." + tablename);
		DBCursor cr = sdb.getSnapshot(Sequoiadb.SDB_SNAP_CATALOG, condition, null, null);
		int Partition = 0;
		while(cr.hasNext()){
			BSONObject obj = cr.getNext();
			Partition = ((Integer)obj.get("Partition")).intValue();
		}
		return Partition;
	}
	
	private String getSrcDataGroup(String spacename, String tablename){
		//获取源数据组
		BSONObject condition = new BasicBSONObject();
		condition.put("Name", spacename + "." + tablename);
		DBCursor cr = sdb.getSnapshot(Sequoiadb.SDB_SNAP_CATALOG, condition, null, null);
		String srcgroup = "";
		while(cr.hasNext()){
			BSONObject obj = cr.getNext();
			BasicBSONList catainfo = (BasicBSONList)obj.get("CataInfo");
			srcgroup=(String)((BSONObject)catainfo.get(0)).get("GroupName");
		}
		
		return srcgroup;
	}
	
	private void splitCollection(DBCollection cl, String spacename, String tablename){
		// 获取数据组的数量
		List<String> groups = getAllDataGroup();
		int Partition = getPartition(spacename, tablename);
		String srcgroup = getSrcDataGroup(spacename, tablename);
		
		int part = Partition / groups.size();
		int remainder = Partition % groups.size();
		int startpart = Partition - remainder;
		for (int i=0;i<groups.size();++i){
			//切分
			BSONObject start = new BasicBSONObject();
			start.put("Partition", i*part);
			BSONObject end = new BasicBSONObject();
			end.put("Partition", (i+1)*part);
			if (!groups.get(i).equals(srcgroup)){
				cl.split(srcgroup, groups.get(i), start,end);
				
				if (0 != remainder){
					BSONObject remainderstart = new BasicBSONObject();
					remainderstart.put("Partition", startpart);
					BSONObject remainderend = new BasicBSONObject();
					remainderend.put("Partition", startpart + 1);
					cl.split(srcgroup, groups.get(i), remainderstart,remainderend);
					--remainder;
				}
			}
		}
	}
	
	private void createCollection(String table) throws DBException {
		BSONObject options = new BasicBSONObject();
		BSONObject subobj = new BasicBSONObject();
		subobj.put(KEY_FILED, 1);
		options.put("ShardingKey", subobj);
		options.put("ShardingType", "hash");
		options.put("EnsureShardingIndex", false);
		
		cl = cs.createCollection(table, options);
		splitCollection(cl,spacename,table);
		
		if (0 != keyfield.compareTo("_id")){
			cl.createIndex("index",
				           "{" + keyfield + ":1}", true, true);
		}
	}
	
	private DBCollection getCollection(String table){
		if (sdb == null){
			try{
				sdb = sdbpools.getConnection();
			}catch(Exception e)
			{
				e.printStackTrace();
				return null;
			}
		}
		
		if (cs == null){
			try{
				cs = sdb.getCollectionSpace(spacename);
			}catch(Exception e)
			{
				e.printStackTrace();
				return null;
			}
		}
		
		if (cl == null){
			try {
				boolean bExist = cs.isCollectionExist(table);
				if (!bExist) {
					synchronized (INCLUDE) {
						if (cs.isCollectionExist(table)) {
							cl = cs.getCollection(table);
						} else {
							createCollection(table);
						}
				    }
				} else {
					cl = cs.getCollection(table);
				}
			}catch(Exception e)
			{
				e.printStackTrace();
				cl = null;
				sdbpools.close(sdb);
				sdb = null;
				return getCollection(table);
			}
		}
		return cl;
	}
	
	@Override
	public int read(String table, String key, Set<String> fields,
			HashMap<String, ByteIterator> result) {
		DBCursor cursor = null;
		DBCollection collection = null;
		try {
			collection = getCollection(table);
			if (collection == null) {
				System.out.println("Failed to get collection " + table);
			}


			BSONObject query = new BasicBSONObject().append(keyfield, key);
			BSONObject fieldsToReturn = null;
			if (fields != null) {
				fieldsToReturn = new BasicBSONObject();
				Iterator<String> iter = fields.iterator();
				while (iter.hasNext()) {
					fieldsToReturn.put(iter.next(), "");
				}
			}


			cursor = collection.query(query, fieldsToReturn, null, null);
			if (cursor != null && cursor.hasNext()) {
				HashMap<String, ByteIterator> resultMap = new HashMap<String, ByteIterator>();


				fillMap(resultMap, cursor.getNext());
				result.putAll(resultMap);
				return 0;
			} else {
				return 1;
			}
		} catch (Exception e) {
			System.err.println(e.toString());
			e.printStackTrace();
			return 1;
		} finally {
			if (cursor != null) {
				cursor.close();
			}
		}
	}


	/**
	 * TODO - Finish
	 * 
	 * @param resultMap
	 * @param obj
	 */
	@SuppressWarnings("unchecked")
	protected void fillMap(HashMap<String, ByteIterator> resultMap,
			               BSONObject obj) {
		Map<String, Object> objMap = obj.toMap();
		for (Map.Entry<String, Object> entry : objMap.entrySet()) {
			if (entry.getValue() instanceof byte[]) {
				resultMap.put(entry.getKey(), new ByteArrayByteIterator(
						(byte[]) entry.getValue()));
			}
		}
	}


	@Override
	public int scan(String table, String startkey, int recordcount,
			Set<String> fields, Vector<HashMap<String, ByteIterator>> result) {
		DBCursor cursor = null;
		try {
			DBCollection collection = getCollection(table);
			
			BSONObject scanRange = new BasicBSONObject().append("$gte",
					                     startkey);
			BSONObject query = new BasicBSONObject().append(keyfield,
					                 scanRange);
			BSONObject fieldsToReturn = null;
			if (fields != null) {
				fieldsToReturn = new BasicBSONObject();
				Iterator<String> iter = fields.iterator();
				while (iter.hasNext()) {
					fieldsToReturn.put(iter.next(), "");
				}
			}


			cursor = collection.query(query, fieldsToReturn, null, null, 0,
					                  recordcount);
			while (cursor.hasNext()) {
				// toMap() returns a Map, but result.add() expects a
				// Map<String,String>. Hence, the suppress warnings.
				HashMap<String, ByteIterator> resultMap = new HashMap<String, ByteIterator>();
				BSONObject obj = cursor.getNext();
				fillMap(resultMap, obj);
				result.add(resultMap);
			}
			return 0;
		} catch (Exception e) {
			System.err.println(e.toString());
			e.printStackTrace();
			return 1;
		} finally {
			if (cursor != null) {
				cursor.close();
			}
		}
	}


	@Override
	public int update(String table, String key,
			HashMap<String, ByteIterator> values) {
		try {
			DBCollection collection = getCollection(table);
			if (collection == null) {
				System.out.println("Failed to get collection " + table);
				return -1;
			}
			
			BSONObject query = new BasicBSONObject().append(keyfield, key);
			BSONObject update = new BasicBSONObject();
			BSONObject fieldsToSet = new BasicBSONObject();
			
			Iterator<String> keys = values.keySet().iterator();
			while (keys.hasNext()) {
				String tmpKey = keys.next();
				fieldsToSet.put(tmpKey, values.get(tmpKey).toArray());
			}
			
			update.put("$set", fieldsToSet);
			collection.update(query, update, null);
			return 0;
		} catch (Exception e) {
			System.err.println(e.toString());
			e.printStackTrace();
			return 1;
		}
	}


	@Override
	public int insert(String table, String key,
			HashMap<String, ByteIterator> values) {
		try {
			DBCollection collection = getCollection(table);
			BSONObject record = new BasicBSONObject().append(keyfield, key);
			for (String k : values.keySet()) {
				record.put(k, values.get(k).toArray());
			}
			
			if (insertmode.equals(DEFAULT_INSERTMODE)){
				collection.insert(record);
			}
			else{
				if (objs.size() != bulknum){
					objs.add(record);
				}
				
				if (objs.size() ==  bulknum){
					collection.bulkInsert(objs,DBCollection.FLG_INSERT_CONTONDUP);
					objs.clear();
				}
			}
			return 0;
		} catch (Exception e) {
			System.err.println(e.toString());
			e.printStackTrace();
			return 1;
		}
	}


	@Override
	public int delete(String table, String key) {
		try {
			DBCollection collection = getCollection(table);
			BSONObject record = new BasicBSONObject().append(keyfield, key);
			collection.delete(record);
			return 0;
		} catch (Exception e) {
			System.err.println(e.toString());
			e.printStackTrace();
			return 1;
		}
	}
	
	public static void main(String[] args){
		
		Properties props = new Properties();
		props.setProperty("sequoiadb.host", "192.168.30.63");
		props.setProperty("sequoiadb.port", "11810");
		props.setProperty("sequoiadb.space", "test");


		SequoiaDBClient client = new SequoiaDBClient();
		client.setProperties(props);
		
		try{
			client.init();
			client.getCollection("usertable");
		}catch(DBException e){
			e.printStackTrace();
		}
	}
}

你可能感兴趣的:(nosql数据库,SequoiaDB)

MongoDB 高性能应用场景与实践 AI自闭实验者 mongodb 数据库
```htmlMongoDB高性能应用场景与实践MongoDB高性能应用场景与实践随着大数据时代的到来，数据库作为数据存储和管理的核心工具，其性能和可扩展性显得尤为重要。在众多的数据库解决方案中，MongoDB凭借其灵活的数据模型、高性能和易于扩展的特点，在许多场景下成为开发者的首选。什么是MongoDB？MongoDB是一个开源的、面向文档的NoSQL数据库管理系统。它以JSON样式的文档存储数
MongoDB入门指南：从零开始掌握NoSQL数据库辗转.953 mongodb nosql 数据库
目录一、MongoDB简介（一）什么是MongoDB？（二）MongoDB的特点（三）MongoDB的应用场景二、安装MongoDB（一）安装MongoDBServer1.Windows安装2.Linux安装（以Ubuntu为例）3.macOS安装（使用Homebrew）（二）安装MongoDB客户端安装MongoDBCompass三、MongoDB基本概念（一）数据库（Database）（二）集
NoSQL保障MongoDB数据库副本集和MongoDB副本集操作覃炳文20230322027 数据库 nosql mongodb
MongoDB是一个基于文档的NoSQL数据库，它支持多种数据存储模型，包括副本集（ReplicaSets）。副本集是MongoDB的一种高可用性和数据冗余机制，它由一组MongoDB实例组成，其中包含一个主节点（Primary）和多个从节点（Secondary）。副本集的主要目的是提供数据的冗余和高可用性，确保在主节点发生故障时，从节点可以接管服务。NoSQL保障通常指的是非关系型数据库（如Mo
【软考高级系统架构论文】论NoSQL数据库技术及其应用 _Richard_ 软考高级系统架构论文 2025年软考系统架构师系统架构 nosql 数据库
论文真题随着互联网web2.0网站的兴起，传统关系数据库在应对web2.0网站，特别是超大规模和高并发的web2.0纯动态SNS网站上已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL(NotonlySQL)的产生就是为了解决大规模数据集合及多种数据类型带来的挑战，尤其是大数据应用难题。目前NoSQL数据库并没有一个统一的架构，根据其所
【IndexDB】前端IndexedDB终极指南 Vesper63 前端前端
前端IndexedDB详细教程IndexedDB是一个浏览器内置的NoSQL数据库系统，允许在客户端存储大量结构化数据，并支持高性能搜索。相比localStorage，IndexedDB更适合存储大量数据并提供更复杂的查询功能。基本概念数据库：每个源（协议+域名+端口）可以创建多个数据库对象存储（ObjectStore）：类似于数据库中的表索引（Index）：用于快速查找数据事务（Transact
【赵渝强老师】HBase的体系架构赵渝强老师 NoSQL数据库 hbase 架构数据库大数据 hadoop hdfs nosql
HBase是大表（BigTable）思想的一个具体实现。它是一个列式存储的NoSQL数据库，适合执行数据的分析和处理。简单来说，就是适合执行查询操作。从体系架构的角度看，HBase是一种主从架构，包含：HBaseHMaster、RegionServer和ZooKeeper，下图展示了这一架构。其中：HBaseHMaster负责Region的分配及数据库的创建和删除等操作。Regionserver负
时序数据管理的新维度：解析IoTDB与HBase的技术边界时序数据说 iotdb hbase 数据库时序数据库分布式开源
在物联网与工业大数据场景中，数据的时序特性对存储与计算提出了独特挑战。面对海量设备生成的高频时序数据，如何在有限的资源内实现高效写入、灵活查询与实时分析，成为企业技术选型的核心考量。本文将从架构设计、数据建模、性能表现及场景适配等角度，对比分析IoTDB与HBase的技术差异，探索时序数据库的演进方向。一、设计哲学的分野：专用时序与通用存储HBase作为经典的NoSQL数据库，以宽表模型和LSM-
浅谈NewSQL 深海科技服务行业发展数据库 ibm oracle 微软人工智能 ai 程序人生
一、什么是NewSQLNewSQL是一种现代关系型数据库管理系统(RDBMS)的统称，旨在结合传统关系型数据库的事务完整性(ACID)和SQL兼容性，以及NoSQL数据库的高可扩展性和高性能。简单来说，NewSQL就是希望在分布式环境下，既能像传统SQL数据库那样保证数据的一致性和可靠性，又能像NoSQL数据库那样处理海量数据和高并发请求。NewSQL出现的背景传统的关系型数据库（如MySQL、P
探秘基础数据库：从架构到实践的全维度解析 st0173 oracle 数据库
一、数据库基础：数据世界的底层逻辑数据库是数字化时代的“数字粮仓”，其核心使命是实现数据的高效存储、管理与检索。从本质上讲，数据库通过数据模型对现实世界进行抽象建模，常见的模型包括层次模型、网状模型和关系模型。其中，关系型数据库（如MySQL、Oracle）凭借结构化查询语言（SQL）的标准化优势，成为企业级应用的主流选择，而NoSQL数据库（如MongoDB、Redis）则以灵活的数据模型在互联
数据库——MongoDB ningmengjing_ Python爬虫基础数据库 mongodb
一、介绍1.MongoDB概述MongoDB是一款由C++语言编写的开源NoSQL数据库，采用分布式文件存储设计。作为介于关系型和非关系型数据库之间的产品，它是NoSQL数据库中最接近传统关系数据库的解决方案，同时保留了NoSQL的灵活性和扩展性。核心特性：文档导向存储：数据以类似JSON的BSON格式存储无固定表结构：不需要预先定义严格的表结构多语言支持：提供Python、Node.js、Jav
HBase实战：大数据存储技术——学习HBase数据库的应用场景和使用技巧 AI天才研究院 Python实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介1.1HBase介绍ApacheHBase是一个分布式、可扩展、高性能的NoSQL数据库。它是一个列族数据库，由Apache基金会所开发。它支持稀疏和密集存储，提供了一个高度可伸缩的系统，并能够在线地进行横向扩展。HBase提供了一个高效率的数据访问接口，可以使用SQL或JavaAPI访问HBase数据库。HBase采用了Google的BigTable设计理念，
NoSQL数据库的实时数据可视化数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 信息可视化 nosql 数据库 ai
NoSQL数据库的实时数据可视化关键词：NoSQL数据库、实时数据可视化、数据处理、前端框架、后端服务摘要：本文围绕NoSQL数据库的实时数据可视化展开深入探讨。首先介绍了NoSQL数据库和实时数据可视化的背景知识，包括目的、预期读者、文档结构和相关术语。接着阐述了核心概念与联系，通过示意图和流程图展示其架构。详细讲解了核心算法原理及具体操作步骤，结合Python代码进行说明。给出了相关数学模型和
Hbase集群部署（三个节点）河西帝王蟹 hbase zookeeper hadoop
概述HBASE–HBase–HadoopDatabase，是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库–利用HadoopHDFS作为其文件存储系统,利用HadoopMapReduce来处理HBase中的海量数据,利用Zookeeper作为其分布式协同服务–主要用来存储非结构化和半结构化的松散数据（列存NoSQL数据库）Hbase的架构图如下所示1、Client包含访问HBase的
NoSQL数据库技术详解：Redis与MongoDB的应用与实践面朝大海，春不暖，花不开 Python基础 nosql redis mongodb
文章大纲引言：NoSQL数据库的兴起与重要性随着互联网应用的飞速发展，传统关系型数据库在处理海量数据和高并发场景时逐渐显露出局限性，例如扩展性差、性能瓶颈以及对非结构化数据支持不足等问题。在这一背景下，NoSQL（NotOnlySQL）数据库应运而生，以其灵活的数据模型和强大的横向扩展能力，迅速成为现代应用开发的重要选择。NoSQL数据库摒弃了传统数据库严格的表结构设计，强调高性能、分布式架构和对
架构设计之存储高性能——非关系型数据库（NoSQL）星垣矩阵架构师系统架构 nosql 数据库架构
架构设计之存储高性能——非关系型数据库（NoSQL）1.关系型数据库的局限与NoSQL的崛起概念简介：关系型数据库（如MySQL、Oracle）使用表格结构存储数据，通过SQL语言操作。但随着互联网数据量爆炸式增长，其局限性日益凸显。NoSQL数据库应运而生，专门解决海量数据、高并发和高扩展性需求。1.1关系型数据库的架构瓶颈关系型数据库在过去的四十年中一直是企业应用的基石，但随着互联网时代的到来
HBase 架构与数据模型深度解析北漂老男人 HBase hbase 架构数据库学习方法
HBase架构与数据模型深度解析一、前言在大数据时代，HBase以其高扩展性和实时读写能力，成为电商、金融、物联网等行业的核心NoSQL数据库。本文将系统梳理HBase的架构、数据模型、底层原理与最佳实践，助你“知其然，亦知其所以然”。二、HBase架构全景图+-------------------++----------------------+|Client||REST/Thrift|+---
Java面试——Redis 安生安身 java 面试 redis
题目来自于网络收集，自己保存学习，希望也能帮助到你Redis什么是redis远程字典服务，是一种基于键值对的NoSQL数据库，redis会将所有的数据存放在内存中（掉电数据会被清空），读取速度非常快。特性：基于键值对、读写速度快、数据结构丰富、简单稳定、支持持久化、支持事务（原子性）、主从复制、高可用与分布式。为什么说redis的速度特别快呢Redis中所有的数据都是存储在内存中，CPU对内存的访
后端使用Spring Data Cassandra的常见问题及解决后端开发笔记 C spring java 后端 ai
后端使用SpringDataCassandra的常见问题及解决关键词：SpringDataCassandra、NoSQL数据库、数据建模、分页查询、性能优化、异常处理、连接配置摘要：本文以SpringDataCassandra的实际开发场景为背景，系统梳理了后端开发者最常遇到的8大核心问题（连接配置、数据建模、分页查询等），结合生活案例和代码示例，一步一步拆解问题现象、根因分析和解决方案。无论是刚
使用Redis作为缓存，提高MongoDB的读写速度
在现代Web应用中，随着数据量和访问量的增长，数据库性能常常成为系统瓶颈。MongoDB作为NoSQL数据库，虽然具备高扩展性和灵活性，但在某些读密集型场景下仍可能遇到性能问题。本文将介绍如何使用Redis作为缓存层来显著提升MongoDB的读写性能，包括架构设计、详细设计、Python关键代码实现和测试用例。此Redis缓存方案在典型场景下可提升读性能10-50倍，降低MongoDB负载70%以
深入解析主流数据库体系架构：从关系型到云原生洋洋喜欢喝水数据库架构云原生
数据库是现代信息系统的核心组件，其体系架构设计直接影响性能、扩展性和可靠性。本文将从传统关系型数据库到新兴云原生数据库，系统解析主流数据库的架构特点及适用场景。目录一、关系型数据库（RDBMS）架构典型代表：MySQL、Oracle、PostgreSQL二、NoSQL数据库架构典型代表：MongoDB（文档型）、Cassandra（宽列存储）、Redis（键值型）三、分布式数据库（NewSQL）架
Hbase 蓝色的猴子 hbase 数据库大数据
HBASEhbase是一个分布式的基于列式存储Nosql数据库，基于Hadoop的hdfs存储，zookeeper进行管理；适合存储半结构化或者非结构话数据，1.hbase的原理？hbase主要是通过LSM－tree算法，是将一个大树拆封为多个小树，在内存中将一个个小树进行合并，当小树进行合并，当到达一定数量，就会刷新到磁盘中，磁盘中数据合并到一定程度就会变成Hfile。2.hbase的写过程？H
mongodb 压缩级别佩芬霁杭 mongodb 数据库
我整理的一些关于【数据】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1MongoDB压缩级别实现指南MongoDB是一个面向文档的NoSQL数据库，随其存储大量数据，可以自定义数据压缩，以降低存储需求和提高性能。本文将指导你如何在MongoDB中设置压缩级别。我们将通过一个有序的流程来阐明如何设置压缩级别，包括每一步所需的代码及相关解释。
【NoSQL数据库】Redis Cluster集群（含redis集群扩容脚本）划过手的泪滴t Redis 云计算运维 Shell语言学堂 redis 数据库缓存 nosql 云计算
RedisCluster集群RedisClusterRedis分布式扩展之RedisCluster方案功能数据如何进行存储redis集群架构集群伸缩向集群中添加一个新的master节点，并向其中存储num=10.脚本对redis集群扩容缩容，脚本参数为redis集群，固定从6001移动2000个哈希槽到新实例上故障转移集群总线Redis性能管理查看Redis内存使用内存碎片率内存使用率内存回收ke
Redis高并发问题的解决重庆千锋 Java技术编程程序 IT行业
redis为什么会有高并发问题redis的出身决定redis是一种单线程机制的nosql数据库，基于key-value，数据可持久化落盘。由于单线程所以redis本身并没有锁的概念，多个客户端连接并不存在竞争关系，但是利用jedis等客户端对redis进行并发访问时会出现问题。发生连接超时、数据转换错误、阻塞、客户端关闭连接等问题，这些问题均是由于客户端连接混乱造成。同时，单线程的天性决定，高并发
软考-系统架构设计师-第八章数据库设计基础知识谷新龙001 系统架构数据库性能优化软考系统架构设计师
数据库设计基础知识8.1数据库基础概念8.2关系数据库8.3数据库设计8.4应用程序与数据库交互NoSQL数据库8.6分布式数据库8.7数据库优化技术8.8分布式缓存技术Redis8.1数据库基础概念数据模型数据模型三要素：数据结构、数据操作、数据的约束条件。其中数据的约束条件包括：实体完整性、参照完整性、用户自定义完整性。数据库三级模式两级映像数据库一般采用三级模式，体系结构如下图，系统开发人员
MongoDB必知必会 gomongodb
MongoDB的知识点梳理，内容有chatgpt4.1辅助完成，使用的提示词（文章大致内容）如下,可按需“食用”:mongodb定义关键概念如何增删改查如何持久化如何用go语言操作他是否支持事务，如果是实现原理，他相对于mysql他存储数据的底层逻辑是？1.MongoDB定义MongoDB是一个开源的、面向文档的NoSQL数据库，以高性能、高可用、易扩展著称。它用BSON（一种类JSON的二进制格
MongoDB 安全机制详解：全方位保障数据安全 vvilkin的学习备忘数据库 #mongoDB mongodb 安全数据库
在当今数据驱动的时代，数据库安全至关重要。MongoDB作为一款流行的NoSQL数据库，广泛应用于Web应用、大数据分析和物联网等领域。然而，随着MongoDB的普及，其安全性也面临诸多挑战，如未授权访问、数据泄露和注入攻击等。因此，合理配置MongoDB的安全机制，是保障企业数据安全的关键。本文将深入探讨MongoDB的安全机制，涵盖认证、授权、加密、审计和网络安全等多个方面，并提供最佳实践建议
[Redis] 认识NoSQL和Redis Demisse Redis redis nosql 数据库
初次学习，如有错误还请指正目录认识NoSQL结构化与非结构化关联和非关联查询方式事务总结认识Redis特征redis数据结构介绍Redis是一种键值型的NoSQL数据库，这里面有两个关键字：key-value其中键值型，是指Redis中存储的数据是以key.value对的形式存储，而value的形式多种多样，可以是字符串、数值甚至是json。NoSQL则是相对于传统关系型数据库而言有很大差异的一种
MongoDB 备份与恢复策略全面指南：保障数据安全的完整方案 vvilkin的学习备忘数据库 #mongoDB mongodb 数据库
在当今数据驱动的商业环境中，数据库已成为企业最宝贵的资产之一。MongoDB作为最流行的NoSQL数据库，因其灵活的数据模型和高性能而广受欢迎。然而，无论技术多么先进，数据丢失的风险始终存在——硬件故障、人为错误、恶意攻击或自然灾害都可能导致灾难性后果。本文将深入探讨MongoDB备份与恢复的完整策略，帮助您构建可靠的数据安全网。第一部分：理解MongoDB数据风险1.1常见数据丢失场景在制定备份
01-Redis Spring Boot中整合Redis 李鑫海。 redis spring 数据库
Redis一个使用C语言编写的key-value的数据库，也被称作NoSQL数据库。用于高速缓存数据，存放在内存中。5种数据类型stringlistsetsortedsethashjedis的使用其中的Jedis类用于访问Redis服务器，可以与Server建立连接并发送命令//建立Redis的操作对象Jedisjedis=newJedis("192.168.12.39","6379");//密码
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj