xiannvlei

Rocksdb参数调优指南

本指南的目的是提供你足够的信息用于根据自己的工作负载和系统配置调优RocksDB。

RocksDB非常灵活，这有好也有坏。你可以真多很多工作场景和存储技术进行调优。在Facebook，我们使用相同的代码跑内存工作压力，闪盘设备和机械硬盘。然而，灵活性不总是对用户友好的。我们引入了大量的调优参数，让人疑惑不解。我们希望这个指南会帮助你压榨你的系统的最后一滴性能并且完全利用你的资源。

我们假设你有一定的基础知识，了解LSM工作原理。关于LSM的资源非常多，不需要再写一个了。

放大因子

调优RocksDB通常就是在三个放大因子间做权衡：写放大，读放大，和空间放大。

写放大是写入磁盘的数据与写入数据库的字节数的比。

例如，如果你写入 10MS/s 到数据库，然后你观察到硬盘写速度为30MB/s，你的写放大为3.如果写放大很高，工作负载的瓶颈可能在磁盘吞吐。比如，如果写放大是50，而磁盘吞吐是500MB/s，你的数据库只能达到10MB/s的写速度。在这种情况下，减少写放大会直接增加最大写速率。

高写放大同时减少闪存使用寿命。有两个方式你可以观察到写放大。第一个方式是读取DB::GetProperty(“rocksdb.stats”, &stats)的输出。第二个是使用你的DB写速率除以你的磁盘写带宽。

读放大是每秒磁盘读的数量。如果你需要读5个页来响应一个查询，读放大就是5。逻辑读是从缓存得到的数据，要么从Rocksdb的块缓存，要么从OS的文件缓存。物理读通过存储设备，闪存或者硬盘，处理。逻辑读比物理读便宜很多，但是会导致CPU开销。你也可以通过iostat的输出估算读放大，但是这个结果包含了查询和压缩的读。

空间放大是数据库磁盘上的文件的大小和数据大小的比。如果你Put 10MB的数据到数据库，它使用了100MB的磁盘，那么空间放大为10.你通常希望设置一个硬性限制给空间放大，这样你就不会吧磁盘空间或者内存用光了。

为了了解这三个放大因子在不同数据库算法下的情况，我们强烈推荐Mark Callaghan关于高并发的演讲

Rocksdb统计

当调试性能的时候，有一些工具可以帮助到你：

statistics —— 把这个设置给rocksdb::CreateDBStatistics()。任何时候，通过调用options.statistics.ToString()，你可以得到一个人类可读的Rocksdb统计信息。参考统计了解更多信息。

stats_dump_period_sec ——我们每stats_dump_period_sec秒就会把统计信息导出到日志文件。默认为600，意味着每10分钟导出一次。你可以在应用里调用db->GetProperty(“rocksdb.stats”)得到相同的数据。

每db->GetProperty(“rocksdb.stats”)，你会在日志文件里找到这样的数据：

** Compaction Stats **
Level Files  Size(MB) Score Read(GB)  Rn(GB) Rnp1(GB) Write(GB) Wnew(GB) Moved(GB) W-Amp Rd(MB/s) Wr(MB/s) Comp(sec) Comp(cnt) Avg(sec) Stall(sec) Stall(cnt) Avg(ms)     KeyIn   KeyDrop
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
L0      2/0        15   0.5     0.0     0.0      0.0      32.8     32.8       0.0   0.0      0.0     23.0    1457      4346    0.335       0.00          0    0.00             0        0
L1     22/0       125   1.0   163.7    32.8    130.9     165.5     34.6       0.0   5.1     25.6     25.9    6549      1086    6.031       0.00          0    0.00    1287667342        0
L2    227/0      1276   1.0   262.7    34.4    228.4     262.7     34.3       0.1   7.6     26.0     26.0   10344      4137    2.500       0.00          0    0.00    1023585700        0
L3   1634/0     12794   1.0   259.7    31.7    228.1     254.1     26.1       1.5   8.0     20.8     20.4   12787      3758    3.403       0.00          0    0.00    1128138363        0
L4   1819/0     15132   0.1     3.9     2.0      2.0       3.6      1.6      13.1   1.8     20.1     18.4     201       206    0.974       0.00          0    0.00      91486994        0
Sum  3704/0     29342   0.0   690.1   100.8    589.3     718.7    129.4      14.8  21.9     22.5     23.5   31338     13533    2.316       0.00          0    0.00    3530878399        0
Int     0/0         0   0.0     2.1     0.3      1.8       2.2      0.4       0.0  24.3     24.0     24.9      91        42    2.164       0.00          0    0.00      11718977        0
Flush(GB): accumulative 32.786, interval 0.091
Stalls(secs): 0.000 level0_slowdown, 0.000 level0_numfiles, 0.000 memtable_compaction, 0.000 leveln_slowdown_soft, 0.000 leveln_slowdown_hard
Stalls(count): 0 level0_slowdown, 0 level0_numfiles, 0 memtable_compaction, 0 leveln_slowdown_soft, 0 leveln_slowdown_hard

** DB Stats **
Uptime(secs): 128748.3 total, 300.1 interval
Cumulative writes: 1288457363 writes, 14173030838 keys, 357293118 batches, 3.6 writes per batch, 3055.92 GB user ingest, stall micros: 7067721262
Cumulative WAL: 1251702527 writes, 357293117 syncs, 3.50 writes per sync, 3055.92 GB written
Interval writes: 3621943 writes, 39841373 keys, 1013611 batches, 3.6 writes per batch, 8797.4 MB user ingest, stall micros: 112418835
Interval WAL: 3511027 writes, 1013611 syncs, 3.46 writes per sync, 8.59 MB written

压缩信息

在level N和level N+1之间执行的压缩流程的压缩信息会在level N+1处（输出层）进行汇报。这里是一个快速参考：

level —— leveled压缩在LSM中的层。对于universal压缩，所有文件都在L0.Sum有所有层的数据的和。Int类似于Sum但是只限于从上一次汇报之后的间隔之间的数据。
Files —— 他有两个如(a/b)的数值。第一个数字是这一层的文件数量。第二个是当前该层正在进行压缩的文件的数量。
Score —— 除了L0之外的层，score是（当前层大小）/(最大层大小)。值为0或者1都是正常的，但是如果值大于1，意味着这个层需要被压缩。对于L0，score根据当前文件的数量和触发压缩的文件数量来计算。
Read(GB) —— 在level N和level N+1之间压缩的时候读取的总字节数。这包括了从level N和level N+1读取的数据。
Rn(GB)：在level N和level N+1之间压缩的时候，从Level N读取的字节数。
Rnp1(GB)：在level N和level N+1之间压缩的时候，从Level N+1读取的字节数。
Write(GB)：在level N和level N+1之间压缩的时候写出的总字节数。
Wnew(GB)：写到level N+1的新字节数，计算方式为：(写到N+1的总字节数) - (与level N 压缩的时候，从N+1读取的字节数)
Moved(GB)：压缩期间移动到Level N+1的字节数。这个场景下，没有任何IO发生，除了更新manifest以指示原本在level X的文件，现在在level Y了以外。
W-Amp：（写入到LevelN+1的总字节数） / (从levelN读取的字节数)。这是从Level N到Level N+1的写放大
Rd(MB/s)：从Level N和level N+1读取的数据的速度。通过 (Read(GB) * 1024) / 压缩时间计算得到。
Wr(MB/s)：从Level N和level N+1写数据的速度。参考Rd(MB/s)。
Rn(cnt)：在level N和level N+1之间压缩的时候，从Level N读取的总文件数量。
Rnp1(cnt)：在level N和level N+1之间压缩的时候，从Level N+1读取的总文件数量。
Wnp1(cnt)：在level N和level N+1之间压缩的时候，写入Level N+1的文件数量。
Wnew(cnt)：(Wnp1(cnt) - Rnp1(cnt)) —— 作为level N和level N+1之间压缩的结果，增加的文件的数量。
Comp(sec)：在level N和level N+1之间压缩花费的总时间
Comp(cnt)：在level N和level N+1之间压缩发生的压缩次数
Avg(sec)：在level N和level N+1之间压缩，每次压缩的平均时间。
Stall(sec)：由于level N+1没有被压缩（压缩score很高）而导致的写失速总时间。
Stall(cnt)：由于level N+1没有被压缩而导致的写失速总次数。
Avg(ms)：由于level N+1没有被压缩而导致的写失速的平均时间，单位毫秒。
KeyIn：压缩过程中压缩的key的数量
KeyDrop：压缩过程中丢弃的key（没有被写出）的数量。

通用信息

每层的压缩信息之后，我们同时输出一些通用信息。通用信息会报告累计信息和间隔信息。累计信息报告从Rocksdb实例打开到现在的总数据。间隔信息报告从上一次信息输出到现在的间隔中间的信息。

Uptime(secs) ： total —— 这个实例跑的时间。interval —— 上次信息导出之后过了多少秒。
Cumulative/Interval writes：total —— Put调用数量；keys —— Put调用中，WriteBatches 的项目量；batches —— 群提交的数量，每个群提交持久化一个或者多个Put调用（他们并行发生，一个时间点会有一个以上的Put调用被持久化）；per batch —— 一个batch的字节数的平均数量；ingest —— 写入DB的总字节数（不计算压缩）；stall micro —— 由于压缩落后导致的写失速的微秒时间。
Cumulative/Interval WAL：writes —— 记录在WAL的写数量；syncs —— fsync或者fdatasync被调用的次数；write per sync —— 写数量和sync的比例；GB written —— 写入WAL的GB数量。
Stalls：从开始到现在，所有写失速类型导致的写失速的总时间，单位秒：level0_slowdown —— 由于level0_slowdown_writes_trigger导致的写失速。level0_numfiles —— 由于level0_stop_writes_trigger导致的写失速。memtable_compaction —— 由于所有metable都写满导致的写失速，落盘速度跟不上。leveln_slowdown —— 由于soft_rate_limit和hard_rate_limit导致的写失速。

性能上下文和IO信息上下文

性能上下文和IO信息上下文可以帮助我们了解一个特定查询的情况。

并发选项

在LSM架构，有两个后台线程：落盘和压缩。两个都可以通过线程并行执行，以发挥存储技术的并行性能。落盘线程在高优先池，而压缩线程在低优先池。为了增加每个池的线程数，可以调用

 options.env->SetBackgroundThreads(num_threads, Env::Priority::HIGH);
 options.env->SetBackgroundThreads(num_threads, Env::Priority::LOW);

为了从更多的线程获得收益，你可能需要修改并行压缩的压缩和落盘线程为最大数量：

max_background_compactions为后台压缩的最大线程数。默认为1，但是为了完全利用CPU和存储，你可能会希望增加这个到接近系统的核的数量。

max_background_flushes为落盘并发数。通常设置为1就足够了。

通用选项。

filter_policy —— 如果你需要做点查询你一定希望打开bloom过滤器。我们使用bloom过滤器来避免不必要的磁盘访问。你应该把filter_policy赋值给rocksdb::NewBloomFilterPolicy(bits_per_key)。默认bits_per_key 为10，带来袋盖1%的假阳性率。更大的bits_per_key会降低假阳性率，但是增加内存使用和空间放大。

block_cache —— 我们通常推荐把这个设置赋值给rocksdb::NewLRUCache(cache_capacity, shard_bits)的结果。块缓存缓存了未压缩的块。另一方面，OS缓存，缓存了压缩了的块（因为他们是以这种方式存储在文件的）。因此，同时使用block_cache和OS缓存是合理的。我们需要对块缓存的访问上锁，并且有时候我们看到RockDB在块缓存互斥锁上有瓶颈，特别是当DB的大小小于RAM的时候。在这种情况，设置shard_bits为一个更大的数字，把块缓存分片就很合理了。如果shard_bits为4，分片数量为16。

allow_os_buffer —— 如果为false，我们不会把文件缓存在OS的缓存。查看上面的注释。

max_open_files —— RocksDB会保存所有文件描述符到一个表缓存。如果文件描述符的数量超过了max_open_files，一些文件会从表缓存中被淘汰，并且他们的文件描述符会被关闭。这意味着每个读取必须遍历表缓存以找到他需要的文件。设置max_open_files为-1以永远允许打开文件，可以避免昂贵的表缓存调用。

table_cache_numshardbits —— 这个选项控制表缓存分片。如果表缓存互斥锁竞争激烈，增加这个。

block_size —— RocksDB把用户数据打包到块里。当尝试从一个表文件一个键值对的时候，一个块项目会被载入内存。块大小默认为4KB。每个表文件包含一个索引，罗列了所有块的偏移。增加block_size意味着索引会包含更少的项（因为每个文件的块少了），因此索引会更小。增加block_size会减少内存使用，和空间放大，但是会带来读放大。

缓存分片和线程池

有时候你可能希望在一个进程里跑多个RocksDB实例。RocksDB提供一个方式让这些实例共享块缓存和线程池。为了共享块缓存，给所有实例赋值同一个缓存对象。

first_instance_options.block_cache = second_instance_options.block_cache = rocksdb::NewLRUCache(1GB)

这会是两个实例共享一个1GB的块缓存。

线程池与Env对象结合。当你构造Options的时候，options.env被设置为Env::Default()，通常情况下这都是最好的。由于所有的Options使用同一个静态对象Env::Default()，线程池默认就是共享的。参考并发选项以了解如何设置线程池的线程数量。这样，你可以设置最大并行运行的压缩和落盘，即使运行多个RocksDB实例。

落盘选项

所有写入到RocksDB的都是先插入一个名为memtable的内存数据结构。一旦活跃的memtable满了，我们创建一个新的，然后标记旧的为只读。我们成只读的memtable为不可修改。在任何时候，都刚好只有一个活跃的memtable，然后又0个或者更多的不可修改memtable。不可修改memtable总是等待被落盘到存储。有三个选项控制落盘行为。

write_buffer_size 设置一个单独memtable的大小。一旦memtable超过这个大小，他就会被标记为不可修改并且一个新的会被创建。

max_write_buffer_number设置memtable的最大数量，活跃和不可修改加在一起。如果活跃memtable填满了，然后总memtable的数量大于max_write_buffer_number，我们会让后续的写入失速。在落盘进程慢于写入速度的时候，就会发生。

min_write_buffer_number_to_merge是落盘前需要合并的memtable的最小数量。例如，如果选项设置为2，不可修改memtable只会在有两个的时候落盘 —— 一个单一的不可修改memtable绝对不会落盘。如果多个memtable被合并到一起，会有更少的数据被写入存储，因为两个更新被合并到一个单独的key。然而，每个Get()必须线性遍历所有不可修改的memtable已检查是否有key存在。把这个值设置的太高可能会伤害性能。

例子：选项为：

write_buffer_size = 512MB;
max_write_buffer_number = 5;
min_write_buffer_number_to_merge = 2;

如果写入速率为16MB/s。在这个例子，一个新的memtable会每32秒创建一次，然后两个memtable会被合并到一起然后每64秒落盘一次。根据工作集合的大小，落盘大小会在512MB到1GB之间。为了防止落盘无法跟上写速度，memtable使用的内存大小被限制为 5*512MB = 2.5GB。当这个值达到了，后续写入会被拦截，知道落盘结束，并且memtable使用的内存被释放。

Level风格压缩

在Level风格压缩，数据库文件按层组织。memtable被落盘到level 0的文件，那里包含了最新的数据。更高层包含更老的数据。level 0 的文件会有交叉，但是在level 1 和更高的没有交叉。结果，Get通常需要检查level 0的每个文件，但是对于后续的层，不会超过一个文件包含这个key。每个层都10倍（这个因数是可配置的）大于之前一层。

一次压缩可能携带一些在level N的文件，然后与level N+1的有交叉的文件进行压缩。两个在不同层的压缩操作或者不同key范围的操作可以相互独立进行或者并发进行。压缩速度直接与最大写速率成比例。如果压缩不能跟上写速率，数据库使用的空间会持续增长。以这种方式配置RocksDB使他能以高并发执行压缩，完全利用存储的性能非常重要。

Level 0 和 1 的压缩有点取巧。level 0 的文件通常覆盖整个key空间。当压缩L0 -> L1（从level 0 到 level 1），压缩包含所有Level 1的文件。将所有L1的文件与L0压缩，则L1 -> L2的压缩无法同时进行；他必须等到L0 -> L1 的压缩结束。如果 L0 -> L1压缩很慢，他会变成系统内大部分时间里唯一运行的压缩，因为其他的压缩必须等待他完成。

L0 -> L1 压缩同样是单线程的。很难在单线程压缩中得到一个好的吞吐。为了检查是不是这里出了问题，检查磁盘利用率。如果磁盘不是完全被利用起来，可能压缩配置有问题。我们通常推荐通过设置L0跟L1的大小差不多 以达到尽快完成L0 -> L1压缩的目的。

一旦你决定了Level 1 的合适大小，你必须决定层乘数因子。假设你的level 1大小为512MB，层乘数因子为10，并且数据库的大小为500GB。Level 2 的大小就是5GB，level 3 51GB，level 4 512GB。因为你的数据库大小为500GB，level 5以及更高的层会是空的。

空间放大很好计算。为(512 MB + 512 MB + 5GB + 51GB + 512GB) / (500GB) = 1.14。这里是我们如何计算写放大：每个字节先会写到Level 0。之后被压缩到Level 1.因为Level 1的大小跟Level 0 相同，从L0 -> L1压缩的写放大为 2。然而，当一个从Level 1 来的字节压缩到Level 2的时候，他与level 2的10个byte压缩（因为level 2 是10x倍大）。L2 -> L3和L3 -> L4也是一样。

因此，总写放大接近 1 + 2 + 10 + 10 + 10 = 33。点查询必须查询level 0 的所有文件然后每一层最多查询一次。然而，bloom过滤器可以帮我们极大减少读放大。不过，短期存活的区间扫描会有点昂贵。Bloom过滤器在区间扫描的时候没什么用，所以读放大为number_of_level0_files + number_of_non_empty_levels。

现在我们深入探讨控制level压缩的选项。我们会从更重要的开始。

level0_file_num_compaction_trigger —— 一旦level 0 的文件数量达到这个值，L0->L1压缩就会触发。我们可以这样估算level 0在稳定状态的大小：write_buffer_size * min_write_buffer_number_to_merge * level0_file_num_compaction_trigger。

max_bytes_for_level_base和max_bytes_for_level_multiplier —— max_bytes_for_level_base是一个Level 1的总大小。就如之前说的，我们推荐这个跟level 0的大小接近。每个后续层为max_bytes_for_level_multiplier倍于前一个。默认为10，我们不推荐修改他。

target_file_size_base 和 target_file_size_multiplier —— 在level 1的文件大小为target_file_size_base字节。每下一层的文件大小会是target_file_size_multiplier倍大于前一层。然而，默认target_file_size_multiplier为1，所以每一层文件的大小都一样大，这通常是个好事。我们推荐设置target_file_size_base为max_bytes_for_level_base/10，这样我们在level 1就有10个文件。

compression_per_level —— 使用这个选项来设置不同层的压缩风格。通常我们不压缩level 0 和level 1，值在更高的层压缩数据。你甚至可以再最高层设置最慢的压缩算法，在最底层设置更快的压缩算法（最高层为Lmax）。

num_levels —— num_levels比预期的数据库的层数高是安全的。一些更高的层会是空的，但是这不会影响数据库的性能。只有当你希望你的层数大于7（默认值）的时候才修改这个选项。

Universal压缩

level风格压缩在某些场景会有很高的写放大。对于写多的场景，你可能会因为磁盘推图而遇到瓶颈。为了优化这些场景，RocksDB引入了一个新的压缩风格，我们称之为Universal压缩，希望减少写放大。然而，这可能增加读放大，并且总是增加空间放大。Universal压缩有大小限制。当你的DB（或者列族）大于100GB的时候，请注意。参考Universal压缩了解细节。

使用universal压缩，一个压缩流程可能张女士增加2的空间放大。换句话说，如果你存储10GB的数据在数据库，压缩过程会消耗额外的10GB，还要加入额外的空间放大。

然而，当有技术可以帮助我们减少临时的内存翻倍。如果你使用universal压缩，我们强烈你分片数据，并且放置在多个RocksDB实例。假设你有S个分片。然后配置Env线程池，只使用N个压缩线程。只有N个分片，S个线程会有额外的空间放大，因此得到N/S的额外放大，而不是1。例如，如果你的DB是10GB，并且你配置100个分片，每个分片会有100MB的数据。如果你配置你的线程池为20个并发压缩，你会只需要额外的2GB数据，而不是10GB。同事，压缩会并行执行，可以完全利用你的存储并发性能。

max_size_amplification_percent —— 大小放大，定义为存储数据库一个byte数据额外需要的存储（百分比）。默认为200，意味着一个100byte的数据库可以获取300byte的存储空间。300byte中的200 byte只在压缩过程中暂时用到。增加这个限制减小写放大，但是（显然）增加空间放大。

compression_size_percent —— 数据库中压缩的数据的比例。较老的数据会被压缩，更新的数据不会被压缩。如果设置为-1（默认），所有数据都会被压缩。减小compression_size_percent会减少CPU使用率，增加空间放大。

参考Universal压缩了解更多信息

写失速

参考写失速了解更多细节

前缀数据库

RocksDB保持所有排序号并且支持顺序迭代。然而，有些应用不需要key为完全排序。他们只关心一个固定前缀的key的排序。

这些应用可以从prefix_extractor中得到好处。

prefix_extractor —— 一个SliceTransform对象，定义key前缀。key前缀之后被用于实现一些有趣的优化：

定义bloom过滤器，可以减少前缀区间查询的读放大（比如，给我所有以前缀XXX开头的key）。确保定义Options::filter_policy。

使用基于哈希表的memtable以避免memtable里二分搜索的开销。

给表文件增加哈希索引以避免表文件中二分搜索的开销。对于(2)和(3)的细节，参考自定义memtable和表工厂。请注意，(1)通常已经降低足够的IO了。（2）和（3）可以在某些场景降低CPU开销，并且通常带来一些内存开销。你应该只在CPU为你的瓶颈，并且没有其他更简单的调优手段的时候尝试他们，毕竟这不是通用尝试。确保查看了include/rocksdb/options.h中的关于prefix_extractor的注释。

Bloom过滤器

Bloom过滤器是基于可能性的数据结构，用于检测一个元素是不是存在于一个结合中。RocksDB中的Bloom过滤器通过一个名为filter_polic的选项控制。当一个用户调用Get(key)，会有一个文件列表，可能包含这个key。通常是Level 0的所有文件，以及大于0的每一层中的一个文件。然而，在我们读取每个文件前，我们先咨询bloom过滤器。Bloom过滤器会过滤掉大部分不包含该key的文件的读取。在大多数时候，Get通常只会做一次文件读取。Bloom过滤器总是保持在内存中，以方便打开文件，除非BlockBasedTableOptions::cache_index_and_filter_blocks为true。打开的文件的数量通过max_open_files选项控制。

有两个bloom过滤器类型：基于块的，和全过滤。

基于块的过滤器

通过调用一下接口使用基于块的过滤器：

options.filter_policy.reset(rocksdb::NewBloomFilterPolicy(10, true))

基于块的bloom过滤器是根据每个块分别建立的。在一个读取中，我们先咨询一个索引，返回我们正在找的块。现在我们有一个块了，我们咨询bloom过滤器来过滤这个块。

全过滤

通过一下调用设置全过滤：

options.filter_policy.reset(rocksdb::NewBloomFilterPolicy(10, false))

全过滤针对每个文件构建。每个文件只有一个bloom过滤器，这意味着我们可以先查询bloom过滤器，而不用查询索引。如果key不在bloom过滤器，相比基于块的过滤器，我们省略一个索引搜索。

全过滤可以进一步分片 : 分片过滤

自定义memtable和表格式

高级用户可以配置自定义的memtable和表格式

memtable_factory —— 定义memtable。这里是我们支持的memtable：

SkipList —— 默认的memtable
HashSkipList —— 只能与prefix_extractor工作。他把key放入基于key前缀的桶中。每个桶是一个skiplist。
HashLinkedList —— 只能与prefix_extractor工作。他把key放入基于key前缀的桶中。每个桶是一个linked list。

table_factory —— 定义表格式。这里是我们支持的表格式：

基于块 —— 这是默认的表。适合于磁盘和闪盘上排序好的数据。他根据块的大小分块定位和加载（参考block_size选项）。因此成为基于块。
平表 —— 只能与prefix_extractor一起工作。适用于在内存中排序好的数据（在tmpfs文件系统）。可以按byte定位。

内存使用

为了了解rocksdb是如何使用内存的，参考另一个wiki页内存使用

机械硬盘的差异

在机械硬盘上，内存/持久化存储速比率常会低很多。如果数据和RAM的比率如果比较大，那么你可以减少对性能要求很高的数据需要的内存，以保证重要的数据在RAM。建议：

使用相对更大的块大小以减少索引块的大小。你应该使用至少64KB的块大小。你可以考虑256KB甚至512KB。使用大块带来的问题是RAM被块缓存浪费了。
打开BlockBasedTableOptions.cache_index_and_filter_blocks=true因为通常你不能把所有索引和bloom过滤器放入内存。即使你可以，也可以为了安全起见，打开这个。
打开options.optimize_filters_for_hits以减少一些bloom过滤器块大小。
小心确保你有足够的内存来保存所有的bloom过滤器。如果你不能，那么bloom过滤器可能会损害性能。
尝试尽量紧凑的key编码。更短的key可以减小索引块大小。

与闪存相比，机械硬盘通常提供更低的随机读吞吐。

设置options.skip_stats_update_on_db_open=true以加快DB打开时间。
这是一个有争议的建议：使用基于level的压缩，因为他对于减少磁盘读更友好
如果你使用基于level的压缩，使用options.level_compaction_dynamic_level_bytes=true。
如果服务器有多个硬盘，设置options.max_file_opening_threads为一个大于1的值。

随机读和序列化读的吞吐量差在机械磁盘上会比较大。建议：

为压缩的输入，打开RocksDB层的预读取：options.compaction_readahead_size和options.new_table_reader_for_compaction_inputs=true
使用相对大文件尺寸，我们推荐至少256MB。
使用相对大的块大小。

机械磁盘通常比闪存大：

为了避免过多的文件描述符，使用更大的文件。我们推荐文件大小至少256MB。
如果你使用universal风格压缩，不要令单个DB大小太大，因为全压缩会花费大量时间，并且影响性能。你可以使用更多的DB实例，单个DB的大小应该小于500GB。

示例配置

在这一节，我们会展现一些我们在生产环境上的RocksDB配置。

闪存上的前缀数据库

这个服务使用RocksDB来实现前缀区间搜索和点查询。在闪存上运行。

 options.prefix_extractor.reset(new CustomPrefixExtractor());

由于服务不需要读完整的顺序迭代（参考前缀数据库），我们定义前缀提取器。

rocksdb::BlockBasedTableOptions table_options;
 table_options.index_type = rocksdb::BlockBasedTableOptions::kHashSearch;
 table_options.block_size = 4 * 1024;
 options.table_factory.reset(NewBlockBasedTableFactory(table_options));

我们在表文件中使用一个哈希索引以加快前缀查找，但是这增加存储空间和内存使用。

 options.compression = rocksdb::kLZ4Compression;

LZ4压缩减少了CPU使用，但是增加存储空间。

 options.max_open_files = -1;

这个设定关闭在表缓存中搜索文件，因此加快所有查询。如果你的服务的打开文件数非常高，这总是一个好的设定。

 options.options.compaction_style = kCompactionStyleLevel;
 options.level0_file_num_compaction_trigger = 10;
 options.level0_slowdown_writes_trigger = 20;
 options.level0_stop_writes_trigger = 40;
 options.write_buffer_size = 64 * 1024 * 1024;
 options.target_file_size_base = 64 * 1024 * 1024;
 options.max_bytes_for_level_base = 512 * 1024 * 1024;

我们使用level风格的压缩。Memtable的大小为64MB并且周期性落盘到Level 0.压缩 L0 -> L1在Level 0 有 10个文件的时候触发（总共640MB）。当L0有640MB，压缩触发，压入L1，最大的大小是512MB，总DB大小？？？

 options.max_background_compactions = 1
 options.max_background_flushes = 1

任何时候，只能有1个并发压缩和1个落盘线程在进行。然而，系统有多个分片，所以在不同分片会有多个压缩。否则，只有两个线程往存储写入数据，利用率很低。

 options.memtable_prefix_bloom_bits = 1024 * 1024 * 8;

使用memtable的bloom过滤器，一些memtable的访问可以避免。

options.block_cache = rocksdb::NewLRUCache(512 * 1024 * 1024, 8);

块缓存被配置为512MB。（这个在好几个分片共享？）

全排序数据库，闪存。

这个数据库同事执行Get和全排序迭代。分片？？？

options.env->SetBackgroundThreads(4);

我们先设置4个线程到线程池。

options.options.compaction_style = kCompactionStyleLevel;
options.write_buffer_size = 67108864; // 64MB
options.max_write_buffer_number = 3;
options.target_file_size_base = 67108864; // 64MB
options.max_background_compactions = 4;
options.level0_file_num_compaction_trigger = 8;
options.level0_slowdown_writes_trigger = 17;
options.level0_stop_writes_trigger = 24;
options.num_levels = 4;
options.max_bytes_for_level_base = 536870912; // 512MB
options.max_bytes_for_level_multiplier = 8;

我们使用level风格压缩，高并发。memtable大小为64MB，level0文件数量为8。这意味着压缩在L0的数据增长到512MB的时候触发。L1的大小为512MB，每个层8倍大于上一层，L2 4Gb，L3 32GB。

机械硬盘上的数据库

即将到来。。。

完整功能的内存数据库

在这个例子，数据库被挂载到了tmpfs文件系统。

使用mmap读：

options.allow_mmap_reads = true;

禁止块缓存，打开bloom过滤器，减少重启的开销：

BlockBasedTableOptions table_options;
table_options.filter_policy.reset(NewBloomFilterPolicy(10, true));
table_options.no_block_cache = true;
table_options.block_restart_interval = 4;
options.table_factory.reset(NewBlockBasedTableFactory(table_options));

如果你希望优先考虑速度，你可以关闭压缩：

options.compression = rocksdb::CompressionType::kNoCompression;

否则，打开一个轻量压缩，LZ4或者Snappy。

设置更激进的压缩方式，并且为落盘和压缩分配更多的线程。

options.level0_file_num_compaction_trigger = 1;
options.max_background_flushes = 8;
options.max_background_compactions = 8;
options.max_subcompactions = 4;

保持所有文件打开：

options.max_open_files = -1;

当读取数据的时候，考虑设置ReadOptions.verify_checksums = false。

内存前缀数据库

在这个例子，数据库挂载在tmpfs文件系统。我们使用自定义的格式来加速，一些其他功能无法支持。我们只支持Get和前缀范围搜索。WAL日志被排序好并且存在硬盘，以避免消耗非用于查询的内存。不支持Prev。

由于数据库是在内存，我们不关心写放大。我们更关心读放大和空间放大。这是一个有趣的例子，因为我们对压缩调优到极致，所以通常只有一个SST表存在于系统。因此我们减少了读和空间放大，而写放大很大。

由于使用universal压缩，压缩期间，我们的硬盘空间会高效地翻倍。这对内存数据库非常危险。因此我们把数据分片城400个RocksDB实例。我们只允许两个并发压缩，所以只有两个分片会使存储翻倍。

在这个例子，前缀哈希可以用于允许系统使用哈希索引，而不是二分搜索，同时，如果可能，迭代的时候打开bloom过滤器：

options.prefix_extractor.reset(new CustomPrefixExtractor());

使用为了低延迟构建的内存定位表格式，需要mmap模式打开：

options.table_factory = std::shared_ptr(rocksdb::NewPlainTableFactory(0, 8, 0.85));
options.allow_mmap_reads = true;
options.allow_mmap_writes = false;

使用哈希链表memtable以使用memtable的哈希索引：

options.memtable_factory.reset(rocksdb::NewHashLinkListRepFactory(200000));

当从memtable读取数据的时候，为哈希表打开bloom过滤器以减少内存访问（通常意味着CPU缓存未命中），以防止key在memtable中不存在。

options.memtable_prefix_bloom_bits = 10000000;
options.memtable_prefix_bloom_probes = 6;

对压缩调优，一个全量压缩会在有两个文件的时候马上开始。我们hack了universal压缩的参数：

options.compaction_style = kUniversalCompaction;
options.compaction_options_universal.size_ratio = 10;
options.compaction_options_universal.min_merge_width = 2;
options.compaction_options_universal.max_size_amplification_percent = 1;
options.level0_file_num_compaction_trigger = 1;
options.level0_slowdown_writes_trigger = 8;
options.level0_stop_writes_trigger = 16;

调优bloom过滤器以最小化内存访问：

options.bloom_locality = 1;

所有表的读者对象总是被缓存，避免读取的时候表缓存访问：

options.max_open_files = -1;

同一时间使用一个memtable。他的大小根据我们希望的压缩间隔来决定。我们调优压缩，所以每次落盘后，一个全量压缩都会触发，消耗CPU。memtable越大，压缩间隔会越大，同时，我们看到内存效率更低，更差的查询性能和重启时更长的恢复时间：

options.write_buffer_size = 32 << 20;
options.max_write_buffer_number = 2;
options.min_write_buffer_number_to_merge = 1;

多个DB实例共享两个压缩线程：

options.max_background_compactions = 1;
options.max_background_flushes = 1;
options.env->SetBackgroundThreads(1, rocksdb::Env::Priority::HIGH);
options.env->SetBackgroundThreads(2, rocksdb::Env::Priority::LOW);

设置WAL：

options.bytes_per_sync = 2 << 20;

对于内存块表的建议

hash_index：在新的版本，哈希索引对基于块的表打开。他会使用5%的额外存储空间，但是随机读取比普通二分搜索快50%。

table_options.index_type = rocksdb::BlockBasedTableOptions::kHashSearch;

block_size：默认，这个值为4K。如果压缩被打开，一个更小的块大小会导致更高的随机度速度，因为解压缩的开销减小了。但是块大小不能太小，否则压缩就不起作用了。推荐设置到1k。

verify_checksum：由于我们在tmpfs上排序好，并且关心读性能，校验和会被关闭。

最后的考虑

很不幸，最优化配置RocksDB不可忽略。即使是我们作为RocksDB开发者也不能完全明白每种配置的作用。如果你希望完全针对你的工作环境优化RocksDB，我们推荐实验和压力测试，同事注意三个放大因子。同事，请不要犹豫到RocksDB开发者讨论组寻找我们的帮助。

你可能感兴趣的:(数据库)

一文带你了解Linux中部署Redis主从复制，主从复制原理小满只想睡觉 linux redis 后端
本文谈到的内容主要是以下几点：如何部署Redis主从复制（一主二从）一些关于主从的问题模拟和思考主从复制原理和工作流程前文所谓主从复制，就是以其中一台机器作为master，并且以写为主，其他从服务器（Slave）则是以读为主，达到读写分离的效果，以来提高系统性能。从服务器的数据全部从主服务中复制同步而来。当master数据变化的时候，自动将新的数据异步同步到其他Slave数据库redis官方文档：
MySQL数据库在Linux（centos7）中的安装胖虎99 linux基础数据库 mysql linux 运维服务器
一、若系统里有了残余的mysql先删除要卸载系统中已经安装过的MySQL及其残余文件，您可以按照以下步骤进行操作：1.停止MySQL服务首先，确保MySQL服务已停止：sudosystemctlstopmysqld2.卸载MySQL软件包使用以下命令卸载MySQL相关的软件包。根据您安装的版本，可能需要调整命令中的包名。sudoyumremovemysqlmysql-servermysql-cli
【Mysql】用户授权（GRANT）语法介绍和示例 m0_74823044 mysql 数据库
【Mysql】用户授权（GRANT）语法介绍和示例【一】Mysql用户授权（GRANT）语法【1】授予用户权限语法【2】GRANT语句中的的使用说明如下：（1）授予数据库权限时，可以指定为以下值：（2）授予表权限时，可以指定为以下值：（3）授予列权限时，的值只能指定为SELECT、INSERT和UPDATE，同时权限后面需要加上列名列表column-list。（4）最有效率的权限是用户权限。【3】
3-Spring Boot的数据访问 axinawang springboot spring boot
一、概述在开发中，通常会涉及到对数据库的数据进行操作，SpringBoot在简化项目开发以及实现自动化配置的基础上，对关系型数据库和非关系型数据库的访问操作都提供了非常好的整合支持。SpringBoot默认采用整合SpringData的方式统一处理数据访问层，通过添加大量自动配置，引入各种数据访问模板xxxTemplate以及统一的Repository接口，从而达到简化数据访问层的操作。二、常见数
【项目实战】MySQL的默认存储引擎（InnoDB存储引擎）简介本本本添哥 004 -数据库 mysql 数据库
一、技术概览1.1定义InnoDB引擎，是MySQL数据库管理系统中最常用的存储引擎之一。【判断题】MySQL数据库默认使用不支持事务的innodb引擎（错）InnoDB引擎，支持事务处理（Transactions）、行级锁定（Row-LevelLocking）以及外键约束（ForeignKeys）InnoDB引擎，这些特性使得InnoDB非常适合于处理大量并发事务的应用程序。InnoDB引擎，设
Django：ORM，mysql，django中多数据库操作叫我DPT mysql 数据库 python django
目录读写分离1.构造表结构2.对数据库数据的读取操作简单版基于router的改进版按app划分1.构造表结构2.对数据库数据的读取操作简单版基于router的改进版单app中的分库操作1.构造表结构2.对数据库数据的读写操作简单版基于router的改进版最后总结一下router读写分离读写分离是让数据库的读写操作被分配到不同的数据库服务器上，从而提高可用性。这种分库方式是，要各数据库的表结构要一致
软考-软件设计师(8)-系统开发与软件工程:UML、网络计划技术、软件过程模型、系统开发方法论、设计模式、敏捷开发、软件测试、软件质量保证、项目管理、开发工具、环路复杂性、数据库设计等高频考点霸道流氓气质软考软件工程设计模式软考软件设计师
场景软考-软件设计师-系统开发与软件工程模块高频考点整理。以下为高频考点、知识点汇总。软件设计师上午选择题知识点、高频考点、口诀记忆技巧、经典题型汇总：软考-软件设计师(1)-计算机基础知识点:进制转换、数据编码、内存编址、串并联可靠性、海明校验码、吞吐率、多媒体等：软考-软件设计师(1)-计算机基础知识点:进制转换、数据编码、内存编址、串并联可靠性、海明校验码、吞吐率、多媒体等-CSDN博客软考
【自学笔记】JavaWeb的重点知识点-持续更新 Long_poem 笔记 java web
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录JavaWeb知识点一、基础概念二、项目结构三、Tomcat服务器四、数据库连接（JDBC）五、前端技术六、高级技术总结以下是JavaWeb知识点的MD格式罗列：JavaWeb知识点一、基础概念静态Web与动态Web静态Web：页面内容固定不变，每次访问都返回相同的内容。动态Web：页面内容可以根据请求或用户输入而变化。网站访
深入浅出：Python `with` 语句详解软件架构师笔记 python python 网络服务器
深入浅出：Pythonwith语句详解1.什么是with语句？with语句是Python中用于简化资源管理的语法糖。它确保在进入代码块时自动获取资源，并在退出代码块时自动释放资源。常见的资源包括文件、网络连接、数据库连接等。with语句的核心思想是“上下文管理”，即在一定范围内自动处理资源的获取和释放，避免了手动管理资源带来的复杂性和潜在错误。1.1上下文管理器with语句依赖于上下文管理器（Co
Python 爬虫实战：在马蜂窝抓取旅游攻略，打造个性化出行指南西攻城狮北 python 爬虫旅游开发语言实战案例
一、引言二、准备工作（一）安装必要的库（二）分析网页结构三、抓取攻略列表信息（一）发送请求获取网页内容（二）解析网页提取攻略信息（三）整合代码获取攻略列表四、抓取单个攻略详情信息（一）发送请求获取攻略详情页面内容（二）解析网页提取攻略详情信息（三）整合代码获取攻略详情五、数据存储（一）存储到CSV文件（二）存储到数据库（以SQLite为例）六、注意事项（一）遵守法律法规和平台规定（二）应对反爬虫机
open-api-project 吴刚999 java rsa gateway spring boot
web项目对外提供接口服务统一鉴权网关入口主要设计思路：公私钥对：公钥加密，私钥解密；私钥生成签名，公钥验签。1、生成公私钥对，绑定app_id，存入数据库2、将app_id和私钥对外3、对外根据app_id和私钥生成自己的签名sign4、再结合其他参数一起放入接口传过来（参数是否需要公私钥加密解密传输，根据自己具体业务逻辑来处理）5、拿到参数根据app_id获取对应的公钥去验签6、同时针对访问者
初学可视化PyQt5系列--主要类万金油笑匠 PyQt5 小白学做四旋翼无人机 Python数据分析与可视化 qt 开发语言 python ui pyqt
【初学可视化PyQt5系列】第1章PyQt5简介第2章PyQt5新增功能第3章Hellomyfourrotordrone第4章PyQt5主要类第5章PyQt5使用Qt设计器第6章PyQt5信号与插槽第7章PyQt5布局与管理第8章PyQt5基本小部件第9章PyQt5QDialog类第10章PyQt5QMessageBox类第11章PyQt5多文档界面第12章PyQt5拖放第13章PyQt5数据库处
PHP Laravel框架模型与数据库余味鱼尾数据库 php laravel
在Laravel框架中，模型与数据库是最核心的部分之一。模型是Laravel与数据库交互的主要方式，而数据库操作则通过Laravel的EloquentORM（对象关系映射）实现。Eloquent提供了一个非常强大且直观的方式来处理数据，使得与数据库的交互变得更加简单和高效。1.了解Laravel的数据库操作Laravel使用EloquentORM作为数据库交互的主要方式。ORM是一种映射关系型数据
PHP Laravel框架迁移与填充余味鱼尾 php laravel oracle
在Laravel中，迁移（Migrations）和填充（Seeding）是管理数据库的两个重要概念。它们为数据库操作提供了结构化、版本化以及灵活的解决方案，使得数据库的管理更加高效和便捷。下面将详细介绍这两者的核心概念及应用，帮助你快速理解并掌握它们。1.迁移（Migrations）迁移是Laravel提供的数据库结构版本控制系统。它允许你通过PHP代码来创建和修改数据库结构，而不需要直接编写SQ
本地Apache Hive的Linux服务器集群复制数据到SQL Server数据库的分步流程 weixin_30777913 数据库数据仓库 hive sqlserver
我们已经有安装ApacheHive的Linux服务器集群，它可以连接到一个SQLServerRDS数据库，需要在该Linux服务器上安装配置sqoop，然后将Hive中所有的表数据复制到SQLServerRDS数据库。以下是分步指南，用于在Linux服务器上安装配置Sqoop并将Hive表数据迁移至SQLServerRDS：1.安装Sqoop步骤：下载Sqoop前往ApacheSqoop下载页面，
Python Flask框架基础（五）数据库 525小白菜 Python Web编程数据库 python flask
数据库是大多数动态Web程序的基础设施，本章主要介绍如何给Flask程序添加数据库支持，具体来说就是在Python中使用DBMS来对数据库进行管理和操作。使用ORM不光可以解决SQL注入的问题，而且它为不同的DBMS提供统一的Python接口库，使得切换数据库非常简单。ORM把底层的SQL数据实体转化成高层的Python对象，这样甚至不用了解SQL，只需要通过Python代码即可完成数据库操作，O
《亿级流量下的架构实战：HTTP全链路解析与智能监控系统搭建》我的青春不太冷架构 http 网络协议科技经验分享学习网络
文章目录全链路解析：HTTP请求响应与数据可视化监控一、HTTP请求响应全流程解析1.全链路交互流程图2.关键技术实现2.1前端请求构造（ES6+语法示例）2.2服务端处理架构（Node.js/Express）二、数据可视化监控方案1.数据存储架构设计2.数据库操作层实现3.管理界面实现方案3.1可视化看板路由//routes/admin.js3.2数据可视化模板（EJS示例）4.最佳实践建议4.
django 唱歌的人不掉泪字写笔记 django python
1、WEB与服务器1.WEB表示用户可以浏览的网页内容（HTML，CSS，JS）2.服务器能够给用户提供服务的机器1.硬件与软件硬件范畴：一台机器软件范畴：一个能够接收用户请求并给出响应的程序APACHETOMCATIISNginx2.作用存储web所需要的信息（HTML，图片，文件，…）能够处理用户的请求（request），并给出响应（response）执行服务器端程序：数据库操作3.WEB与服
Springboot 集成Mybatis Loolay spring boot mybatis 后端
MyBatis是一个流行的Java数据持久层框架，主要用于简化数据库操作，它允许开发者通过简单的XML或注解配置SQL语句，从而实现对数据库的CRUD（增、删、改、查）操作。MyBatis提供了对SQL语句的全面控制，同时还支持映射结果集到对象，并处理复杂的数据库操作。SpringBoot是一个用于简化Spring应用程序配置和开发的框架。它能够帮助开发者快速创建和部署生产级的Spring应用程序
快速学习安装使用etcd 蓝胖子不是胖子学习 etcd 数据库
1.什么是etcd？etcd是一个分布式键值存储系统，主要用于分布式系统的配置管理和服务发现。它提供了可靠的数据存储，etcd可以用来构建高可用的分布式键值数据库，根据官网介绍并且支持分布式锁、Leader选举等功能，通常被用作微服务架构中的注册中心。在目前go的大部分组件还有框架中都被采用为注册中心组件相当于zookper和redis2.安装etcd2.1.在本地安装etcd2.1.1.Linu
互联网大厂的微服务架构系统应对超大流量解决方案欧子说Java 架构微服务 java
常见的限流方式有：限制总并发数（数据库连接池、线程池等等）限制瞬时并发数（如Nginx的limit_conn模块）限制时间窗口的平均速率（如Guava的RateLimiter、Nginx的limit_req模块）限制远程接口的调用速率、限制消息系统的消费速率1.1接入层限流抗疫项目中，一般ISV会把Nginx作为业务的接入层，通过Nginx将请求分发到后端的应用集群上。接入层(流量层)是整个系统的
元数据与 Annotated：Python 类型系统的新视角黑金IT python 开发语言
什么是元数据？元数据（Metadata）是描述其他数据的数据。它提供了关于数据的上下文信息，可以帮助解释数据的内容、来源、结构、质量、含义、管理方式以及如何使用等。元数据可以应用于各种类型的数据，包括文本、图像、音频、视频、数据库记录等。有哪些常见的元数据在不同的领域和应用中，元数据的具体含义和用途可能有所不同。以下是一些常见的元数据应用示例：图书馆学和信息科学：图书、期刊文章、研究报告等通常都有
java web + mysql 实现图书管理系统鱼弦【练习两年半】程序基础【HOT】技术热谈 mysql 数据库
鱼弦：CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）要使用JavaWeb和MySQL实现图书管理系统，你可以按照以下步骤进行操作：数据库设计：创建一个MySQL数据库，并命名为图书管理系统。设计数据库表，例如：图书表（Book）、用户表（User）等。
毕设开源 python大数据旅游数据分析可视化系统(源码分享) bee_dc 毕业设计毕设大数据
文章目录0前言1课题背景2数据处理3数据可视化工具3.1django框架介绍3.2ECharts4Django使用echarts进行可视化展示（mysql数据库）4.1修改setting.py连接mysql数据库4.2导入数据4.3使用echarts可视化展示5实现效果5.1前端展示5.2后端展示6最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到
再见，Elasticsearch ！码农code之路 elasticsearch 大数据搜索引擎全文检索
新一代搜索引擎，是ES的15倍，号称干翻ES！ManticoreSearch是一个使用C++开发的高性能搜索引擎，创建于2017年，其前身是SphinxSearch。ManticoreSearch充分利用了Sphinx，显着改进了它的功能，修复了数百个错误，几乎完全重写了代码并保持开源。这一切使ManticoreSearch成为一个现代，快速，轻量级和功能齐全的数据库，具有出色的全文搜索功能。Ma
数据库性能调优中的配置参数调整：提升系统效率的关键环节
title:数据库性能调优中的配置参数调整：提升系统效率的关键环节date:2025/1/31updated:2025/1/31author:cmdragonexcerpt:数据库的性能直接影响到应用程序的响应能力和用户体验，因此在日常运维中，管理员需要定期对数据库系统进行性能调优。配置参数调整是数据库性能调优的重要组成部分，通过优化这些参数，能够显著提高数据库的性能和稳定性。categories
InnoDB 存储引擎 898178 数据库入门数据库
InnoDB存储引擎InnoDB是事务型数据库的首选引擎，支持事务安全表（ACID），支持行锁定和外键。MYSQL5.5.5之后，InnoDB作为默认存储引擎。InnoDB的主要特性有一下几项。A.InnoDB给MYSQL提供了具有提交、回滚和崩溃恢复能力的事务安全（ACID兼容)存储引擎。InnoDB锁定在行级并且也在SELECT语句中提供一个类似Oracle的非锁定读。这些功能增加了多用户部署
C语言哈希表 niubikls c语言哈希算法数据结构开发语言单片机
哈希表（HashTable）是一种高效的数据结构，用于实现快速的数据查找、插入和删除操作。哈希表通过将关键字（Key）映射到表中的位置（索引），实现近似常数时间的操作效率。哈希表在许多应用中广泛使用，如数据库索引、缓存系统、编译器符号表等。本文将详细介绍如何使用C语言实现哈希表，包括基本概念、哈希函数、冲突处理方法、基本操作、示例代码及其优缺点。哈希表的基本概念定义哈希表是一种通过哈希函数将关键字
Oracle多租户体系,使用Oracle数据库综合的多租户架构.pdf weixin_39792751 Oracle多租户体系
DatabaseConsolidationusingOracleMultitenantPiniDibask,ProductManagerforDatabaseSolutionsOctober1st,2017AboutMe•PiniDibask,ProductManager,DatabaseMonitoringSolutions(Quest)•BasedinIsrael•OracleDBAsince
Oracle SQL Developer：数据库开发与数据管理的利器 2401_85812026 oracle sql 数据库开发
在数据库管理和开发领域，拥有一个强大而灵活的工具是至关重要的。OracleSQLDeveloper是Oracle公司提供的一个免费集成开发环境，它专为数据库开发、管理和数据建模而设计。本文将详细介绍OracleSQLDeveloper的功能、特点以及如何使用它来执行数据库任务，包括编写和执行SQL语句、数据建模和数据库管理。1.什么是OracleSQLDeveloperOracleSQLDevel
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持