v-code

Rocksdb Compaction源码详解（二）：Compaction 完整实现过程概览

文章目录

1. 摘要
2. Compaction 概述
3. 实现

3.1 Prepare keys 过程

3.1.1 compaction触发的条件
3.1.2 compaction 的文件筛选过程
3.1.3 compaction每一层level大小的计算过程
3.1.4 挑选参与compaction的文件
3.1.5 Compaction job根据获取到数据分配compaction 线程

3.2 Process keys

3.2.1 构造能够访问所有key的迭代器
3.2.2 通过SeekToFirst和Next指针处理元素

3.3 Write keys

3.3.1 将builder与输出文件的writer绑定
3.3.2 通过table_builder的状态机添加block数据
3.3.3 通过构建的meta_index_builder和Footer完成数据的固化

4. 总结

1. 摘要

阅读本文前建议看看Rocksdb Compaction 源码详解（一）：SST文件详细格式源码解析，先初步了compaction操作的SST文件结构

Rocksdb的compaction流程可以说是比较核心的流程了，它的存在除了保证不同sst 文件之间的key-value之间的有序性，数据的压缩存储，清理过时数据之外，还需要在存储细节上做一些优化来进一步提升LSM tree的读性能（Range tombstone的构造，提升了deleteRange区间的key-value的判断效率；filter block的创建，提升判断一个key是否存在的概率；index block的创建，支持二分查找和hash map的查找，提升针对普通key-value的查找性能…）。

虽然LSM tree的顺序写入保证了写性能，但是其本身的存储结构却牺牲了读性能，所以需要通过compaction这样的机制随着IO的持续写入来不断得微调整整个数据存储系统的结构，来降低读对系统的影响。

本节中涉及的代码都是基于rocksdb 6.6.fb版本来描述的，阅读完预计一个多小时，建议大家先概览，然后选择部分感兴趣的来看，欢迎大家一起交流讨论

2. Compaction 概述

接下来我将带领大家欣赏这样一个有趣机制的实现，

rocksdb实现了多种这样的compaction策略，这里以默认的level compaction为切入点:

如图2.1 对compaction的实现做了一个整体的描述，图有点复杂？这张图能够将compaction的大体流程讲清楚，但对于其中的一些优化细节的实现还是太过笼统。限于本人能力有限，会在自己能力范围内为大家讲清楚这个机制。

图2.1 compaction整体流程概述

主要分为三个阶段:

Prepare key，主要是从SST文件中读取需要参与compaction的key-value数据
Process key，主要是进行key value数据的合并，排序，处理不同的key type的操作
write key，将key-value数据写入对应的block数据之中

不过其详细实现并不是三个阶段这么简单，非常多的细节，看看上面那张笼统概述的图就知道了。

3. 实现

上图将整个Compaction的总体过程分为三部分，这个划分并不是官方的划分，只是为了方便大家理解，从代码中提炼出来的主要逻辑。为了避免篇幅太过冗长，这里选择将对应代码逻辑的calltrace 添加进来，对于有趣的关键逻辑再做详细说明。以下部分到描述对应上图中的流程就是从左向右看的三个部分：

3.1 Prepare keys 过程

主要做如下几件事情:

根据每一层的score来取出参与compaction 层
利用clean cut算法来来从层中取出参与compaction的文件
将文件中的key-value 边界取出，并做一个边界排序，确认最终的key的边界范围
依据边界范围，按照subcompaction limit 拆分成一个一个subcompaction ，创建对应的sub处理的线程，进入下一个阶段

大体过程如下图3.1

图3.1 compaction到prepare key 部分

3.1.1 compaction触发的条件

rocksdb的compaction都是后台运行，通过线程BGWorkCompaction 进行compaction的调度。

该线程的触发一般有两种情况

一种是手动compact, CompactFiles来进行手动compaction操作

另一种是自动MaybeScheduleFlushOrCompaction，这个函数在切换wal（SwitchWAL）或者write_buffer(memtable)满的时候被调用。

我们主要还是分析自动compaction的逻辑，这也是通用逻辑。接下来分析MaybeScheduleFlushOrCompaction函数中的compact逻辑，这里可以看到RocksDB中后台运行的compact会有一个限制(max_compactions).而我们可以看到这里还有一个变量 unscheduled_compactions_，这个变量表示需要被compact的columnfamily的队列长度.

  while (bg_compaction_scheduled_ < bg_job_limits.max_compactions &&
         unscheduled_compactions_ > 0) {
    CompactionArg* ca = new CompactionArg;
    ca->db = this;
    ca->prepicked_compaction = nullptr;
    bg_compaction_scheduled_++; //正在被调度的compaction线程数目
    unscheduled_compactions_--; //待调度的线程个数，及待调度的cfd的长度
    //调度BGWorkCompaction线程
    env_->Schedule(&DBImpl::BGWorkCompaction, ca, Env::Priority::LOW, this,
                   &DBImpl::UnscheduleCompactionCallback);
  }

compact的时候RocksDB也有一个队列叫做DBImpl::compaction_queue_.

std::deque<ColumnFamilyData*> compaction_queue_;

这个队列的更新是在函数SchedulePendingCompaction更新的，且unscheduled_compactions_变量是和该函数一起更新的，也就是只有设置了该变量才能够正常调度compaction后台线程。

void DBImpl::SchedulePendingCompaction(ColumnFamilyData* cfd) {
  if (!cfd->queued_for_compaction() && cfd->NeedsCompaction()) {
    AddToCompactionQueue(cfd);
    ++unscheduled_compactions_;
  }
}

上面的核心函数是NeedsCompaction,通过这个函数来判断是否有sst需要被compact，因此接下来我们就来详细分析这个函数.当满足下列几个条件之一就将会更新compact队列,通过调用LevelCompactionPicker::NeedsCompaction函数来进行是否满足compaction的条件判断的，以下条件只要满足一个就可以进行compaction的调度：

有超时的sst(ExpiredTtlFiles)
files_marked_for_compaction或者bottommost_files_marked_for_compaction都不为空
两个vector类型的数组
遍历所有的level的sst,然后判断是否需要compact
这里通过每个sst的score进行判断，后续会对该score进行描述

bool LevelCompactionPicker::NeedsCompaction(
    const VersionStorageInfo* vstorage) const {
  if (!vstorage->ExpiredTtlFiles().empty()) {
    return true;
  }
  if (!vstorage->FilesMarkedForPeriodicCompaction().empty()) {
    return true;
  }
  if (!vstorage->BottommostFilesMarkedForCompaction().empty()) { 
    return true;
  }
  if (!vstorage->FilesMarkedForCompaction().empty()) {
    return true;
  }
  for (int i = 0; i <= vstorage->MaxInputLevel(); i++) {
    if (vstorage->CompactionScore(i) >= 1) {
      return true;
    }
  }
  return false;
}

3.1.2 compaction 的文件筛选过程

因此接下来我们来分析最核心的CompactionScore,这里将会涉及到两个变量,这两个变量分别保存了level以及每个level所对应的score(这里score越高表示compact优先级越高)，而score小于１则表示不需要compact.

这里是通过两个数组进行相关变量的更新

  std::vector<double> compaction_score_; //当前sst的score
  std::vector<int> compaction_level_; //当前sst需要被compact到的层level

这两个变量的更新是在函数void VersionStorageInfo::ComputeCompactionScore中被更新的，这个函数会区别leve-0和其他level的处理逻辑

首先会计算level-0下所有文件的大小(total_size)以及文件个数(num_sorted_runs).
用文件个数除以level0_file_num_compaction_trigger来得到对应的score
针对levelStyle的compaction，需要从上面的score和(total_size/max_bytes_for_level_base)取最大值,作为当前参与compaction的score。因为有的时候level-0在密集型IO场景下会瞬时达到很大，超过level-1的max_bytes_for_level_base，所以需要针对这种场景设置score

void VersionStorageInfo::ComputeCompactionScore(
  ......
    for (int level = 0; level <= MaxInputLevel(); level++) {
    double score;
    if (level == 0) {
      ......
      int num_sorted_runs = 0;
      uint64_t total_size = 0;
      for (auto* f : files_[level]) {
        if (!f->being_compacted) {
          total_size += f->compensated_file_size; //所有level-0文件总大小
          num_sorted_runs++; //所有文件个数
        }
      }
      ......
        score = static_cast<double>(num_sorted_runs) /
        mutable_cf_options.level0_file_num_compaction_trigger; 
        if (compaction_style_ == kCompactionStyleLevel && num_levels() > 1) {
          // Level-based involves L0->L0 compactions that can lead to oversized
          // L0 files. Take into account size as well to avoid later giant
          // compactions to the base level.
          score = std::max(
              score, static_cast<double>(total_size) /
                     mutable_cf_options.max_bytes_for_level_base);
        }
      }

针对非level-0的处理逻辑，也是获取当前level未正在进行compaction的所有文件大小，然后除以MaxBytesForLevel得到score

      // Compute the ratio of current size to size limit.
      uint64_t level_bytes_no_compacting = 0;
      for (auto f : files_[level]) {
        if (!f->being_compacted) {
          level_bytes_no_compacting += f->compensated_file_size;
        }
      }
      score = static_cast<double>(level_bytes_no_compacting) /
              MaxBytesForLevel(level);
    }
    compaction_level_[level] = level;
    compaction_score_[level] = score;

3.1.3 compaction每一层level大小的计算过程

一种是静态的数值，即每一层的大小都是固定的

一种是动态调整的，动态根据每一层大小进行计算，得到最大level_max_bytes，并依此递推之前的level

其中函数有一个函数 MaxBytesForLevel(level)，很明显就是获取当前level的最大的文件大小。实现如下:

uint64_t VersionStorageInfo::MaxBytesForLevel(int level) const {
  // Note: the result for level zero is not really used since we set
  // the level-0 compaction threshold based on number of files.
  assert(level >= 0);
  assert(level < static_cast<int>(level_max_bytes_.size()));
  return level_max_bytes_[level];
}

其中数组level_max_bytes_ 的更新是在CalculateBaseBytes函数中进行，在其中的更新过程还是与我们option设置的一个参数相关

level_compaction_dynamic_level_bytes，如果这个配置被置为false，意味着每一层的大小都是固定的，则会有如下的更新规则：

如果是level-1 ，那么将其level_max_bytes_设置为options.max_bytes_for_level_base 这样的配置
如果是大于level-1的level，则他们的level_max_bytes_ 计算方式如下:

Level-n = level_max_bytes_[n - 1] * max_bytes_for_level_multiplier*max_bytes_for_level_multiplier_additional[n]

其中 max_bytes_for_level_multiplier和max_bytes_for_level_multiplier_additional都是通过option进行设置的，其中max_bytes_for_level_multiplier_additional默认为1

假如: max_bytes_for_level_base = 1024 ，max_bytes_for_level_multiplier = 10

则L1,L2,L3 依次为：1024，10240，102400的大小

  if (!ioptions.level_compaction_dynamic_level_bytes) {
    base_level_ = (ioptions.compaction_style == kCompactionStyleLevel) ? 1 : -1;

    // Calculate for static bytes base case
    for (int i = 0; i < ioptions.num_levels; ++i) {
      if (i == 0 && ioptions.compaction_style == kCompactionStyleUniversal) {
        level_max_bytes_[i] = options.max_bytes_for_level_base;
      } else if (i > 1) {
        level_max_bytes_[i] = MultiplyCheckOverflow(
            MultiplyCheckOverflow(level_max_bytes_[i - 1],
                                  options.max_bytes_for_level_multiplier),
            options.MaxBytesMultiplerAdditional(i - 1));
      } else {
        level_max_bytes_[i] = options.max_bytes_for_level_base;
      }
    }
  }

假如level_compaction_dynamic_level_bytes 被设置为true，即每次计算出来的level_max_bytes可能会不一样

这个参数主要是为了保证LSM tree密集IO压力下仍然能够保证合理的树型结构（良好的树型结构能够提供优秀的查找性能），这里的计算方式是这样的

找到当前树形结构数据量最多的一层，作为Target_Size(Ln)
通过公式Target_Size(Ln-1) = Target_Size(Ln) / max_bytes_for_level_multiplier递推之前的level大小

比如当前系统中最大的level的 target size是10G，num_levels = 6,max_bytes_for_level_multiplier = 10

那么从L6-L1依次每一层level的大小如下，10G,1G,102M,10.2M,1.02M,102KB

首先计算第一个非空的level.

    uint64_t max_level_size = 0;
    int first_non_empty_level = -1;
    for (int i = 1; i < num_levels_; i++) {
      uint64_t total_size = 0;
      for (const auto& f : files_[i]) {
        total_size += f->fd.GetFileSize();
      }
      if (total_size > 0 && first_non_empty_level == -1) {
        first_non_empty_level = i;
      }
      if (total_size > max_level_size) {
        max_level_size = total_size;
      }
    }

得到最小的那个非0的level的size.

      uint64_t base_bytes_max =
          std::max(options.max_bytes_for_level_base, l0_size);
      uint64_t base_bytes_min = static_cast<uint64_t>(
          base_bytes_max / options.max_bytes_for_level_multiplier);

      uint64_t cur_level_size = max_level_size;
      for (int i = num_levels_ - 2; i >= first_non_empty_level; i--) {
        // Round up after dividing
        cur_level_size = static_cast<uint64_t>(
            cur_level_size / options.max_bytes_for_level_multiplier);
      }

找到base_level_size，一般来说也就是cur_level_size.

        // Find base level (where L0 data is compacted to).
        base_level_ = first_non_empty_level;
        while (base_level_ > 1 && cur_level_size > base_bytes_max) {
          --base_level_;
          cur_level_size = static_cast<uint64_t>(
              cur_level_size / options.max_bytes_for_level_multiplier);
        }
        if (cur_level_size > base_bytes_max) {
          // Even L1 will be too large
          assert(base_level_ == 1);
          base_level_size = base_bytes_max;
        } else {
          base_level_size = cur_level_size;
        }

然后给level_max_bytes赋值

      uint64_t level_size = base_level_size;
      for (int i = base_level_; i < num_levels_; i++) {
        if (i > base_level_) {
          level_size = MultiplyCheckOverflow(level_size, level_multiplier_);
        }
        level_max_bytes_[i] = std::max(level_size, base_bytes_max);
      }

3.1.4 挑选参与compaction的文件

其中Compact的所有操作都在DBImpl::BackgroundCompaction中进行，因此接下来我们来分析这个函数. 首先是从compaction_queue_队列中读取第一个需要compact的column family.

    // cfd is referenced here
    auto cfd = PopFirstFromCompactionQueue();
    // We unreference here because the following code will take a Ref() on
    // this cfd if it is going to use it (Compaction class holds a
    // reference).
    // This will all happen under a mutex so we don't have to be afraid of
    // somebody else deleting it.
    if (cfd->Unref()) {
      delete cfd;
      // This was the last reference of the column family, so no need to
      // compact.
      return Status::OK();
    }

没有禁止自动compaction的时候，接下来通过PickCompaction选取当前CF中所需要compact的内容.

if (!mutable_cf_options->disable_auto_compactions && !cfd->IsDropped()) {
  c.reset(cfd->PickCompaction(*mutable_cf_options, log_buffer));
  ...
}

而这个函数会根据设置的不同的Compact策略调用不同的方法，这里我们只看默认的LevelCompact的对应函数.

Compaction* LevelCompactionBuilder::PickCompaction() {
  // Pick up the first file to start compaction. It may have been extended
  // to a clean cut.
  SetupInitialFiles();
  if (start_level_inputs_.empty()) {
    return nullptr;
  }
  assert(start_level_ >= 0 && output_level_ >= 0);
  // If it is a L0 -> base level compaction, we need to set up other L0
  // files if needed.
  if (!SetupOtherL0FilesIfNeeded()) {
    return nullptr;
  }
  // Pick files in the output level and expand more files in the start level
  // if needed.
  if (!SetupOtherInputsIfNeeded()) {
    return nullptr;
  }
  // Form a compaction object containing the files we picked.
  Compaction* c = GetCompaction();
  TEST_SYNC_POINT_CALLBACK("LevelCompactionPicker::PickCompaction:Return", c);

  return c;
}

这里PickCompaction分别调用了三个主要的函数.

SetupInitialFiles　这个函数主要用来初始化需要Compact的文件.
SetupOtherL0FilesIfNeeded 如果需要compact的话，那么还需要再设置对应的L0文件
SetupOtherInputsIfNeeded 选择对应的输出文件

先来看SetupInitialFiles,这个函数他会遍历所有的level,然后来选择对应需要compact的input和output.

这里可看到，他会从之前计算好的的compact信息中得到对应的score.

void LevelCompactionBuilder::SetupInitialFiles() {
  // Find the compactions by size on all levels.
  bool skipped_l0_to_base = false;
  for (int i = 0; i < compaction_picker_->NumberLevels() - 1; i++) {
    start_level_score_ = vstorage_->CompactionScore(i);
    start_level_ = vstorage_->CompactionScoreLevel(i);
    assert(i == 0 || start_level_score_ <= vstorage_->CompactionScore(i - 1));
................................................................
  }

只有当score大于一才有必要进行compact的处理(所有操作都在上面的循环中).这里可以看到如果是level0的话，那么output_level 则是vstorage_->base_level(),否则就是level+1. 这里base_level()可以认为就是level1或者是最小的非空的level(之前***CalculateBaseBytes***中计算).

if (start_level_score_ >= 1) {
      if (skipped_l0_to_base && start_level_ == vstorage_->base_level()) {
        // If L0->base_level compaction is pending, don't schedule further
        // compaction from base level. Otherwise L0->base_level compaction
        // may starve.
        continue;
      }
      output_level_ =
          (start_level_ == 0) ? vstorage_->base_level() : start_level_ + 1;
      if (PickFileToCompact()) {
        // found the compaction!
        if (start_level_ == 0) {
          // L0 score = `num L0 files` / `level0_file_num_compaction_trigger`
          compaction_reason_ = CompactionReason::kLevelL0FilesNum;
        } else {
          // L1+ score = `Level files size` / `MaxBytesForLevel`
          compaction_reason_ = CompactionReason::kLevelMaxLevelSize;
        }
        break;
      } else {
        // didn't find the compaction, clear the inputs
  ......................................................
        }
      }
    }

上面的代码中我们可以看到最终是通过***PickFileToCompact***来选择input以及output文件.因此我们接下来就来分这个函数.

首先是得到当前level(start_level_)的未compacted的最大大小的文件

  // Pick the largest file in this level that is not already
  // being compacted
  const std::vector<int>& file_size =
      vstorage_->FilesByCompactionPri(start_level_);
  const std::vector<FileMetaData*>& level_files =
      vstorage_->LevelFiles(start_level_);

紧接着就是这个函数最核心的功能了，它会开始遍历当前的输入level的所有待compact的文件，然后选择一些合适的文件然后compact到下一个level.

unsigned int cmp_idx;
  for (cmp_idx = vstorage_->NextCompactionIndex(start_level_);
       cmp_idx < file_size.size(); cmp_idx++) {
..........................................    
  }

然后我们来详细分析上面循环中所做的事情首先选择好文件之后，将会扩展当前文件的key的范围，得到一个”clean cut”的范围，这里”clean cut”是这个意思，假设我们有五个文件他们的key range分别为:

f1[a1 a2] f2[a3 a4] f3[a4 a6] f4[a6 a7] f5[a8 a9]

如果我们第一次选择了f3,那么我们通过clean cut，则将还会选择f2,f4，因为他们都是连续的. 选择好之后，会再做一次判断，这次是判断是否正在compact的out_level的文件范围是否和我们选择好的文件的key有重合，如果有，则跳过这个文件. 这里之所以会有这个判断，主要原因还是因为compact是会并行的执行的.

int index = file_size[cmp_idx];
    auto* f = level_files[index];

    // do not pick a file to compact if it is being compacted
    // from n-1 level.
    if (f->being_compacted) {
      continue;
    }

    start_level_inputs_.files.push_back(f);
    start_level_inputs_.level = start_level_;
    if (!compaction_picker_->ExpandInputsToCleanCut(cf_name_, vstorage_,
                                                    &start_level_inputs_) ||
        compaction_picker_->FilesRangeOverlapWithCompaction(
            {start_level_inputs_}, output_level_)) {
      // A locked (pending compaction) input-level file was pulled in due to
      // user-key overlap.
      start_level_inputs_.clear();
      continue;
    }

选择好输入文件之后，接下来就是选择输出level中需要一起被compact的文件(output_level_inputs). 实现也是比较简单，就是从输出level的所有文件中找到是否有和上面选择好的input中有重合的文件，如果有，那么则需要一起进行compact.

Ps:这里的输出并不是说已经完成输出的过程了，而是提前计算后续将要输出到哪一层

    InternalKey smallest, largest;
    compaction_picker_->GetRange(start_level_inputs_, &smallest, &largest);
    CompactionInputFiles output_level_inputs;
    output_level_inputs.level = output_level_;
    vstorage_->GetOverlappingInputs(output_level_, &smallest, &largest,
                                    &output_level_inputs.files);
    if (!output_level_inputs.empty() &&
        !compaction_picker_->ExpandInputsToCleanCut(cf_name_, vstorage_,
                                                    &output_level_inputs)) {
      start_level_inputs_.clear();
      continue;
    }
    base_index_ = index;
    break;

继续分析PickCompaction，我们知道在RocksDB中level-0会比较特殊，那是因为只有level-0中的文件是无序的，而在上面的操作中，我们是假设在非level-0,因此接下来我们需要处理level-0的情况,这个函数就是 SetupOtherL0FilesIfNeeded.

这里如果start_level_为０，也就是level-0的话，才会进行下面的处理，就是从level-0中得到所有的重合key的文件，然后加入到start_level_inputs中.

实现上通过调用 GetOverlappingL0Files 来实现

  assert(level0_compactions_in_progress()->empty());
  InternalKey smallest, largest;
  GetRange(*start_level_inputs, &smallest, &largest);
  // Note that the next call will discard the file we placed in
  // c->inputs_[0] earlier and replace it with an overlapping set
  // which will include the picked file.
  start_level_inputs->files.clear();
  vstorage->GetOverlappingInputs(0, &smallest, &largest,
                                 &(start_level_inputs->files));

  // If we include more L0 files in the same compaction run it can
  // cause the 'smallest' and 'largest' key to get extended to a
  // larger range. So, re-invoke GetRange to get the new key range
  GetRange(*start_level_inputs, &smallest, &largest);
  if (IsRangeInCompaction(vstorage, &smallest, &largest, output_level,
                          parent_index)) {
    return false;
  }
  assert(!start_level_inputs->files.empty());

假设start_level_inputs被扩展了，那么对应的output也需要被扩展，因为非level0的其他的level的文件key都是不会overlap的. 那么此时就是会调用 SetupOtherInputsIfNeeded .

 if (output_level_ != 0) {
    output_level_inputs_.level = output_level_;
    if (!compaction_picker_->SetupOtherInputs(
            cf_name_, mutable_cf_options_, vstorage_, &start_level_inputs_,
            &output_level_inputs_, &parent_index_, base_index_)) {
      return false;
    }

    compaction_inputs_.push_back(start_level_inputs_);
    if (!output_level_inputs_.empty()) {
      compaction_inputs_.push_back(output_level_inputs_);
    }

    // In some edge cases we could pick a compaction that will be compacting
    // a key range that overlap with another running compaction, and both
    // of them have the same output level. This could happen if
    // (1) we are running a non-exclusive manual compaction
    // (2) AddFile ingest a new file into the LSM tree
    // We need to disallow this from happening.
    if (compaction_picker_->FilesRangeOverlapWithCompaction(compaction_inputs_,
                                                            output_level_)) {
      // This compaction output could potentially conflict with the output
      // of a currently running compaction, we cannot run it.
      return false;
    }
    compaction_picker_->GetGrandparents(vstorage_, start_level_inputs_,
                                        output_level_inputs_, &grandparents_);
  } else {
    compaction_inputs_.push_back(start_level_inputs_);
  }
  return true;

回到 PickCompaction 函数，最终就是构造一个compact返回

  // Form a compaction object containing the files we picked.
  Compaction* c = GetCompaction();

  TEST_SYNC_POINT_CALLBACK("LevelCompactionPicker::PickCompaction:Return", c);

  return c;

3.1.5 Compaction job根据获取到数据分配compaction 线程

最后再回到BackgroundCompaction中，这里就是在得到需要compact的文件之后，进行具体的compact. 这里我们可以看到核心的数据结构就是CompactionJob,每一次的compact都是一个job,最终对于文件的compact都是在 CompactionJob::run中实现.

CompactionJob compaction_job(
        job_context->job_id, c.get(), immutable_db_options_,
        env_options_for_compaction_, versions_.get(), &shutting_down_,
        preserve_deletes_seqnum_.load(), log_buffer, directories_.GetDbDir(),
        GetDataDir(c->column_family_data(), c->output_path_id()), stats_,
        &mutex_, &bg_error_, snapshot_seqs, earliest_write_conflict_snapshot,
        snapshot_checker, table_cache_, &event_logger_,
        c->mutable_cf_options()->paranoid_file_checks,
        c->mutable_cf_options()->report_bg_io_stats, dbname_,
        &compaction_job_stats);
    compaction_job.Prepare();
    NotifyOnCompactionBegin(c->column_family_data(), c.get(), status,
                            compaction_job_stats, job_context->job_id);

    mutex_.Unlock();
    compaction_job.Run();
    TEST_SYNC_POINT("DBImpl::BackgroundCompaction:NonTrivial:AfterRun");
    mutex_.Lock();

    status = compaction_job.Install(*c->mutable_cf_options());
    if (status.ok()) {
      InstallSuperVersionAndScheduleWork(
          c->column_family_data(), &job_context->superversion_context,
          *c->mutable_cf_options(), FlushReason::kAutoCompaction);
    }
    *made_progress = true;

在RocksDB中，Compact是会多线程并发的执行，而这里怎样并发，并发多少线程都是在CompactionJob中实现的，简单来说，当你的compact的文件range不重合的话，那么都是可以并发执行的。

我们先来看CompactionJob::Prepare函数，在这个函数中主要是做一些执行前的准备工作，首先是取得对应的compact的边界，这里每一个需要并发的compact都被抽象为一个sub compaction.因此在 GenSubcompactionBoundaries 会解析到对应的sub compaction以及边界.解析完毕之后，则将会把对应的信息全部加入sub_compact_states中。

void CompactionJob::Prepare() {
  ..........................
  if (c->ShouldFormSubcompactions()) {
    const uint64_t start_micros = env_->NowMicros();
    GenSubcompactionBoundaries();
    MeasureTime(stats_, SUBCOMPACTION_SETUP_TIME,
                env_->NowMicros() - start_micros);

    assert(sizes_.size() == boundaries_.size() + 1);

    for (size_t i = 0; i <= boundaries_.size(); i++) {
      Slice* start = i == 0 ? nullptr : &boundaries_[i - 1];
      Slice* end = i == boundaries_.size() ? nullptr : &boundaries_[i];
      compact_->sub_compact_states.emplace_back(c, start, end, sizes_[i]);
    }
    MeasureTime(stats_, NUM_SUBCOMPACTIONS_SCHEDULED,
                compact_->sub_compact_states.size());
  }
......................................
}

因此我们来详细分析 GenSubcompactionBoundaries ，这个函数比较长，我们来分开分析，首先是遍历所有的需要compact的level,然后取得每一个level的边界(也就是最大最小key)加入到bounds数组之中。

......  
for (size_t lvl_idx = 0; lvl_idx < c->num_input_levels(); lvl_idx++) {
    int lvl = c->level(lvl_idx);
    if (lvl >= start_lvl && lvl <= out_lvl) {
      const LevelFilesBrief* flevel = c->input_levels(lvl_idx);
      size_t num_files = flevel->num_files;
      ......
      if (lvl == 0) {
        // For level 0 add the starting and ending key of each file since the
        // files may have greatly differing key ranges (not range-partitioned)
        for (size_t i = 0; i < num_files; i++) {
          bounds.emplace_back(flevel->files[i].smallest_key);
          bounds.emplace_back(flevel->files[i].largest_key);
        }
      } else {
        // For all other levels add the smallest/largest key in the level to
        // encompass the range covered by that level
        bounds.emplace_back(flevel->files[0].smallest_key);
        bounds.emplace_back(flevel->files[num_files - 1].largest_key);
        if (lvl == out_lvl) {
          // For the last level include the starting keys of all files since
          // the last level is the largest and probably has the widest key
          // range. Since it's range partitioned, the ending key of one file
          // and the starting key of the next are very close (or identical).
          for (size_t i = 1; i < num_files; i++) {
            bounds.emplace_back(flevel->files[i].smallest_key);
          }
        }
      }
    }
  }
......

然后就对获取到的bounds进行排序去重

  std::sort(bounds.begin(), bounds.end(),
            [cfd_comparator](const Slice& a, const Slice& b) -> bool {
              return cfd_comparator->Compare(ExtractUserKey(a),
                                             ExtractUserKey(b)) < 0;
            });
  // Remove duplicated entries from bounds
  bounds.erase(
      std::unique(bounds.begin(), bounds.end(),
                  [cfd_comparator](const Slice& a, const Slice& b) -> bool {
                    return cfd_comparator->Compare(ExtractUserKey(a),
                                                   ExtractUserKey(b)) == 0;
                  }),
      bounds.end());

接近着就来计算理想情况下所需要的subcompactions的个数以及输出文件的个数.

  // Group the ranges into subcompactions
  const double min_file_fill_percent = 4.0 / 5;
  int base_level = v->storage_info()->base_level();
  uint64_t max_output_files = static_cast<uint64_t>(std::ceil(
      sum / min_file_fill_percent /
      MaxFileSizeForLevel(*(c->mutable_cf_options()), out_lvl,
          c->immutable_cf_options()->compaction_style, base_level,
          c->immutable_cf_options()->level_compaction_dynamic_level_bytes)));
  uint64_t subcompactions =
      std::min({static_cast<uint64_t>(ranges.size()),
                static_cast<uint64_t>(c->max_subcompactions()),
                max_output_files});

最后更新boundaries_，这里会根据根据文件的大小，通过平均的size,来吧所有的range分为几份，最终这些都会保存在boundaries_中.

  if (subcompactions > 1) {
    double mean = sum * 1.0 / subcompactions;
    // Greedily add ranges to the subcompaction until the sum of the ranges'
    // sizes becomes >= the expected mean size of a subcompaction
    sum = 0;
    for (size_t i = 0; i < ranges.size() - 1; i++) {
      sum += ranges[i].size;
      if (subcompactions == 1) {
        // If there's only one left to schedule then it goes to the end so no
        // need to put an end boundary
        continue;
      }
      if (sum >= mean) {
        boundaries_.emplace_back(ExtractUserKey(ranges[i].range.limit));
        sizes_.emplace_back(sum);
        subcompactions--;
        sum = 0;
      }
    }
    sizes_.emplace_back(sum + ranges.back().size);
  } else {
    // Only one range so its size is the total sum of sizes computed above
    sizes_.emplace_back(sum);
  }

然后我们来看CompactJob::Run的实现,在这个函数中，就是会遍历所有的sub_compact,然后启动线程来进行对应的compact工作，最后等到所有的线程完成，然后退出.

  std::vector<port::Thread> thread_pool;
  thread_pool.reserve(num_threads - 1);
  for (size_t i = 1; i < compact_->sub_compact_states.size(); i++) {
    thread_pool.emplace_back(&CompactionJob::ProcessKeyValueCompaction, this,
                             &compact_->sub_compact_states[i]);
  }

  // Always schedule the first subcompaction (whether or not there are also
  // others) in the current thread to be efficient with resources
  ProcessKeyValueCompaction(&compact_->sub_compact_states[0]);

  // Wait for all other threads (if there are any) to finish execution
  for (auto& thread : thread_pool) {
    thread.join();
  }

可以看到run中的逻辑是，通过 ProcessKeyValueCompaction 拿到的sub_compact_states进行真正的compaction处理实际key-value的数据。

通过这样冗长的调用链，终于进入到了下一个阶段～～～

3.2 Process keys

主要做如下几件事情

将当前subcompaction 的k-v的数据取出，维护一个迭代器来进行访问（此时会构造一个堆排序的存储结构，来通过迭代器访问堆顶元素）
·这里指客户端对指定的key下发的merge操作，包括list append, add …之类的操作)

合并的过程主要是取到当前internal key的最新的snapshot对应的操作（主要针对put/delete，保留range_deletion）
将合并好的数据返回，交给迭代器一个一个进行访问，并进行后续的write操作（每访问一个，pop堆顶，并重建堆，再取堆顶元素）
创建输出的文件，并绑定builder 和 writer，方便后续的数据写入

大体过程如下图3.2

图3.2 compaction process key部分，这一部分主要做key之间的排序以及inernal key 的merge操作

3.2.1 构造能够访问所有key的迭代器

首先我们进入到***ProcessKeyValueCompaction***函数之中，通过之前步骤中填充的sub_compact数据取出对应的key-value数据，构造一个InternalIterator。

  std::unique_ptr<InternalIterator> input(versions_->MakeInputIterator(
      sub_compact->compaction, &range_del_agg, env_options_for_read_))

构造的过程是通过函数MakeInputIterator进行的，我们进入到该函数，这个函数构造迭代器的逻辑同样区分level-0和level-其他

先获取当前sub_compact所属的cfd
针对level-0,为其中的每一个sst文件构建一个table_cache迭代器，放入list之中
针对其他非level-0的层，每一层直接创建一个及联的迭代器并放入list之中。也就是这个迭代器从它的start就能够顺序访问到该层最后一个sst文件的最后一个key
因为非level-0的sst文件之间本身是有序的，不像level-0的sst文件之间可能有重叠。
将所有层的迭代器添加到一个迭代器数组之中，拿到该数组，通过 NewMergingIterator 迭代器维护一个底层的排序堆结构，完成所有层之间的key-value的排序

获取到当前sub_compact的cfd

auto cfd = c->column_family_data()

针对level-0中的每一个sst文件，构造一个table_cache的迭代器

      if (c->level(which) == 0) {
        const LevelFilesBrief* flevel = c->input_levels(which);
        for (size_t i = 0; i < flevel->num_files; i++) {
          list[num++] = cfd->table_cache()->NewIterator(
              read_options, env_options_compactions, cfd->internal_comparator(),
              *flevel->files[i].file_metadata, range_del_agg,
              c->mutable_cf_options()->prefix_extractor.get(),
              /*table_reader_ptr=*/nullptr,
              /*file_read_hist=*/nullptr, TableReaderCaller::kCompaction,
              /*arena=*/nullptr,
              /*skip_filters=*/false, /*level=*/static_cast<int>(which),
              /*smallest_compaction_key=*/nullptr,
              /*largest_compaction_key=*/nullptr);
        }
      }

对于非level-0的层，直接将该层构造一整体的迭代器

        // Create concatenating iterator for the files from this level
        list[num++] = new LevelIterator(
            cfd->table_cache(), read_options, env_options_compactions,
            cfd->internal_comparator(), c->input_levels(which),
            c->mutable_cf_options()->prefix_extractor.get(),
            /*should_sample=*/false,
            /*no per level latency histogram=*/nullptr,
            TableReaderCaller::kCompaction, /*skip_filters=*/false,
            /*level=*/static_cast<int>(which), range_del_agg,
            c->boundaries(which));

最后将获取到的迭代器数组交给 NewMergingIterator ，进行排序结构的维护。接下来我们看一下这个底层自动堆排序的迭代器是如何创建起来的。

如果list是空的，则直接返回空

如果只有一个，那么认为这个迭代器本身就是有序的，不需要构建一个堆排序的迭代器（level-0 的sst内部是有序的，之前创建的时候是为level-0每一个sst创建一个list元素；非level-0的整层都是有序的）

如果多个，那么直接通过MergingIterator来创建堆排序的迭代器

InternalIterator* NewMergingIterator(const InternalKeyComparator* cmp,
                                     InternalIterator** list, int n,
                                     Arena* arena, bool prefix_seek_mode) {
  assert(n >= 0);
  if (n == 0) {
    return NewEmptyInternalIterator<Slice>(arena);
  } else if (n == 1) {
    return list[0];
  } else {
    if (arena == nullptr) {
      return new MergingIterator(cmp, list, n, false, prefix_seek_mode);
    } else {
      auto mem = arena->AllocateAligned(sizeof(MergingIterator));
      return new (mem) MergingIterator(cmp, list, n, true, prefix_seek_mode);
    }
  }
}

接下来看一下 MergingIterator 这个迭代器的实现,通过将传入的list也就是函数中的children中的所有元素添加到一个vector中，再遍历其中的每一个key-value，通过函数 AddToMinHeapOrCheckStatus 构造堆排序的底层结构，关于该数据结构中的元素顺序是由用户参数option.comparator指定，默认是 BytewiseComparator 支持的lexicographical order，也就是字典顺序。

    children_.resize(n);
    for (int i = 0; i < n; i++) {
      children_[i].Set(children[i]);
    }
    for (auto& child : children_) {
      AddToMinHeapOrCheckStatus(&child);
    }
    current_ = CurrentForward();

关于函数AddToMinHeapOrCheckStatus中的构造过程通过函数，完成

  void upheap(size_t index) {
    T v = std::move(data_[index]);
    while (index > get_root()) {
      const size_t parent = get_parent(index);
      if (!cmp_(data_[parent], v)) { //这个比较器由用户传入，默认是字典序,即data[parent] < v 返回true
        break; // break的时候表示v已经无法下降，data_[parent]的字典序比v大，就退出循环吧
      }
      data_[index] = std::move(data_[parent]);
      index = parent;
    }
    data_[index] = std::move(v);
    reset_root_cmp_cache();
  }

构造最小堆的过程无非就是让插入的元素字典序中越小，越向上，如果没法上升则就放在原地，具体过程代码已经很明确了。

到此我们已经完成了整个key-value迭代器的构建，且获取到之后迭代器内部的元素是一个最大堆的形态。

3.2.2 通过SeekToFirst和Next指针处理元素

回到 ProcessKeyValueCompaction 函数,使用构造好的internalIterator再构造一个包含所有状态的CompactionIterator，直接初始化就可以，构造完成需要将 CompactionIterator 的内部指针放在整个迭代器最开始的部位，通过Next指针来获取下一个key-value，同时还需要需要在每次迭代器元素内部移动的时候除了调整底层堆中的字典序结构之外，还兼顾处理各个不同type的key数据，将kValueType，kTypeDeletion，kTypeSingleDeletion，kValueDeleteRange,kTypeMerge 等不同的key type处理完成。这一部分内容有非常多的逻辑，本篇还是先专注于compaction的主体逻辑。

关于kTypeDeleteRange的处理逻辑，感兴趣的伙伴可以参考Rocksdb DeleteRange实现原理。

c_iter->SeekToFirst();
......
while (status.ok() && !cfd->IsDropped() && c_iter->Valid()) {
  // Invariant: c_iter.status() is guaranteed to be OK if c_iter->Valid()
  // returns true.
  const Slice& key = c_iter->key();
  const Slice& value = c_iter->value();
  ......
  c_iter->Next();
  ...
}

这个while循环内部的逻辑除了Next()指针内部后台元素的处理之外，就是我们下面要讲的写入key-value到output的逻辑了。

3.3 Write keys

这一步其实是在ProcessKeyValueCompaction函数之内，其实主要是写入SST文件之中

确认key 的valueType类型，如果是data_block或者index_block类型，则放入builder状态机中

优先创建filter_buiilder和index_builder，index builer创建成分层格式(两层index leve, 第一层多个restart点，用来索引具体的datablock；第二层索引第一层的index block)，方便加载到内存进行二分查找，节约内存消耗，加速查找；其次再写data_block_builder
如果key的 valueType类型是 range_deletion，则加入到range_delete_block_builder之中
先将data_block builder 利用绑定的输出的文件的writer写入底层文件
将filter_block / index_builder / compress_builder/range_del_builder/properties_builder 按照对应的格式加入到 meta_data_builder之中，利用绑定ouput 文件的 writer写入底层存储
利用meta_data_handle 和 index_handle 封装footer,写入底层存储

如下图3.3 为write key部分

图3.3 write key部分，这一部分主要是将key-value数据按照其所属的区域固化到底层sst文件之中

3.3.1 将builder与输出文件的writer绑定

这里的写入建议大家先看一下SST文件详细格式源码解析，

默认的 blockbase table SST 文件有很多不同的block，除了data block之外，其他的block都是需要先写入到一个临时的数据结构 builder，然后由builder通过其绑定的output 文件的writer写入到底层磁盘形成磁盘的sst文件结构

这里的逻辑就是将builder与output文件的writer进行绑定，创建好table builder

    // Open output file if necessary
    if (sub_compact->builder == nullptr) {
      status = OpenCompactionOutputFile(sub_compact);
      if (!status.ok()) {
        break;
      }
    }

3.3.2 通过table_builder的状态机添加block数据

然后调用builder->Add函数构造对应的builder结构，添加的过程主要是通过拥有三个状态的状态机完成不同block的builder创建，状态机是由构造tablebuilder的时候创建的。

kBuffered 为状态机的初始状态。处于这个状态的时候，内存有较多缓存的未压缩的datablock。在该状态的过程中，通过 EnterUnbuffered 函数构造compression block，依此构建对应的index block和filterblock。最终将状态置为下一个状态的：kUnbuffered
kUnbuffered 这个状态时，compressing block已经通过之前的buffer中的data初步构造完成，且接下来将在这个状态通过 Finish 完成各个block的写入或者通过 Abandon 丢弃当前的写入
kClosed 这个状态之前已经完成了table builder的finish或者abandon，那么接下来将析构当前的table builder

对于第一个状态我们，进入如下逻辑，如果data block能够满足flush的条件，则直接flush datablock的数据到当前bulider对应的datablock存储结构中。

接着进入EnterUnbuffered函数之中：

    if (should_flush) {
      assert(!r->data_block.empty());
      Flush();

      if (r->state == Rep::State::kBuffered &&
          r->data_begin_offset > r->target_file_size) {
        EnterUnbuffered();
      }

EnterUnbuffered 函数主要逻辑是构造compression block，如果我们开启了compression的选项则会构造。

同时依据之前flush添加到datablock中的数据来构造index block和filter block，用来索引datablock的数据。选择在这里构造的话主要还是因为flush的时候表示一个完整的datablock已经写入完成，这里需要通过一个完整的datablock数据才有必要构造一条indexblock的数据。

其中data_block_and_keys_buffers数组存放的是未经过压缩的datablock数据

  for (size_t i = 0; ok() && i < r->data_block_and_keys_buffers.size(); ++i) {
    const auto& data_block = r->data_block_and_keys_buffers[i].first;
    auto& keys = r->data_block_and_keys_buffers[i].second; //多个datablock，取其中的一个
    assert(!data_block.empty());
    assert(!keys.empty());

    for (const auto& key : keys) {
      if (r->filter_builder != nullptr) {
        r->filter_builder->Add(ExtractUserKey(key));
      }
      r->index_builder->OnKeyAdded(key);
    }
    WriteBlock(Slice(data_block), &r->pending_handle, true /* is_data_block */);
    if (ok() && i + 1 < r->data_block_and_keys_buffers.size()) {
      Slice first_key_in_next_block =
          r->data_block_and_keys_buffers[i + 1].second.front();
      Slice* first_key_in_next_block_ptr = &first_key_in_next_block;
      r->index_builder->AddIndexEntry(&keys.back(), first_key_in_next_block_ptr,
                                      r->pending_handle);
    }
  }

这里构造index block的原则还是说提升索引datablock的效率之外还想要减少内存的消耗，所以这里会保存一段经过压缩的key的数据作为一个data block的偏移索引。

举例如下：
上一个data block的end key是"the queen"

下一个data block的start key是"the tea"

那么针对下一个data block的索引key就可以保存为"the s"，这样既能保证比上一个datablock中的key都要大，也能保证比下一个datablock中的数据都要小，也能减少内存的消耗。

这里初始化的index builer的类型根据blockbased的option来创建：

如果指定了kTwoLevelIndexSearch，则初始化为PartitionedIndexBuilder,它的index 结构是前n-1层是用来存储索引datablock的数据，最后一层是存储索引前n-1层index block的数据。
如果是默认的kBinarySearch，则就是支持二分查找的，则就是ShortenedIndexBuilder

还有其他的三种不同的index type
```
kHashSearch
kTwoLevelIndexSearch
kBinarySearchWithFirstKey
```

关于四种不同的index block，后续将专门分析，三种不同的数据结构，索引算法和效率也有差异。

在 EnterUnbuffered 函数创建index block

    if (table_options.index_type ==
        BlockBasedTableOptions::kTwoLevelIndexSearch) {
      p_index_builder_ = PartitionedIndexBuilder::CreateIndexBuilder(
          &internal_comparator, use_delta_encoding_for_index_values,
          table_options);
      index_builder.reset(p_index_builder_);
    } else {
      index_builder.reset(IndexBuilder::CreateIndexBuilder(
          table_options.index_type, &internal_comparator,
          &this->internal_prefix_transform, use_delta_encoding_for_index_values,
          table_options));
    }

回到 ProcessKeyValueCompaction 中的while循环中，我们不断的遍历迭代器中的key，将其添加到对应的datablock，并完善indeblock和filter block，以及compression block。

3.3.3 通过构建的meta_index_builder和Footer完成数据的固化

接下来将通过 FinishCompactionOutputFile 之前添加的builder数据进行整合，处理一些delete range 的block以及更新当前compaction的边界。

这个函数调用是当之前累计的builder中block数据的大小达到可以写入的sst文件本身的大小 max_output_file_size ，会触发当前函数

    Status input_status;
    if (sub_compact->compaction->output_level() != 0 &&
        sub_compact->current_output_file_size >=
            sub_compact->compaction->max_output_file_size()) {
      // (1) this key terminates the file. For historical reasons, the iterator
      // status before advancing will be given to FinishCompactionOutputFile().
      input_status = input->status();
      output_file_ended = true;
    }
    ......
		if (output_file_ended) {
      const Slice* next_key = nullptr;
      if (c_iter->Valid()) {
        next_key = &c_iter->key();
      }
      CompactionIterationStats range_del_out_stats;
      status =
          FinishCompactionOutputFile(input_status, sub_compact, &range_del_agg,
                                     &range_del_out_stats, next_key);
      RecordDroppedKeys(range_del_out_stats,
                        &sub_compact->compaction_job_stats);
    }

FinishCompactionOutputFile函数内部最终调用s = sub_compact->builder->Finish();完成所有数据的固化写入

  bool empty_data_block = r->data_block.empty();
  Flush(); //再次执行 先尝试将key-value的数据刷到datablock
  if (r->state == Rep::State::kBuffered) {
    EnterUnbuffered(); // 依据datablock数据构建index ,filter和compression block数据
  }
  // To make sure properties block is able to keep the accurate size of index
  // block, we will finish writing all index entries first.
  if (ok() && !empty_data_block) {
    r->index_builder->AddIndexEntry(
        &r->last_key, nullptr /* no next data block */, r->pending_handle);
  }
  ......
  BlockHandle metaindex_block_handle, index_block_handle;
  MetaIndexBuilder meta_index_builder;
  WriteFilterBlock(&meta_index_builder); //filter_builder数据添加到 meta_index_builder
  WriteIndexBlock(&meta_index_builder, &index_block_handle);//添加index_builder
  WriteCompressionDictBlock(&meta_index_builder); //添加compression block
  WriteRangeDelBlock(&meta_index_builder); //添加range tombstone
  WritePropertiesBlock(&meta_index_builder); //添加最终的属性数据
  if (ok()) {
    // flush the meta index block
    WriteRawBlock(meta_index_builder.Finish(), kNoCompression,
                  &metaindex_block_handle);
  }
  if (ok()) {
    WriteFooter(metaindex_block_handle, index_block_handle); //写Footer数据
  }

  r->state = Rep::State::kClosed; //最终返回table_builder的close状态，析构当前的table builer
  return r->status;
}

4. 总结

到此，Compaction的主体三个步骤就已经描述完成，从Prepare keys到Write keys。
从实现的代码逻辑上，可以说是真的很复杂，而且说实话，代码细节以及高级语法没得说。但是函数封装这里，动不动就几百行的长函数，可能这也是这个单机引擎难啃的原因之一吧。

关于以上实现原理的描述并没有将细节完全讲清楚，比如

Prepare keys过程，pickcompaction函数中clean cut算法的实现原理，有点像B树的查找，但具体实现还需要研究
Process keys过程，那么多复杂的迭代器转来转去从开始的Internal Iterator，mergeIterator, CompactionIterator…不同迭代器之间是什么关系呢？
Write keys的过程细节最多，设计也是最多的。
- Filter block的实现 – block base filter和full filter两种基本实现，效率和实现算法之间的差异
- index filter中的四种不同的index filter实现，索引datablock的效率如何体现在实现的查找算法之上。
- Compression block的实现，rocksdb支持常见的snappy，zlib,lz4等压缩算法，在compersion block中这一些压缩算法是怎么实现的，都需要仔细研究揣摩。

希望有想法，了解的伙伴一起交流讨论。

你可能感兴趣的:(存储引擎,#,Rocksdb)

MySQL存储引擎 JustGopher MySQL 数据库 mysql 数据库
MySQL体系结构连接层最上层是一些客户端和连接服务，主要完成一些类似于连接处理、授权认证、及相关的安全方案。服务器也会为每个安全接入的用户端验证它所具有的操作权限。服务层第二层架构主要完成大多数的核心服务功能，如SQL接口，并完成缓存的查询，SQL的分析和优化、部分内置函数的执行。所有跨存储引擎的功能也在这一层实现，如：过程、函数等。引擎层存储引擎真正的负责了MySQL中数据的存储和提取，服务器
MySql（十）：InnoDB存储引擎内存和磁盘架构 EShaooo MySql系列 innodb mysql 数据库 sql mysql优化
MySql存储引擎数据库底层软件组件，数据库管理系统使用数据引擎进行创建、查询、更新和删除数据操作//查看系统支持的存储引擎showengines;+--------------------+---------+----------------------------------------------------------------+--------------+------+-------
【赵渝强老师】MongoDB写入数据的过程数据库nosqlmongodb
在MongoDB数据更新时，WiredTiger存储引擎使用预写日志的机制先将数据更新写入到Journal日志文件中。然后在创建检查点操作开始时，再将日志文件中记录的操作刷新到数据文件。换句话说，通过预写日志和检查点机制可以保证将数据更新持久化到数据文件中，并实现数据的一致性。视频讲解如下：https://www.bilibili.com/video/BV1xhHWexE7X/?aid=11307
mysql梳理2 mysql
mysql逻辑架构最上层不是Mysql独有的，比如连接处理，授权认证，安全等等第二层核心服务功能，包括查询解析，分析，优化，缓存以及所有内置函数，存储过程，触发器，视图等都在这层实现第三层存储引擎，存储引擎API包含几十个底层函数。优化与执行：每个连接都会在mysql服务端产生一个线程（内部通过线程池管理线程），比如一个select语句进入，mysql首先会在查询缓存中查找是否缓存了这个selec
PingCAP TiDB数据库专员PCTA认证笔记 handsomestWei 数据库 tidb 数据库
tidb-pcta-notePingCAPTiDB数据库专员PCTA认证笔记相关链接官网认证中心TiDB社区体系架构数据库设计存算分离。三层架构：PD（PlacementDriver）负责集群元信息管理和调度，TiDB负责sql计算，TiKV负责存储存储引擎1、基于LSM-Tree的RocksDB引擎，比B-Tree写入更快，用空间置换写入延迟2、数据冗余副本：multiraft-group副本机
MySQL 如何对text类型字段添加索引呢风_流沙 mysql 数据库
对于MySQL中的text类型字段，可以通过以下步骤向其添加索引：创建辅助字段：由于MySQL在InnoDB存储引擎中不支持直接为text类型字段添加索引，所以首先需要创建一个辅助字段，将该字段的一部分数据转移到辅助字段中。例如，可以创建一个varchar类型的字段来存储text字段的前缀。添加索引：对于辅助字段，可以使用普通的索引来加速查询操作。使用ALTERTABLE语句来添加索引，例如：AL
查询mysql的引擎 PlanOne_A MySQL mysql 数据库 java
一般情况下，mysql会默认提供多种存储引擎,你可以通过下面的查看:看你的mysql现在已提供什么存储引擎:mysql>showengines;看你的mysql当前默认的存储引擎:mysql>showvariableslike'%storage_engine%';你要看某个表用了什么引擎(在显示结果里参数engine后面的就表示该表当前用的存储引擎):mysql>showcreatetable表名
TiKV －读写与Coprocessor m0_75231205 tidb
数据的写入日志持久化在rocksdbraft中，kv持久化在rocksdbkv中，Raft保证了数据的多副本一致性。raftstorepool：线程池，收到写请求，将写请求转化为raft日志，持久化日志，将日志发送给其他日志所在节点，其他的raftstorepool负责接收，将日志持久化到rocksdbraft中，当副本大多数TiKV节点返回append成功了，就认为Raft日志做的修改，它com
【TIDB】tidb 的架构戒掉贪嗔痴(薛双奇) 国产数据库-TIDB tidb 架构
1.tidb的架构TiDB的架构主要由几个关键组件构成，‌这些组件共同协作以提供一个分布式的关系型数据库解决方案。‌以下是TiDB架构的主要组成部分及其功能：‌TiDBServer：‌主要负责解析SQL查询并将数据读取请求转发给底层的存储节点。‌它本身并不存储数据，‌而是作为一个轻量级的SQL层存在，‌提供标准的SQL接口，‌兼容MySQL协议和语法。‌TiKV：‌作为底层的分布式键值对存储引擎，
【国产数据库】GBase学习⑨ - 存储引擎洁癖丶 GBase学习数据库
【国产数据库】GBase学习⑨-存储引擎存储引擎存储方法存储方法的使用分区表表分片分区自动管理索引类型数据压缩事务存储引擎USTORE,表示表支持Inplace-Update存储引擎。（原文更新技术，类似mysql的on-do）ASTORE,表示表支持Append-Only存储引擎。（有表？？的问题，↑解决这个问题）存储方法ROW:表示表的数据将以行式存储；行存储适合于OLTP业务，适用于点查询或
MySQL高可用性的守护者：主从复制的深度解析与实践指南墨夶数据库学习资料1 mysql adb 数据库
在当今瞬息万变的数据驱动世界中，确保数据库系统的高可用性和数据一致性是每个企业IT架构师面临的重大挑战。对于依赖MySQL作为核心存储引擎的企业来说，如何构建一个稳定、可靠且易于维护的数据库集群至关重要。今天，我们将深入探讨MySQL主从复制技术，它是实现高可用性架构的关键组件之一。通过本文，您将不仅了解到主从复制的基本原理和配置方法，还将掌握如何优化性能、解决常见问题以及应对故障转移等高级技巧。
oceanbase架构、功能模块、数据存储、特性、sql流转层等概念详解小成很成数据库
一、架构图OceanBase数据库采用无共享（Shared-Nothing）分布式集群架构，各个节点之间完全对等，每个节点都有自己的SQL引擎、存储引擎、事务引擎，运行在普通PC服务器组成的集群之上，具备高可扩展性、高可用性、高性能、低成本、与主流数据库高兼容等核心特性。OceanBase数据库的一个集群由若干个节点组成。这些节点分属于若干个可用区（Zone），每个节点属于一个可用区。可用区是一个
lvm快照备份小吃饱了 adb
前提数据文件要在逻辑卷上；此逻辑卷所在卷组必须有足够空间使用快照卷；数据文件和事务日志要在同一个逻辑卷上；前提：MySQL数据lv和将要创建的快照要在同一vg，vg要有足够的空间存储优点几乎是热备（创建快照前把表上锁，创建完毕后立即释放）支持所有的存储引擎备份速度快无需使用昂贵的商业软件（操作系统级别的）缺点可能需要部门协调（使用操作系统级别的命令，DBA一般没有权限）无法预计服务停止时间数据如果
MySQL字段约束条件,外键约束条件,表关系 Yietong309 MySQL数据库 mysql 数据库开发语言
目录字符编码与配置文件统一字符编码存储引擎修改存储引擎的方式自定义选项存储引擎不同存储引擎产生的表文件有几个?MERGEInnoDBArchiveBLACKHOLEblackhole与memory存取数据的特征Blackhole：丢弃写操作，读操作会返回空内容Memory：置于内存的表创建表的完整语法字段类型之整型字段类型之浮点型字段类型之字符类型字段类型之枚举与集合字段类型之日期类型约束条件自增
云原生主键模型：高效、弹性，省钱又省心数据库大数据
作者简介：罗一鑫，StarRocksCommitter，主要负责存储引擎相关的工作。导读：在StarRocks3.3.1版本中，我们推出了云原生持久化索引，旨在解决本地磁盘持久化索引的关键问题。本文将详细探讨其优势，并对比云原生与本地磁盘持久化索引在大批量导入、小批实时导入以及弹性调度等场景中的表现。尤其在弹性调度场景中，云原生架构使延迟性能提升至本地磁盘的10倍。主键模型是StarRocks全新
MySQL面试题泰山小张只吃荷园 mysql 数据库 java 面试后端
MySQL目录1.MySQL中的数据排序是怎么实现的？2.那怎么去优化ORDERBY呢？3.MySQL中的ChangeBuffer是什么?有什么作用？4.详细描述一下一条SQL语句在MySQL中的执行过程5.MySQL的存储引擎有哪些？6.MySQL的索引有哪些？7.MySQLInnoDB引擎中的聚集索引和非聚集索引有什么区别?8.MySQL索引的最左前缀匹配原则是什么?9.MySQL的覆盖索引是
Spring @Transactional注解失效场景重现轻尘× Spring Java基础 MysQL 后端 mysql java spring
环境jdk1.8+springboot2.1.0.RELEASE+mysql8innerDB存储引擎正常在数据插入一条数据抛出checked异常@TransactionalpublicApiResultupdateUser(@RequestBodyUserParamsuser)throwsException{SysUsersysUser=newSysUser();sysUser.setUserNa
什么时候需要分表分库？ fajianchen IT架构系列 IT架构高性能分库分表
目录背景什么时候要分表分库？如何分表分库？系列文章背景对于一个日活用户在百万数量级的商城来说，每天产生的订单数量可能在百万级，特别在一些活动促销期间，甚至上千万。假设我们基于单表来实现，每天产生上百万的数据量，不到一个月的时间就要承受上亿的数据，这时单表的性能将会严重下降。因为MySQL在InnoDB存储引擎下创建的索引都是基于B+树实现的，所以查询时的I/O次数很大程度取决于树的高度，随着B+树
【赵渝强老师】MongoDB文档级别的并发控制数据库nosqlmongodb
MongoDB在执行写操作时，WiredTiger存储引擎会在文档级别进行并发控制。换句话说在同一时间点上，多个写操作能够修改同一个集合中的不同文档；而当多个写操作修改同一个文档时，必须以序列化方式执行。这意味着如果当前文档正在被修改，其他写操作必须等待该文档上的写操作完成之后才能进行修改。对于大部分的文档读写操作，WiredTiger引擎使用的都是乐观锁；而在数据库和集合级别，WiredTige
mysql mvcc jie_1024 mysql
mysqlMVCCMVVC实现：排他锁+undolog+版本事务链+一致性read-view视图+版本事务链匹配规则一致性非锁定读在InnoDB存储引擎中，多版本控制(multiversioning)openinnewwindow就是对非锁定读的实现。如果读取的行正在执行DELETE或UPDATE操作，这时读取操作不会去等待行上锁的释放。相反地，InnoDB存储引擎会去读取行的一个快照数据，对于这
[图数据库]HugeGraph 1.5.0 版本发布了码农丁丁 #图数据库 #数据库数据库图数据库 HugeGraph
运行环境/版本说明1.5.0版开始，hugegraph相关组件仅支持Java11编译/运行环境PS:未来HugeGraph组件的版本会朝着Java11->Java17->Java21演进hugegraph本版本新增了大量功能并进行了多项优化，尤其是针对自控分布式版本新后端HStore(Raft+RocksDB)的实现支持，欢迎试用反馈APIChangesBREAKINGCHANGE:Support
超详细：数据库的基本架构上官花雨数据库架构
MySQL基础架构下面这个图是我给出的一个MySQL基础架构图，可以清楚的了解到SQL语句在MySQL的各个模块进行执行过程。然后MySQL可以分为两个部分，一个是server层，另一个是存储引擎。server层Server层涵盖了MySQL的大多数核心服务功能，以及所有的内置函数（如日期、时间、数学和加密函数等）。所有跨存储引擎的功能都在这一层实现，比如存储过程、触发器、视图等。Server层主
【MySQL】InnoDB引擎星鸦wyk MySQL mysql 数据库 sql
之前在写存储引擎的时候只是简单的介绍了下引擎是干什么的以及一些引擎的特点,这篇重点包括InnoDB引擎的逻辑存储结构,架构,事务原理和MVCC文章目录1.逻辑存储结构2.架构2.1内存结构2.1.1缓冲池2.1.2更改缓冲区2.1.3自适应哈希索引2.1.4日志缓冲区2.2磁盘结构2.2.1系统表空间2.2.2文件表空间2.2.3通用表空间2.2.4撤销表空间2.2.5临时表空间2.2.6双写缓冲
innodb存储引擎朱朱朱-- mysql
文章目录innodb引擎特点：innodb体系架构后台线程内存缓存池LRUList,FreeList和FlushListLRUListFreeList:FlushListinnodb引擎特点：支持事务（myisam无）支持行锁，表锁（myisam只支持表锁）支持外键（myisam无）通过对版本并发控制（mvcc）来获得高并发性插入缓存（insertbuffer）二次写（doublewrite）自适
InnoDB 和 MyISAM的区别 DaXiongJoker 数据库 mysql 搜索引擎后端
InnoDB和MyISAM是MySQL数据库中两种常用的存储引擎，它们各自具有不同的特点和适用场景。以下是两者的详细对比：InnoDB特点：事务支持：支持ACID（原子性、一致性、隔离性、持久性）事务。提供回滚、提交和崩溃恢复能力。行级锁：使用行级锁机制，允许多个用户同时对不同行进行写操作，提高并发性能。适合高并发的读写混合场景。外键约束：支持外键约束，确保数据完整性。有助于维护表与表之间的关系。
MySQL日志沉着冷静2024 MySQL mysql 数据库
MySQL日志文章目录MySQL日志MySQL三大日志binlog的三种格式redolog和binlog的区别和应用场景为什么崩溃恢复不用binlog而用redolog？redolog如何实现持久化redolog还能做什么？redolog的三种刷盘策略两阶段提交什么是？为什么？两阶段提交过程MySQL三大日志1.undologundolog是InnoDB存储引擎层的日志，实现了事务的原子性，主要用
MySQL锁沉着冷静2024 MySQL mysql 数据库
MySQL锁文章目录MySQL锁MySQL中锁的分类创建索引时会锁表吗线上修改表结构会加什么锁Innodb存储引擎的行级锁有哪些Update语句中，不带where条件，加什么锁？MySQL实现乐观锁MySQL死锁MySQL死锁是怎么发生的？检查死锁如何避免死锁MySQL中锁的分类全局锁：主要用于全库逻辑备份表级锁：表锁、元数据锁、意向锁表锁：通过locktables语句对表进行加锁，它不仅限制其他
openGauss 扩展FDW与其他openGauss特性 openGaussMan 数据库 openGauss
扩展FDW与其他openGauss特性openGauss基于PostgreSQL，而PostgreSQL没有内置存储引擎适配器，如MySQL的handlerton。为了使MOT存储引擎能够集成到openGauss中，我们利用并扩展了现有的FDW机制。随着FDW引入PostgreSQL9.1，现在可以将这些外表和数据源呈现为统一、本地可访问的关系来访问外部管理的数据库。和PostgreSQL不同的是
2024Mysql And Redis基础与进阶操作系列（8）作者——LJS[含MySQL 创建、修改、跟新、重命名、删除视图等具体详步骤；注意点及常见报错问题所对应的解决方法] 肾透侧视攻城狮 MYSQL REDIS Advance operation redis mysql 数据库 linux sql bash adb
目录1MySQL视图1.概念2.作用3.特点4.具体如何操作实现MYSQL视图4.1创建视图语法示例查看表和视图查看视图的结构查看视图属性信息（比如：显示数据表的存储引擎、版本、数据行数和数据大小等）查看视图的详细定义信息4.2修改视图简介格式举例4.3更新视图简介下述结构中不可更新的视图补充说明举例更新视图视图包含聚合函数不可更新视图包含distinct不可更新视图包含goupby、having
嵌入式数据库sqlite和rocksdb的介绍以及对比问道飞鱼数据库相关技术数据库 sqlite rocksdb
SQLite和RocksDB都是非常流行的嵌入式数据库系统，但它们的设计理念和应用场景有所不同。下面是对这两个数据库系统的详细介绍以及它们之间的主要区别。SQLite简介SQLite是一个轻量级的关系数据库管理系统，完全由C语言编写而成。它以单一文件的形式存储数据库，并且不需要独立的服务器进程或管理程序。SQLite直接嵌入到应用程序中，这使得它非常适合移动设备、嵌入式系统和桌面应用程序。特点嵌入
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

Rocksdb Compaction源码详解（二）：Compaction 完整实现过程 概览