Jermy Li

RocksDB 源码分析-接口下的数据结构

RocksDB是非常流行的KV数据库，是LSM-Tree数据库的典型代表，很多分布式数据库NewSQL、图数据库都使用RocksDB作为底层存储引擎，RocksDB在稳定性和性能等方面都比较出色。

HugeGraph图数据库底层也支持RocksDB作为后端存储，HugeGraph使用的是Java语言，RocksDB是C++语言编写，幸好官方提供了Java JNI接口可直接使用。RocksDB的功能非常聚焦，可以简单理解为其提供一个个Map来存取键值对，所以核心接口基本就是put、get、scan等，使用起来还是比较简单。不过简单的接口下面，蕴含了非常复杂的内部结构，本文对其接口下的几个核心结构进行分析。

最频繁使用的RocksDB接口：

RocksDB：数据库实例，所有操作的入口
ColumnFamilyHandle：CF描述符，类似文件描述符，可简单理解为Map的指针
RocksIterator：查询迭代器，scan查询的操作接口

先看几个问题：

Iterator、ColumnFamilyHandle 背后的是怎么把 MemTable、ImmMemTable、Manifest、SST 等组织起来的？
要查找某个 CF 中指定key范围的值，如何定位到某个文件的某个位置？
Iterator 的生命周期如何管理？在 CF close 之后 Iterator 如何保持依旧可用而不被释放？

重点类结构及其关系：ColumnFamilyHandle

ColumnFamilyHandle <--- ColumnFamilyHandleImpl ---+ ColumnFamilyData  ---+ SuperVersion   -----------------------+ Version current ------------------+ uint64_t version_number
                                                  + MemTable mem         + MemTableListVersion imm               + ColumnFamilyData cfd
                                                  + MemTableList imm     + MemTable mem why?                     + VersionStorageInfo storage_info (SSTs meta)
                                                  + Ref refs             + Ref refs
                                                  + ColumnFamilyOptions
                                                  + ColumnFamilyData (next & prev)

ColumnFamilyHandle是CF（类似表Table）的描述符，从创建CF或打开数据库时，就可以拿到各CF的Handle，对表的任何操作都需要ColumnFamilyHandle描述符来进行，比如put、get、scan，如示例：rocksdb.put(cfHandle, key, value)。

ColumnFamilyHandle可通过如下示例代码获取：

cfHandle=RocksDB.createCF()

或

cfHandles=RocksDB.open(cfNames)

ColumnFamilyHandle下层的ColumnFamilyData则管理着CF的各种状态、资源，包括memtable、immutables，以及通过SuperVersion管理CF的元数据，如当前版本号、SSTs文件信息等，而所有的ColumnFamilyData都放在db实例的ColumnFamilySet中。

重点类结构及其关系：Iterator

Iterator <--- ArenaWrappedDBIter ---+ DBIter db_iter ----------+ InternalIterator iter <------- MergingIterator ---+ vector children  ---+ MemTableIterator memtable
                                    + Arena arena              + bool valid                                        + MergerMinIterHeap minHeap             + MemTableIterator immutables
                                    + uint64_t sv_number       + IterKey saved_key                                 + InternalIterator current              + BlockBasedTableIterator level 0
                                                               + string saved_value                                                                        + LevelIterator level 1~n
                                                               + SequenceNumber sequence
                                                               + iterate_lower_bound、iterate_upper_bound、prefix_start_key
                                                               + user_comparator、merge_operator、prefix_extractor
                                                               + LocalStatistics local_stats

查询时，最外层使用RocksDB.newIterator(cfHandle)来得到Iterator，进一步通过Iterator来查询指定CF的数据，除点查get操作根据key获得value外，其它所有查询都是基于Iterator之上的，包括全表扫描、范围查找（大于、小于、区间）、前缀查找等。Iterator涵盖内容和生命周期都比较复杂，读取路径基本蕴含RocksDB的大部分关键概念。

构建最外层迭代器：RocksDB.newIterator(cfHandle) 调用栈：

ArenaWrappedDBIter::Init 0x7feefb8f5c00, allow_refresh_=1
ArenaWrappedDBIter::Init()
 0   librocksdbjni3300438414871377681.jnilib 0x0000000121dc8236 _ZN7rocksdb18ArenaWrappedDBIter4InitEPNS_3EnvERKNS_11ReadOptionsERKNS_18ImmutableCFOptionsERKyyyPNS_12ReadCallbackEbb + 214
 1   librocksdbjni3300438414871377681.jnilib 0x0000000121dc85ba _ZN7rocksdb25NewArenaWrappedDbIteratorEPNS_3EnvERKNS_11ReadOptionsERKNS_18ImmutableCFOptionsERKyyyPNS_12ReadCallbackEPNS_6DBImplEPNS_16ColumnFamilyDataEbb + 266
 2   librocksdbjni3300438414871377681.jnilib 0x0000000121d640f9 _ZN7rocksdb6DBImpl11NewIteratorERKNS_11ReadOptionsEPNS_18ColumnFamilyHandleE + 617
 3   librocksdbjni3300438414871377681.jnilib 0x0000000121c8757e Java_org_rocksdb_RocksDB_iteratorCF__JJ + 78

RocksDB.newIterator()返回的是一个ArenaWrappedDBIter对象，ArenaWrappedDBIter相当于一个外壳，其持有的DBIter包括了大量的状态变量（上图最高部分，如当前读取key&value），还持有一个内部迭代器InternalIterator，DBIter的作用是将查询转发给底层InternalIterator，InternalIterator返回的KV是原始的二进制数据，DBIter获取到数据之后解析为有含义的内容，包括版本号sequence（末尾8-1字节）、操作类型type（末尾1字节，包括普通的Value Key、删除操作Delete Key、合并操作Merge Key等）、实际用户Key内容，比如Delete Key则需要跳过去读取下一个Key，Merge Key则需要合并新老值，处理完成之后才返回结果。

其中Arena是用来存放DBIter以及其内部的InternalIterator的，目的是用于防止过多小内存碎片，DBIter中包括大量成员，Arena申请了一大片空间用于存放所有这些成员，而非每个成员申请一小点内存。

此外，ArenaWrappedDBIter还包括部分额外用于迭代器 Refresh 的信息ColumnFamilyData cfd_ 、DBImpl db_impl_ 、ReadOptions read_options_，Refresh是指当SuperVersionNumber比创建迭代器时的版本更新时，需要重新创建内部DBIter和InternalIterator，详见方法ArenaWrappedDBIter::Refresh()

详细的KV格式见 db/memtable.cc / MemTable::Add()：internal_key_size(varint) + internal_key(user_key+sequence+type) + value_size(varint) + value。对于上层来说其中的user_key可能还在真正的用户数据末尾包含了timestamp。

WriteBatch层格式见 db/write_batch.cc / WriteBatchInternal::Put()：tag(type) + cf_id(varint) + key_and_timestamp_size(varint) + key_data + timestamp + value_size(varint) + value_data。

注意当启用TTL时，DBWithTTLImpl::Write()中显示，timestamp是加到value后面的4字节，TTL的过滤见TtlCompactionFilter。

更多Put()内容见 DBImpl::WriteImpl() -> WriteBatchInternal::InsertInto() -> WriteBatch::Iterate() -> WriteBatchInternal::Iterate() -> MemTableInserter::PutCFImpl() -> MemTable::Add()。

MergingIterator是一个包罗万象的迭代器，是InternalIterator的一种，下层的各种类型的子迭代器都被放在MergingIterator中，包括memtable、immutables、SSTs的InternalIterator，由一个vector集合持有，并通过最小堆minHeap来优化pick哪个字迭代器的KV。

重点代码概览：

构建InternalIterator：DBImpl::NewInternalIterator()，代码详见末尾。
MergingIterator从子迭代器中选择读取下一个键值：MergingIterator::SeekToFirst() & Next()，代码详见末尾。
迭代器解析数据方法：DBIter::FindNextUserEntryInternal()，代码详见末尾。

解答一下开头的几个问题：

问题1，Iterator、ColumnFamilyHandle 背后的是怎么把 MemTable、ImmMemTable、Manifest、SST 等组织起来的？

从上面的分析看应该基本清楚了。

问题2，要查找某个 CF 中指定key范围的值，如何定位到某个文件的某个位置？

从 ArenaWrappedDBIter::Seek(const Slice& target) 方法一直往下追即可，到 MergingIterator::Seek(const Slice& target) 时，对所有的子迭代器进行一次Seek，然后按key排序将子迭代器放入最小堆中，返回最小key的子迭代器，通过 ArenaWrappedDBIter::Next() 获取下一个key时，将上次最小迭代器的值取走，接着依然返回最小key的子迭代器，如此循环往复直到上界。

那么子迭代器的Seek是如何完成的？

内存中的MemTableIterator的Seek，以SkipList表为例，会通过SkipListRep::Iterator::Seek()找到SkipList对应的节点；
level 0 SST文件（可能有多个）的Seek，会通过BlockBasedTableIterator::Seek()/PlainTableIterator::Seek()找到，BlockBasedTable是SST的默认格式，BlockBasedTableIterator内部又通过SST的Block索引IndexIterator::Seek()来快速定位文件内部大致位置（哪个Block，一搬一个Block为4K大小），最终在Block内通过BlockIter::Seek()以二分查找找到key对应的具体Entry；
level 1~n SST文件的Seek，则是每层有一个LevelIterator，对于一层的多个SST文件，其内容都是排好序的，LevelIterator::Seek()先找到key对应的该层文件，并返回某个SST文件的BlockBasedTableIterator，再调用BlockBasedTableIterator::Seek()，接下来流程与上述level 0中分析类似；

问题3，Iterator 的生命周期如何管理？在 CF close 之后 Iterator 如何保持依旧可用而不被释放？

在ColumnFamilyData结构中有一个refs引用计数，当调用ColumnFamilyHandle.close()释放CF描述符时，只会对下层的ColumnFamilyData引用减1，只有引用refs=0时才真正释放（代码参考析构函数~ColumnFamilyHandleImpl()）。

关键结构

关键结构：ColumnFamilyData

代码路径：rocksdb/db/column_family.cc

// This class keeps all the data that a column family needs.
// Most methods require DB mutex held, unless otherwise noted
class ColumnFamilyData {
  uint32_t id_;
  const std::string name_;
  Version* dummy_versions_;  // Head of circular doubly-linked list of versions.
  Version* current_;         // == dummy_versions->prev_

  std::atomic refs_;      // outstanding references to ColumnFamilyData
  std::atomic initialized_;
  std::atomic dropped_;  // true if client dropped it

  const InternalKeyComparator internal_comparator_;
  std::vector>
      int_tbl_prop_collector_factories_;

  const ColumnFamilyOptions initial_cf_options_;
  const ImmutableCFOptions ioptions_;
  MutableCFOptions mutable_cf_options_;

  const bool is_delete_range_supported_;

  std::unique_ptr table_cache_;

  std::unique_ptr internal_stats_;

  WriteBufferManager* write_buffer_manager_;

  MemTable* mem_;
  MemTableList imm_;
  SuperVersion* super_version_;

  // An ordinal representing the current SuperVersion. Updated by
  // InstallSuperVersion(), i.e. incremented every time super_version_
  // changes.
  std::atomic super_version_number_;

  // Thread's local copy of SuperVersion pointer
  // This needs to be destructed before mutex_
  std::unique_ptr local_sv_;

  // pointers for a circular linked list. we use it to support iterations over
  // all column families that are alive (note: dropped column families can also
  // be alive as long as client holds a reference)
  ColumnFamilyData* next_;
  ColumnFamilyData* prev_;

  // This is the earliest log file number that contains data from this
  // Column Family. All earlier log files must be ignored and not
  // recovered from
  uint64_t log_number_;

  std::atomic flush_reason_;

  // An object that keeps all the compaction stats
  // and picks the next compaction
  std::unique_ptr compaction_picker_;

  ColumnFamilySet* column_family_set_;

  std::unique_ptr write_controller_token_;

  // If true --> this ColumnFamily is currently present in DBImpl::flush_queue_
  bool queued_for_flush_;

  // If true --> this ColumnFamily is currently present in
  // DBImpl::compaction_queue_
  bool queued_for_compaction_;

  uint64_t prev_compaction_needed_bytes_;

  // if the database was opened with 2pc enabled
  bool allow_2pc_;

  // Memtable id to track flush.
  std::atomic last_memtable_id_;

  // Directories corresponding to cf_paths.
  std::vector> data_dirs_;
};

关键结构：ArenaWrappedDBIter

代码路径：rocksdb/db/db_iter.cc（rocksdb/db/db_impl.cc ArenaWrappedDBIter* DBImpl::NewIteratorImpl() <= Iterator* DBImpl::NewIterator()）

// A wrapper iterator which wraps DB Iterator and the arena, with which the DB
// iterator is supposed be allocated. This class is used as an entry point of
// a iterator hierarchy whose memory can be allocated inline. In that way,
// accessing the iterator tree can be more cache friendly. It is also faster
// to allocate.
class ArenaWrappedDBIter : public Iterator {
  DBIter* db_iter_;
  Arena arena_;
  uint64_t sv_number_;
  ColumnFamilyData* cfd_ = nullptr;
  DBImpl* db_impl_ = nullptr;
  ReadOptions read_options_;
  ReadCallback* read_callback_;
  bool allow_blob_ = false;
  bool allow_refresh_ = true;
};

ArenaWrappedDBIter* DBImpl::NewIteratorImpl(const ReadOptions& read_options,
                                            ColumnFamilyData* cfd,
                                            SequenceNumber snapshot,
                                            ReadCallback* read_callback,
                                            bool allow_blob,
                                            bool allow_refresh) {
  // Try to generate a DB iterator tree in continuous memory area to be
  // cache friendly. Here is an example of result:
  // +-------------------------------+
  // |                               |
  // | ArenaWrappedDBIter            |
  // |  +                            |
  // |  +---> Inner Iterator   ------------+
  // |  |                            |     |
  // |  |    +-- -- -- -- -- -- -- --+     |
  // |  +--- | Arena                 |     |
  // |       |                       |     |
  // |          Allocated Memory:    |     |
  // |       |   +-------------------+     |
  // |       |   | DBIter            | <---+
  // |           |  +                |
  // |       |   |  +-> iter_  ------------+
  // |       |   |                   |     |
  // |       |   +-------------------+     |
  // |       |   | MergingIterator   | <---+
  // |           |  +                |
  // |       |   |  +->child iter1  ------------+
  // |       |   |  |                |          |
  // |           |  +->child iter2  ----------+ |
  // |       |   |  |                |        | |
  // |       |   |  +->child iter3  --------+ | |
  // |           |                   |      | | |
  // |       |   +-------------------+      | | |
  // |       |   | Iterator1         | <--------+
  // |       |   +-------------------+      | |
  // |       |   | Iterator2         | <------+
  // |       |   +-------------------+      |
  // |       |   | Iterator3         | <----+
  // |       |   +-------------------+
  // |       |                       |
  // +-------+-----------------------+

详细代码

构建InternalIterator：DBImpl::NewInternalIterator()：

InternalIterator* DBImpl::NewInternalIterator(
    const ReadOptions& read_options, ColumnFamilyData* cfd,
    SuperVersion* super_version, Arena* arena,
    RangeDelAggregator* range_del_agg) {
  InternalIterator* internal_iter;
  assert(arena != nullptr);
  assert(range_del_agg != nullptr);
  // Need to create internal iterator from the arena.
  MergeIteratorBuilder merge_iter_builder(
      &cfd->internal_comparator(), arena,
      !read_options.total_order_seek &&
          cfd->ioptions()->prefix_extractor != nullptr);
  // Collect iterator for mutable mem
  merge_iter_builder.AddIterator(
      super_version->mem->NewIterator(read_options, arena));
  std::unique_ptr range_del_iter;
  Status s;
  if (!read_options.ignore_range_deletions) {
    range_del_iter.reset(
        super_version->mem->NewRangeTombstoneIterator(read_options));
    s = range_del_agg->AddTombstones(std::move(range_del_iter));
  }
  // Collect all needed child iterators for immutable memtables
  if (s.ok()) {
    super_version->imm->AddIterators(read_options, &merge_iter_builder);
    if (!read_options.ignore_range_deletions) {
      s = super_version->imm->AddRangeTombstoneIterators(read_options, arena,
                                                         range_del_agg);
    }
  }
  TEST_SYNC_POINT_CALLBACK("DBImpl::NewInternalIterator:StatusCallback", &s);
  if (s.ok()) {
    // Collect iterators for files in L0 - Ln
    if (read_options.read_tier != kMemtableTier) {
      super_version->current->AddIterators(read_options, env_options_,
                                           &merge_iter_builder, range_del_agg);
    }
    internal_iter = merge_iter_builder.Finish();
    IterState* cleanup =
        new IterState(this, &mutex_, super_version,
                      read_options.background_purge_on_iterator_cleanup);
    internal_iter->RegisterCleanup(CleanupIteratorState, cleanup, nullptr);

    return internal_iter;
  } else {
    CleanupSuperVersion(super_version);
  }
  return NewErrorInternalIterator(s, arena);
}

MergingIterator从子迭代器中选择读取下一个key，其中用到最小堆加速pick：MergingIterator::SeekToFirst() & Next()

virtual void SeekToFirst() override {
    ClearHeaps();
    status_ = Status::OK();
    for (auto& child : children_) {
      child.SeekToFirst();
      if (child.Valid()) {
        assert(child.status().ok());
        minHeap_.push(&child);
      } else {
        considerStatus(child.status());
      }
    }
    direction_ = kForward;
    current_ = CurrentForward();
  }
  
  IteratorWrapper* CurrentForward() const {
    assert(direction_ == kForward);
    return !minHeap_.empty() ? minHeap_.top() : nullptr;
  }
  
  virtual void Next() override {
    assert(Valid());

    // Ensure that all children are positioned after key().
    // If we are moving in the forward direction, it is already
    // true for all of the non-current children since current_ is
    // the smallest child and key() == current_->key().
    if (direction_ != kForward) {
      SwitchToForward();
      // The loop advanced all non-current children to be > key() so current_
      // should still be strictly the smallest key.
      assert(current_ == CurrentForward());
    }

    // For the heap modifications below to be correct, current_ must be the
    // current top of the heap.
    assert(current_ == CurrentForward());

    // as the current points to the current record. move the iterator forward.
    current_->Next();
    if (current_->Valid()) {
      // current is still valid after the Next() call above.  Call
      // replace_top() to restore the heap property.  When the same child
      // iterator yields a sequence of keys, this is cheap.
      assert(current_->status().ok());
      minHeap_.replace_top(current_);
    } else {
      // current stopped being valid, remove it from the heap.
      considerStatus(current_->status());
      minHeap_.pop();
    }
    current_ = CurrentForward();
  }

迭代器解析数据方法：DBIter::FindNextUserEntryInternal()：

bool DBIter::FindNextUserEntryInternal(bool skipping, bool prefix_check) {
  // Loop until we hit an acceptable entry to yield
  assert(iter_->Valid());
  assert(status_.ok());
  assert(direction_ == kForward);
  current_entry_is_merged_ = false;

  // How many times in a row we have skipped an entry with user key less than
  // or equal to saved_key_. We could skip these entries either because
  // sequence numbers were too high or because skipping = true.
  // What saved_key_ contains throughout this method:
  //  - if skipping        : saved_key_ contains the key that we need to skip,
  //                         and we haven't seen any keys greater than that,
  //  - if num_skipped > 0 : saved_key_ contains the key that we have skipped
  //                         num_skipped times, and we haven't seen any keys
  //                         greater than that,
  //  - none of the above  : saved_key_ can contain anything, it doesn't matter.
  uint64_t num_skipped = 0;

  is_blob_ = false;

  do {
    if (!ParseKey(&ikey_)) {
      return false;
    }

    if (iterate_upper_bound_ != nullptr &&
        user_comparator_->Compare(ikey_.user_key, *iterate_upper_bound_) >= 0) {
      break;
    }

    if (prefix_extractor_ && prefix_check &&
        prefix_extractor_->Transform(ikey_.user_key)
                .compare(prefix_start_key_) != 0) {
      break;
    }

    if (TooManyInternalKeysSkipped()) {
      return false;
    }

    if (IsVisible(ikey_.sequence)) {
      if (skipping && user_comparator_->Compare(ikey_.user_key,
                                                saved_key_.GetUserKey()) <= 0) {
        num_skipped++;  // skip this entry
        PERF_COUNTER_ADD(internal_key_skipped_count, 1);
      } else {
        num_skipped = 0;
        switch (ikey_.type) {
          case kTypeDeletion:
          case kTypeSingleDeletion:
            // Arrange to skip all upcoming entries for this key since
            // they are hidden by this deletion.
            // if iterartor specified start_seqnum we
            // 1) return internal key, including the type
            // 2) return ikey only if ikey.seqnum >= start_seqnum_
            // note that if deletion seqnum is < start_seqnum_ we
            // just skip it like in normal iterator.
            if (start_seqnum_ > 0 && ikey_.sequence >= start_seqnum_)  {
              saved_key_.SetInternalKey(ikey_);
              valid_ = true;
              return true;
            } else {
              saved_key_.SetUserKey(
                ikey_.user_key,
                !pin_thru_lifetime_ || !iter_->IsKeyPinned() /* copy */);
              skipping = true;
              PERF_COUNTER_ADD(internal_delete_skipped_count, 1);
            }
            break;
          case kTypeValue:
          case kTypeBlobIndex:
            if (start_seqnum_ > 0) {
              // we are taking incremental snapshot here
              // incremental snapshots aren't supported on DB with range deletes
              assert(!(
                (ikey_.type == kTypeBlobIndex) && (start_seqnum_ > 0)
              ));
              if (ikey_.sequence >= start_seqnum_) {
                saved_key_.SetInternalKey(ikey_);
                valid_ = true;
                return true;
              } else {
                // this key and all previous versions shouldn't be included,
                // skipping
                saved_key_.SetUserKey(ikey_.user_key,
                  !pin_thru_lifetime_ || !iter_->IsKeyPinned() /* copy */);
                skipping = true;
              }
            } else {
              saved_key_.SetUserKey(
                  ikey_.user_key,
                  !pin_thru_lifetime_ || !iter_->IsKeyPinned() /* copy */);
              if (range_del_agg_.ShouldDelete(
                      ikey_, RangeDelAggregator::RangePositioningMode::
                                 kForwardTraversal)) {
                // Arrange to skip all upcoming entries for this key since
                // they are hidden by this deletion.
                ...
            }
            break;
          case kTypeMerge:
            saved_key_.SetUserKey(
                ikey_.user_key,
                !pin_thru_lifetime_ || !iter_->IsKeyPinned() /* copy */);
            if (range_del_agg_.ShouldDelete(
                    ikey_, RangeDelAggregator::RangePositioningMode::
                               kForwardTraversal)) {
              // Arrange to skip all upcoming entries for this key since
              // they are hidden by this deletion.
              skipping = true;
              num_skipped = 0;
              PERF_COUNTER_ADD(internal_delete_skipped_count, 1);
            } else {
              // By now, we are sure the current ikey is going to yield a
              // value
              current_entry_is_merged_ = true;
              valid_ = true;
              return MergeValuesNewToOld();  // Go to a different state machine
            }
            break;
          default:
            assert(false);
            break;
        }
      }
    } else {
      PERF_COUNTER_ADD(internal_recent_skipped_count, 1);

      // This key was inserted after our snapshot was taken.
      // If this happens too many times in a row for the same user key, we want
      // to seek to the target sequence number.
      int cmp =
          user_comparator_->Compare(ikey_.user_key, saved_key_.GetUserKey());
      if (cmp == 0 || (skipping && cmp <= 0)) {
        num_skipped++;
      } else {
        saved_key_.SetUserKey(
            ikey_.user_key,
            !iter_->IsKeyPinned() || !pin_thru_lifetime_ /* copy */);
        skipping = false;
        num_skipped = 0;
      }
    }

    // If we have sequentially iterated via numerous equal keys, then it's
    // better to seek so that we can avoid too many key comparisons.
    if (num_skipped > max_skip_) {
      num_skipped = 0;
      std::string last_key;
      if (skipping) {
        // We're looking for the next user-key but all we see are the same
        // user-key with decreasing sequence numbers. Fast forward to
        // sequence number 0 and type deletion (the smallest type).
        AppendInternalKey(&last_key, ParsedInternalKey(saved_key_.GetUserKey(),
                                                       0, kTypeDeletion));
        // Don't set skipping = false because we may still see more user-keys
        // equal to saved_key_.
      } else {
        // We saw multiple entries with this user key and sequence numbers
        // higher than sequence_. Fast forward to sequence_.
        // Note that this only covers a case when a higher key was overwritten
        // many times since our snapshot was taken, not the case when a lot of
        // different keys were inserted after our snapshot was taken.
        AppendInternalKey(&last_key,
                          ParsedInternalKey(saved_key_.GetUserKey(), sequence_,
                                            kValueTypeForSeek));
      }
      iter_->Seek(last_key);
      RecordTick(statistics_, NUMBER_OF_RESEEKS_IN_ITERATION);
    } else {
      iter_->Next();
    }
  } while (iter_->Valid());

  valid_ = false;
  return iter_->status().ok();
}

你可能感兴趣的:(RocksDB)

嵌入式数据库sqlite和rocksdb的介绍以及对比问道飞鱼数据库相关技术数据库 sqlite rocksdb
SQLite和RocksDB都是非常流行的嵌入式数据库系统，但它们的设计理念和应用场景有所不同。下面是对这两个数据库系统的详细介绍以及它们之间的主要区别。SQLite简介SQLite是一个轻量级的关系数据库管理系统，完全由C语言编写而成。它以单一文件的形式存储数据库，并且不需要独立的服务器进程或管理程序。SQLite直接嵌入到应用程序中，这使得它非常适合移动设备、嵌入式系统和桌面应用程序。特点嵌入
翻译 Compaction wiki i_need_job
网址：https://github.com/facebook/rocksdb/wiki/Compaction有道CompactionCompactionalgorithmsconstraintheLSMtreeshape.Theydeterminewhichsortedrunscanbemergedbyitandwhichsortedrunsneedtobeaccessedforareadoper
rust嵌入式key/value数据库 kk3909 rust
文章目录项目介绍sled已知问题如何使用leveldb-rs如何使用rust-rocksdb如何使用lmdb-rs如何使用功能对比性能测试对比插入不同的长度的key/valuemonotonicinsert/get/removerandominsert/get/remove项目介绍类型语言star简介sledrust4.6k嵌入式数据库,全新设计，beta尚未稳定LevelDBc++23.3kgo
提升代码搜索效率：深入解析现代代码搜索流程 yifeiliu338 hadoop tf-idf
在现代软件开发中，代码搜索是一项不可或缺的功能，它直接关系到开发者的效率和项目的可维护性。本文将通过图文并茂的方式，详细解释一个高效的代码搜索流程，包括每一步的作用、使用的工具（如TreeSitter、RocksDB），并融入个人对提升代码搜索效率的思考与建议。流程概述图1：代码搜索流程图流程图从左上角开始，用户输入一个“查询”（query），随后经历一系列处理步骤，最终返回搜索结果。以下是每一步
（十六）Flink 状态管理 springk Flink全景解析 flink 大数据实时数据实时数据处理状态管理 flink状态管理
目录状态类型KeyedStateKeyedState分类状态有效期（TTL）过期数据的清理OperatorStateBroadcastState状态存储StateBackends分类设置StateBackendRocksDBStateBackend详解在Flink架构体系中，状态（State）计算是其重要的特性之一。状态用来保存中间计算结果或缓存数据。比如：当应用程序搜索某些事件模式时，状态将存储
Rocksdb Tuning MOONICK 数据库
Rocksdb配置选项尤其繁多，想要获得真正的高性能，需要进行详细的调优，这是项复杂的工作，需要在实践中积累经验：https://www.jianshu.com/p/8e0018b6a8b6https://cloud.tencent.com/developer/article/2329992调优RocksDB通常就是在三个amplification之间做取舍：Writeamplification-
翻译 Basic Operations Compaction Filter i_need_job
原文地址:https://github.com/facebook/rocksdb/wiki/Compaction-Filter(有道)RocksDBprovidesawaytodeleteormodifykey/valuepairsbasedoncustomlogicinbackground.Itishandyforimplementingcustomgarbagecollection,liker
Flink大状态和Checkpoint调优 orange大数据技术探索者 #flink迁移 flink 大数据
文章迁移，待整理2.状态和Checkpoint调优2.1大状态调优我们生产大多数会使用fsState，memState程序挂了状态就丢了，应该没人会在生产使用，但是涉及到一些大状态，fsState效率很低，这时候会选择rocksDbState1.RocksDb为什么效率高基于LSMTree实现，类似Hbase的读写方式，state.backend.local-recovery:true写数据内存即
SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage——论文泛读妙BOOK言论文阅读论文阅读 KV存储 lsm-tree
FAST2021Paper论文阅读笔记整理问题键值（KV）存储支持许多关键的应用和服务。它们在内存中执行快速处理，但通常受到I/O性能的限制。最近出现的高速NVMeSSD推动了新KV系统设计，以利用其低延迟和高带宽。挑战当前基于LSM树的KV存储未能充分发挥NVMeSSD的全部潜力。例如，在OptaneP4800X上部署RocksDB，相对于SATASSD，对于50%写入的工作负载，吞吐量仅提高了
MatrixOne---MatrixKV产品体验 ☞ ♚ ☜ docker 容器 java
MatrixKvMatrixKV是一个简单的分布式强一致KV存储系统，采用Pebble作为底层的存储引擎，MatrixCube作为分布式组件，以及自定义了最简单的读写请求接口。用户可以非常简单的在任意一个节点发起读写数据的请求，也可以从任意一个节点读到需要的数据。如果对TiDB架构比较熟悉的同学可以把MatrixKV等同于一个TiKV+PD，而MatrixKV其中使用的RocksDB换成了Pebb
ledger-rocksdb 浪迹天涯1188
RocksDBisahighperformancembeddeddatabaseforkey-valuedata。https://crates.io/crates/rocksdb
【图文详解】一文全面彻底搞懂HBase、LevelDB、RocksDB等NoSQL背后的存储原理：LSM-tree 日志结构合并树禅与计算机程序设计艺术
LSM树广泛用于数据存储，例如RocksDB、ApacheAsterixDB、Bigtable、HBase、LevelDB、ApacheAccumulo、SQLite4、Tarantool、WiredTiger、ApacheCassandra、InfluxDB和ScyllaDB等。在这篇文章中，我们将深入探讨LogStructuredMergeTree，又名LSM树：许多高度可扩展的NoSQL分布
翻译 BlobDB i_need_job
网址：https://github.com/facebook/rocksdb/wiki/BlobDBBlobDBisessentiallyRocksDBforlarge-valueusecases.Thebasicidea,whichwasproposedintheWiscKeypaper,iskey-valueseparation:bystoringlargevaluesindedicatedb
RocksDB是如何实现存算分离的 archimekai 微服务分布式架构
核心参考文献：Dong,S.,P,S.S.,Pan,S.,Ananthabhotla,A.,Ekambaram,D.,Sharma,A.,Dayal,S.,Parikh,N.V.,Jin,Y.,Kim,A.,Patil,S.,Zhuang,J.,Dunster,S.,Mahajan,A.,Chelluri,A.,Datye,C.,Santana,L.V.,Garg,N.,&Gawde,O.(202
Flink问题解决及性能调优-【Flink rocksDB读写state大对象导致背压问题调优】 PONY LEE Flink问题解决及性能调优 flink 大数据
RocksDB是Flink中用于持久化状态的默认后端，它提供了高性能和可靠的状态存储。然而，当处理大型状态并频繁读写时，可能会导致背压问题，因为RocksDB需要从磁盘读取和写入数据，而这可能成为瓶颈。遇到的问题Flink开发中遇到读写state大对象的问题，FlinkwebUI火焰图表现如下：从图上看，瓶颈卡在序列化与反序列化，结合业务逻辑代码，业务涉及state大对象的读写，并且是ValueS
flink通过状态快照实现容错 m0_66520412 flink 大数据
状态后端#Flink管理的键控状态是一种分片的键/值存储，以及每个键/值存储的工作副本键控状态的项保留在负责该键的TaskManager的本地某个位置。算子state也是需要它的计算机的本地状态。Flink管理的这种状态存储在状态后端中。有两种状态后端的实现可用——一种基于RocksDB，一种嵌入式键/值存储，可保持其工作状态disk，以及另一个基于堆的状态后端，该后端将其工作状态保存在Java堆
Flink问题解决及性能调优-【Flink根据不同场景状态后端使用调优】 PONY LEE Flink问题解决及性能调优 flink 大数据
Flink实时groupby聚合场景操作时，由于使用的是rocksdb状态后端，发现CPU的高负载卡在rocksdb的读写上，导致上游算子背压特别大。通过调优使用hashmap状态后端代替rocksdb状态后端，使吞吐量有了质的飞跃（20倍的性能提升），并分析整理。实例代码--SETtable.exec.state.ttl=86400s;--24hour,默认:0msSETtable.exec.s
Flink State backend状态后端小枫@码 Flink flink 大数据
概述Flink在v1.12到v1.14的改进当中，其状态后端也发生了变化。老版本的状态后端有三个，分别是MemoryStateBackend、FsStateBackend、RocksDBStateBackend，在flink1.14中，这些状态已经被废弃了，新版本的状态后端是HashMapStateBackend、EmbeddedRocksDBStateBackend。1、检查点有状态流应用中的检
Flink 源码：TM 端恢复及创建 KeyedState 的流程 longLiveData
本文仅为笔者平日学习记录之用，侵删原文：https://mp.weixin.qq.com/s/eaALnpd_qHQg6fxI12fQjg本文会详细分析TM端恢复及创建KeyedState的流程，恢复过程会分析RocksDB和Fs两种StateBackend的恢复流程，创建流程会介绍Checkpoint处恢复的State如何与代码中创建的State关联起来。一、RocksDBKeyedStateB
ADOC: Automatically Harmonizing Dataflow Between Components in Log-Structured Key-Value Sto...——论文泛读妙BOOK言论文阅读论文阅读 lsm-tree
FAST2023Paper论文阅读笔记整理问题基于Log-StructureMerge-tree（LSM-tree）的键值（KV）系统被广泛部署。LSM-KV系统普遍存在的问题是写入停顿，指的是在大量写入压力下突然性能下降。先前的研究将写入停顿归因于资源短缺或调度问题。图1显示了RocksDB在各种存储设备上运行写密集型工作负载的结果。写停顿是普遍的，发生在所有类型的设备上，但触发条件不同；写停顿
Flink TaskManager 内存管理机制介绍与调优总结腾讯云大数据 flink jvm java
作者：董伟柯，腾讯CSIG高级工程师概要Flink的新版内存管理机制，要追溯到2020年初发布的Flink1.10版本。当时Flink社区为了实现三大目标：流和批模式下内存管理的统一，即同一套内存配置既可用于流作业也可用于批作业管控好RocksDB等外部组件的内存，避免在容器环境下用量不受控导致被KILL消除不同部署模式下配置参数的歧义，消除cut-off等参数语义模糊的问题提出了两个设计提案FL
TaskExecutor统一内存配置(FLink FLIP-49翻译) LS_ice flink
文章目录目的：(1)解决流、批配置差异大(2)解决Streaming方式RocksDB配置复杂(3)去掉复杂、不确定、难以理解的配置公共接口修改建议统一流处理和批处理内存管理内存使用场景及特点统一显式和隐式内存申请将托管的堆上内存池和堆外内存池分离MemoryPools和配置方式框架堆内存（FrameworkHeapMemory）用户堆内存（TaskHeapMemory）用户堆外内存（TaskOf
翻译 RocksDB Overview i_need_job
网址https://github.com/facebook/rocksdb/wiki/RocksDB-Overview有道RocksDBOverviewhttps://github.com/facebook/rocksdb.wiki.git1.IntroductionRocksDBstartedatFacebookasastorageengineforserverworkloadsonvariou
Flink实例：状态管理State 过期时间TTL 大数据供成屎 flink 大数据 java
1State过期时间TTL使用flink进行实时计算中，会遇到一些状态数不断累积，导致状态量越来越大的情形。例如，作业中定义了超长的时间窗口，或者在动态表上应用了无限范围的GROUPBY语句，以及执行了没有时间窗口限制的双流JOIN等等操作。对于这些情况，经常导致堆内存出现OOM，或者堆外内存（RocksDB）用量持续增长导致超出容器的配额上限，造成作业的频繁崩溃。从Flink1.6版本开始引入了
flink双流ioin的大状态如何解决和调优暴走的贼宇 flink java 大数据
Flink中的双流ioin操作（双流连接）通常涉及大状态的处理，这可能导致一些性能和状态管理的挑战。以下是解决和调优Flink中双流ioin大状态的一些建议：解决方案：增大任务管理器的堆内存：对于处理大状态的任务，增加Flink任务管理器的堆内存可以提供更多的内存空间来存储状态，减缓状态溢出的可能性。使用RocksDB状态后端：将Flink配置为使用RocksDB作为状态后端，RocksDB可以更
翻译 Terminology i_need_job
原文网址：https://github.com/facebook/rocksdb/wiki/TerminologyNOTEforfutureedits:Pleasemaintainentriesinalphabeticalorder2PC(Two-phasecommit)Thepessimistictransactionscouldcommitintwophases:firstPrepareand
常见技术选型独处人
MQRocketMQ,RabbitMQ,Kafka,ActiveMQNoSQLRedis,Memcache分布式计算Blink,Storm,SparkDB关系型TiDB,MySQL,MongoDB,CassandraKVLevelDB,Rocksdb,PalDB文件BerkeleyDB,MapDB,ChronicleQueue,SQLite,RSocket时序型Influxdb,HiTSDB,Op
数据库Database StoneLiu999 db sql Database
文章目录关系型数据库数据库对比SQLite示例代码SQL语言运算符非关系型数据库键值对数据库文档型数据库RocksDB示例代码数据库（Database）是用于存储和管理数据的系统。它提供了一种结构化的方式来组织、存储、检索和更新数据，以满足不同应用程序的需求。数据库可以分为两类：关系型数据库和非关系型数据库。关系型数据库（RelationalDatabase）：关系型数据库使用表格（表）来组织数据
kafka 增量快照的使用 pekingK kafka
增量快照RocksDB支持增量快照。不同于产生一个包含所有数据的全量备份，增量快照中只包含自上一次快照完成之后被修改的记录，因此可以显著减少快照完成的耗时。一个增量快照是基于（通常多个）前序快照构建的。由于RocksDB内部存在compaction机制对sst文件进行合并，Flink的增量快照也会定期重新设立起点（rebase），因此增量链条不会一直增长，旧快照包含的文件也会逐渐过期并被自动清理。
RocksDB系列十四:Partitioned Index Filters 薛少佳
随着DB/mem使用越来越多，filter/indexblock的内存空间变得不可忽视。虽然cache_index_and_filter_blocks配置只允许filter/indexblock数据的一部分cache在blockcache中，但是还是会因为数据量的庞大影响RocksDB的性能。占据了过多的blockcache空间，这些空间本来可以用于缓存data当访问cachemiss时需要l
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul