LevelDB源码分析:理解Slice实现 - 高效的LevelDB参数对象

简介

Slice在LevelDB中作为高效的参数对象而设计,你可以使用任何数据类型来创建leveldb::Slice对象,而且这些对象在LevelDB的很多接口中作为参数来进行传递。本文将介绍LevelDB重要的参数对象Slice的实现,涉及的LevelDB的版本为1.20。

Slice实现

Slice类的实现在include/leveldb/slice.h中:

class Slice {
 public:
  // Create an empty slice.
  Slice() : data_(""), size_(0) { }

  // Create a slice that refers to d[0,n-1].
  Slice(const char* d, size_t n) : data_(d), size_(n) { }

  // Create a slice that refers to the contents of "s"
  Slice(const std::string& s) : data_(s.data()), size_(s.size()) { }

  // Create a slice that refers to s[0,strlen(s)-1]
  Slice(const char* s) : data_(s), size_(strlen(s)) { }

  // Return a pointer to the beginning of the referenced data
  const char* data() const { return data_; }

  // Return the length (in bytes) of the referenced data
  size_t size() const { return size_; }

  // Return true iff the length of the referenced data is zero
  bool empty() const { return size_ == 0; }

  // Return the ith byte in the referenced data.
  // REQUIRES: n < size()
  char operator[](size_t n) const {
    assert(n < size());
    return data_[n];
  }

  // Change this slice to refer to an empty array
  void clear() { data_ = ""; size_ = 0; }

  // Drop the first "n" bytes from this slice.
  void remove_prefix(size_t n) {
    assert(n <= size());
    data_ += n;
    size_ -= n;
  }

  // Return a string that contains the copy of the referenced data.
  std::string ToString() const { return std::string(data_, size_); }

  // Three-way comparison.  Returns value:
  //   <  0 iff "*this" <  "b",
  //   == 0 iff "*this" == "b",
  //   >  0 iff "*this" >  "b"
  int compare(const Slice& b) const;

  // Return true iff "x" is a prefix of "*this"
  bool starts_with(const Slice& x) const {
    return ((size_ >= x.size_) &&
            (memcmp(data_, x.data_, x.size_) == 0));
  }

 private:
  const char* data_;
  size_t size_;

  // Intentionally copyable
};

inline bool operator==(const Slice& x, const Slice& y) {
  return ((x.size() == y.size()) &&
          (memcmp(x.data(), y.data(), x.size()) == 0));
}

inline bool operator!=(const Slice& x, const Slice& y) {
  return !(x == y);
}

inline int Slice::compare(const Slice& b) const {
  const size_t min_len = (size_ < b.size_) ? size_ : b.size_;
  int r = memcmp(data_, b.data_, min_len);
  if (r == 0) {
    if (size_ < b.size_) r = -1;
    else if (size_ > b.size_) r = +1;
  }
  return r;
}

Slice对象仅包含长度和字符指针类型的成员,对象的复制非常高效,但也非常危险。如果拥有一个Slice对象,需要确保其初始化的指针数据也能够保留,并且要保证其上下文是线程安全的。这也是为什么不要在线程间共享Slice对象的原因:它们都具有Slice字符串指针引用的内存存储,并且这些内存区域可能会被其它线程进行修改。
Slice类提供了4种构造函数,除缺省构造函数外,还支持以字节数组形式的构造函数Slice(const char* d, size_t n),以及支持C++字符串类型的Slice(const std::string& s)和C字符串类型的Slice(const char* s)。
Slice类的函数均以内联函数的形式提供,提供的方法非常类似于C++的String类。

使用Get和Put操作二进制数据

在理解了Slice的工作机制后,来考虑一下如何使用Get和Put来操作二进制数据。

struct binValues {
	int intVal;
	double realVal;
};
binValues b = {-99, 3.14};
Slice binSlice((const char*)&b, sizeof(binValues) );
assert( db->Put(WriteOptions(), "BinSample", binSlice).ok() );
std::string binRead;
assert( db->Get(ReadOptions(), "BinSample", &binRead).ok() );
// treat the std::string as a container for arbitary binary data
binValues* b2 = (binValues*)binRead.data();
cout << "Read back binary structure " << b2->intVal << "  "
<< b2->realVal << " binary size=" << binRead.size() << endl;

二进制数据可以像字符串一样存储,Slice包含了字节数据和长度信息。不同的在于std::string拥有数据,可以认为是一个安全的数据容器,而Slice仅包含了数据的指针。
参考上面的二进制数据的处理方式,可以处理其它任何类型的数据了。

你可能感兴趣的:(NoSQL)