happylife1527

leveldb研究2- 存储分析，数据库日志文件格式，数据文件的格式和生成

leveldb研究2- 存储分析

Posted on 2012-03-09 11:44 小明阅读(1128) 评论(1) 编辑收藏所属分类: 分布式计算

对于一个db来说，存储是至关重要的问题。

运行上一篇的测试程序后，会发现leveldb会生成以下文件：

SST文件：数据文件 -- sstable格式
*.log: 数据库日志文件 -- 顺序记录所有数据库操作，用来恢复数据
CURRENT: 文本文件，表明当面的manifest文件

LOCK:空文件，数据库锁，防止多进程访问
LOG: 日志文件，文本格式
LOG.old:上一次的日志文件
MANIFEST: 数据库状态文件

leveldb研究3-数据库日志文件格式

Posted on 2012-03-09 16:00 小明阅读(1173) 评论(1) 编辑收藏所属分类: 分布式计算

leveldb在每次数据库操作之前都会把操作记录下来。
主要实现在db\log_format.h,db\log_reader.h,db\log_reader.cc,db\log_write.h,db\log_write.cc中。我们来具体看看实现。

日志格式
db\log_format.h
log是分块的，每块为32K,每条记录的记录头为7个字节，前四个为CRC，然后是长度（2个字节），最后是记录类型（1个字节）
---------------------------------------
BLOCK1|BLOCK2|BLOCK3|...|BLOCKN
---------------------------------------

enum RecordType {
   // Zero is reserved for preallocated files
  kZeroType = 0,

  kFullType = 1,

   // For fragments
  kFirstType = 2,
  kMiddleType = 3,
  kLastType = 4
};
static const int kMaxRecordType = kLastType;

static const int kBlockSize = 32768;

// Header is checksum (4 bytes), type (1 byte), length (2 bytes).
static const int kHeaderSize = 4 + 1 + 2;

}   // namespace log
}   // namespace leveldb

写日志操作
db\log_writer.cc
请注意这里的处理，由于1条记录可能超过一个BLOCK的大小，所以需要分成多个片段写入。

// 增加一条记录
Status Writer::AddRecord( const Slice& slice) {
   const char* ptr = slice.data();
  size_t left = slice.size();

   // Fragment the record if necessary and emit it.  Note that if slice
   // is empty, we still want to iterate once to emit a single
   // zero-length record
  Status s;
   bool begin = true;
   do {
     const int leftover = kBlockSize - block_offset_; // 当前剩余多少字节
    assert(leftover >= 0);
     if (leftover < kHeaderSize) { // 不够文件头大小7bytes
       // 转入新的block
       if (leftover > 0) {
         // 用0来填充空白
        assert(kHeaderSize == 7);
        dest_->Append(Slice("\x00\x00\x00\x00\x00\x00", leftover));
      }
      block_offset_ = 0;
    }

     // Invariant: we never leave < kHeaderSize bytes in a block.
    assert(kBlockSize - block_offset_ - kHeaderSize >= 0);

     // avail：除掉头还算多少字节
     const size_t avail = kBlockSize - block_offset_ - kHeaderSize;
     // 实际写入大小
     const size_t fragment_length = (left < avail) ? left : avail;

    RecordType type;
     const bool end = (left == fragment_length); // 记录是否结束
     if (begin && end) {
      type = kFullType; // 完整记录
    } else if (begin) {
      type = kFirstType; // 开头
    } else if (end) {
      type = kLastType; // 结尾
    } else {
      type = kMiddleType; // 中间
    }
     // 写入
    s = EmitPhysicalRecord(type, ptr, fragment_length);
    ptr += fragment_length;
    left -= fragment_length;
    begin = false;
  } while (s.ok() && left > 0);
   return s;
}

// 实际写入日志文件
Status Writer::EmitPhysicalRecord(RecordType t, const char* ptr, size_t n) {
  assert(n <= 0xffff);   // Must fit in two bytes
  assert(block_offset_ + kHeaderSize + n <= kBlockSize);

   // 记录头
   char buf[kHeaderSize];
  buf[4] = static_cast< char>(n & 0xff);
  buf[5] = static_cast< char>(n >> 8);
  buf[6] = static_cast< char>(t);

   // 计算CRC
  uint32_t crc = crc32c::Extend(type_crc_[t], ptr, n);
  crc = crc32c::Mask(crc);                  // Adjust for storage
  EncodeFixed32(buf, crc);

   // 写入头部
  Status s = dest_->Append(Slice(buf, kHeaderSize));
   if (s.ok()) {
     // 写入记录片段
    s = dest_->Append(Slice(ptr, n));
     if (s.ok()) {
      s = dest_->Flush();
    }
  }
  block_offset_ += kHeaderSize + n;
   return s;
}

读日志操作
这里可以看出使用BLOCK的好处，能够减少文件IO次数,读日志基本上就是写日志反向过程。

// 读取记录,scratch为缓冲，record是结果
bool Reader::ReadRecord(Slice* record, std:: string* scratch) {
   if (last_record_offset_ < initial_offset_) { // 需要跳过文件头部信息，目前未实现
     if (!SkipToInitialBlock()) {
       return false;
    }
  }

  scratch->clear();
  record->clear();
   bool in_fragmented_record = false //是否是碎片记录
;   // Record offset of the logical record that we're reading
   // 0 is a dummy value to make compilers happy
  uint64_t prospective_record_offset = 0 ;
  Slice fragment;
   while ( true) {
    uint64_t physical_record_offset = end_of_buffer_offset_ - buffer_.size();
     // 从文件中读取一个BLOCK
     const unsigned int record_type = ReadPhysicalRecord(&fragment);
     switch (record_type) {
       case kFullType: // 完整Record
         if (in_fragmented_record) {
           // Handle bug in earlier versions of log::Writer where
           // it could emit an empty kFirstType record at the tail end
           // of a block followed by a kFullType or kFirstType record
           // at the beginning of the next block.
           if (scratch->empty()) {
            in_fragmented_record = false;
          } else {
            ReportCorruption(scratch->size(), "partial record without end(1)");
          }
        }
        prospective_record_offset = physical_record_offset;
        scratch->clear();
        *record = fragment;
        last_record_offset_ = prospective_record_offset;
         return true;

       case kFirstType: // Record开始
         if (in_fragmented_record) {
           // Handle bug in earlier versions of log::Writer where
           // it could emit an empty kFirstType record at the tail end
           // of a block followed by a kFullType or kFirstType record
           // at the beginning of the next block.
           if (scratch->empty()) {
            in_fragmented_record = false;
          } else {
            ReportCorruption(scratch->size(), "partial record without end(2)");
          }
        }
        prospective_record_offset = physical_record_offset;
        scratch->assign(fragment.data(), fragment.size());
        in_fragmented_record = true;
         break;

       case kMiddleType: // Record中间
         if (!in_fragmented_record) {
          ReportCorruption(fragment.size(),
                           "missing start of fragmented record(1)");
        } else {
          scratch->append(fragment.data(), fragment.size());
        }
         break;

       case kLastType: // Record结尾
         if (!in_fragmented_record) {
          ReportCorruption(fragment.size(),
                           "missing start of fragmented record(2)");
        } else {
          scratch->append(fragment.data(), fragment.size());
          *record = Slice(*scratch);
          last_record_offset_ = prospective_record_offset;
           return true;
        }
         break;

       case kEof: // 文件结束
         if (in_fragmented_record) {
          ReportCorruption(scratch->size(), "partial record without end(3)");
          scratch->clear();
        }
         return false;

       case kBadRecord: // 坏记录
         if (in_fragmented_record) {
          ReportCorruption(scratch->size(), "error in middle of record");
          in_fragmented_record = false;
          scratch->clear();
        }
         break;

       default: { // 无法识别
         char buf[40];
        snprintf(buf, sizeof(buf), "unknown record type %u", record_type);
        ReportCorruption(
            (fragment.size() + (in_fragmented_record ? scratch->size() : 0)),
            buf);
        in_fragmented_record = false;
        scratch->clear();
         break;
      }
    }
  }
   return false;
}

// 从文件中读取
unsigned int Reader::ReadPhysicalRecord(Slice* result) {
   while ( true) {
     if (buffer_.size() < kHeaderSize) {
       if (!eof_) {
         // Last read was a full read, so this is a trailer to skip
        buffer_.clear();
         // 读入一个BLOCK
        Status status = file_->Read(kBlockSize, &buffer_, backing_store_);
        end_of_buffer_offset_ += buffer_.size();
         if (!status.ok()) {
          buffer_.clear();
          ReportDrop(kBlockSize, status);
          eof_ = true;
           return kEof;
        } else if (buffer_.size() < kBlockSize) {
          eof_ = true;
        }
         continue;
      } else if (buffer_.size() == 0) {
         // End of file
         return kEof;
      } else {
        size_t drop_size = buffer_.size();
        buffer_.clear();
        ReportCorruption(drop_size, "truncated record at end of file");
         return kEof;
      }
    }

     // 解析record头
     const char* header = buffer_.data();
     const uint32_t a = static_cast(header[4]) & 0xff;
     const uint32_t b = static_cast(header[5]) & 0xff;
     const unsigned int type = header[6];
     const uint32_t length = a | (b << 8);
     if (kHeaderSize + length > buffer_.size()) {
      size_t drop_size = buffer_.size();
      buffer_.clear();
      ReportCorruption(drop_size, "bad record length");
       return kBadRecord;
    }

     if (type == kZeroType && length == 0) {
       // Skip zero length record without reporting any drops since
       // such records are produced by the mmap based writing code in
       // env_posix.cc that preallocates file regions.
      buffer_.clear();
       return kBadRecord;
    }

     // 检查CRC
     if (checksum_) {
      uint32_t expected_crc = crc32c::Unmask(DecodeFixed32(header));
      uint32_t actual_crc = crc32c::Value(header + 6, 1 + length);
       if (actual_crc != expected_crc) {
         // Drop the rest of the buffer since "length" itself may have
         // been corrupted and if we trust it, we could find some
         // fragment of a real log record that just happens to look
         // like a valid log record.
        size_t drop_size = buffer_.size();
        buffer_.clear();
        ReportCorruption(drop_size, "checksum mismatch");
         return kBadRecord;
      }
    }

    buffer_.remove_prefix(kHeaderSize + length);

     // Skip physical record that started before initial_offset_
     if (end_of_buffer_offset_ - buffer_.size() - kHeaderSize - length <
        initial_offset_) {
      result->clear();
       return kBadRecord;
    }

    *result = Slice(header + kHeaderSize, length);
     return type;
  }
}

leveldb研究4- 数据文件的格式和生成

Posted on 2012-03-12 18:21 小明阅读(1222) 评论(1) 编辑收藏所属分类: 分布式计算

// builder.cc
// dbname:数据库名称
// env:OS接口
// iter:指向MemTable的一个iterator
Status BuildTable( const std:: string& dbname,
                  Env* env,
                   const Options& options,
                  TableCache* table_cache,
                  Iterator* iter,
                  FileMetaData* meta) {
  Status s;
  meta->file_size = 0;
  iter->SeekToFirst();

   // 生成文件名:格式 "0000x.sst"
  std:: string fname = TableFileName(dbname, meta->number);
   if (iter->Valid()) {
    WritableFile* file;
     // 创建一个可写文件
    s = env->NewWritableFile(fname, &file);
     if (!s.ok()) {
       return s;
    }

     // TableBuilder负责table生成和写入
    TableBuilder* builder = new TableBuilder(options, file);
     // META:最小key
    meta->smallest.DecodeFrom(iter->key());
     for (; iter->Valid(); iter->Next()) {
      Slice key = iter->key();
       // META:最大key
      meta->largest.DecodeFrom(key);
       // 增加数据到builder
      builder->Add(key, iter->value());
    }

     // Finish and check for builder errors
     if (s.ok()) {
       // 完成写入
      s = builder->Finish();
       if (s.ok()) {
        meta->file_size = builder->FileSize();
        assert(meta->file_size > 0);
      }
    } else {
      builder->Abandon();
    }
    delete builder;

     // Finish and check for file errors
     if (s.ok()) {
      s = file->Sync();
    }
     if (s.ok()) {
       // sync & close,写入磁盘
      s = file->Close();
    }
    delete file;
    file = NULL;

     if (s.ok()) {
       // Verify that the table is usable
      Iterator* it = table_cache->NewIterator(ReadOptions(),
                                              meta->number,
                                              meta->file_size);
      s = it->status();
      delete it;
    }
  }

   // Check for input iterator errors
   if (!iter->status().ok()) {
    s = iter->status();
  }

   if (s.ok() && meta->file_size > 0) {
     // Keep it
  } else {
    env->DeleteFile(fname);
  }
   return s;
}

}   // namespace leveldb

我们来看看TableBuilder类，主要的细节都在这个类中实现了

TableBuilder中含有一个Rep的数据结构的指针，主要是用于保存builder的一些状态和数据。为什么不在TableBuilder头文件中直接定义这些变量？主要是不想暴露过多的细节给使用者，真是一个很好的做法。

struct TableBuilder::Rep {
  Options options;
  Options index_block_options;
  WritableFile* file; // sstable文件指针
  uint64_t offset;
  Status status;
  BlockBuilder data_block; // 数据块
  BlockBuilder index_block; // 索引块
  std:: string last_key; // 上一次的key，用于比较和建立索引
  int64_t num_entries; //
   bool closed;           // 是否结束
   bool pending_index_entry; // 是否要新增索引块
  BlockHandle pending_handle;   // Handle to add to index block
  std:: string compressed_output;

  Rep( const Options& opt, WritableFile* f)
      : options(opt),
        index_block_options(opt),
        file(f),
        offset(0),
        data_block(&options),
        index_block(&index_block_options),
        num_entries(0),
        closed( false),
        pending_index_entry( false) {
    index_block_options.block_restart_interval = 1;
  }
};

新加一条记录：

// 增加一条数据记录
void TableBuilder::Add( const Slice& key, const Slice& value) {
  Rep* r = rep_;
  assert(!r->closed);
   if (!ok()) return;
   if (r->num_entries > 0) {
     // 检查是不是顺序添加
    assert(r->options.comparator->Compare(key, Slice(r->last_key)) > 0);
  }

   if (r->pending_index_entry) { // 是否生成新的index block
     // 检查当前是否是一个新的BLOCK
    assert(r->data_block.empty());
     // 根据当前的key和上一个DATA BLOCK的最后一个主键生成最短的索引
    r->options.comparator->FindShortestSeparator(&r->last_key, key);
    std:: string handle_encoding;
    r->pending_handle.EncodeTo(&handle_encoding);
     // 增加新的INDEX BLOCK，但不立即写入
    r->index_block.Add(r->last_key, Slice(handle_encoding));
    r->pending_index_entry = false;
  }

  r->last_key.assign(key.data(), key.size());
  r->num_entries++;
  r->data_block.Add(key, value);

   const size_t estimated_block_size = r->data_block.CurrentSizeEstimate();
   // 检查是否已经达到BLOCK SIZE，默认4K
   if (estimated_block_size >= r->options.block_size) {
    Flush();
  }
}

// 写一个DATA BLOCK
void TableBuilder::Flush() {
  Rep* r = rep_;
  assert(!r->closed);
   if (!ok()) return;
   if (r->data_block.empty()) return;
  assert(!r->pending_index_entry);
  WriteBlock(&r->data_block, &r->pending_handle);
   if (ok()) {
    r->pending_index_entry = true;
    r->status = r->file->Flush();
  }
}

// 写BLOCK
void TableBuilder::WriteBlock(BlockBuilder* block, BlockHandle* handle) {
   // 文件格式: 数据+类型(1个字节）+ CRC（4个字节）
  assert(ok());
  Rep* r = rep_;
// 生成binary
  Slice raw = block->Finish();

// 压缩数据
  Slice block_contents;
  CompressionType type = r->options.compression;
   switch (type) {
     case kNoCompression:
      block_contents = raw;
       break;

     case kSnappyCompression: {
      std:: string* compressed = &r->compressed_output;
       if (port::Snappy_Compress(raw.data(), raw.size(), compressed) &&
          compressed->size() < raw.size() - (raw.size() / 8u)) {
        block_contents = *compressed;
      } else {
         // Snappy not supported, or compressed less than 12.5%, so just
         // store uncompressed form
        block_contents = raw;
        type = kNoCompression;
      }
       break;
    }
  }
  handle->set_offset(r->offset);
  handle->set_size(block_contents.size());
  r->status = r->file->Append(block_contents);
   if (r->status.ok()) {
     char trailer[kBlockTrailerSize];
    trailer[0] = type;
    uint32_t crc = crc32c::Value(block_contents.data(), block_contents.size());
    crc = crc32c::Extend(crc, trailer, 1);   // Extend crc to cover block type
    EncodeFixed32(trailer+1, crc32c::Mask(crc));
    r->status = r->file->Append(Slice(trailer, kBlockTrailerSize));
     if (r->status.ok()) {
      r->offset += block_contents.size() + kBlockTrailerSize;
    }
  }
  r->compressed_output.clear();
  block->Reset();
}

完成文件的写入：

Status TableBuilder::Finish() {
  Rep* r = rep_;
  Flush();
  assert(!r->closed);
  r->closed = true;
  BlockHandle metaindex_block_handle;
  BlockHandle index_block_handle;
   if (ok()) {
     // 写入META INDEX BLOCK
    BlockBuilder meta_index_block(&r->options);
     // TODO(postrelease): Add stats and other meta blocks
    WriteBlock(&meta_index_block, &metaindex_block_handle);
  }
   if (ok()) {
     if (r->pending_index_entry) {
      r->options.comparator->FindShortSuccessor(&r->last_key);
      std:: string handle_encoding;
      r->pending_handle.EncodeTo(&handle_encoding);
      r->index_block.Add(r->last_key, Slice(handle_encoding));
      r->pending_index_entry = false;
    }
     // 写入索引块
    WriteBlock(&r->index_block, &index_block_handle);
  }
   if (ok()) {
     // 写入Footer,包含META INDEX BLOCK和INDEX HANDLE的offset
    Footer footer;
    footer.set_metaindex_handle(metaindex_block_handle);
    footer.set_index_handle(index_block_handle);
    std:: string footer_encoding;
    footer.EncodeTo(&footer_encoding);
    r->status = r->file->Append(footer_encoding);
     if (r->status.ok()) {
      r->offset += footer_encoding.size();
    }
  }
   return r->status;
}

这里面有两个类BlockBuilder和BlockHandle,BlockBuilder负责把数据按照一定格式进行序列化，而BlockHandle负责记录offset,size等,可以理解为BLOCK的文件中指针。

我们看看BlockBuilder的实现，这里leveldb实现了前缀压缩法，因为一个BLOCK的key很接近，所以前后两个key相差不会很大，所以采取了的格式，节省了空间。
其中size采用了变长格式，很有意思的格式，主要是针对小整形做的一个优化，用最多8个字节来表示4个字节的整形，每个byte的最高一个bit用来指示还有没有后续数据，如果最高位为0，则表示没有后续的bytes.这样小于7F的数据只需要一个字节来表示。
可以参考这篇文章具体看实现variant32格式。

// 完成写入
Slice BlockBuilder::Finish() {
   // 写入restart数组，每隔options_->block_restart_interval（default:16)生成一个restart offset
   for (size_t i = 0; i < restarts_.size(); i++) {
    PutFixed32(&buffer_, restarts_[i]);
  }
   // 写入restart的大小
  PutFixed32(&buffer_, restarts_.size());
  finished_ = true;
   return Slice(buffer_);
}

void BlockBuilder::Add( const Slice& key, const Slice& value) {
  Slice last_key_piece(last_key_);
  assert(!finished_);
  assert(counter_ <= options_->block_restart_interval);
  assert(buffer_.empty() // No values yet?
         || options_->comparator->Compare(key, last_key_piece) > 0);
  size_t shared = 0;
   // counter_内部计数器，用于记录当前restart后的个数
   if (counter_ < options_->block_restart_interval) {
     // 看看当前的key和上一个有多少相同的bytes
     const size_t min_length = std::min(last_key_piece.size(), key.size());
     while ((shared < min_length) && (last_key_piece[shared] == key[shared])) {
      shared++;
    }
  } else {
     // Restart compression
    restarts_.push_back(buffer_.size());
    counter_ = 0;
  }
   const size_t non_shared = key.size() - shared;

   // 写入 "" to 缓冲
  PutVarint32(&buffer_, shared);
  PutVarint32(&buffer_, non_shared);
  PutVarint32(&buffer_, value.size());

   // 写入 non_shared data和value
  buffer_.append(key.data() + shared, non_shared);
  buffer_.append(value.data(), value.size());

   // 设置 last_key_ 等于当前的key
  last_key_.resize(shared);
  last_key_.append(key.data() + shared, non_shared);
  assert(Slice(last_key_) == key);
  counter_++;
}

数据归档 - 冷热数据处理大师趣链科技区块链技术算法数据处理区块链
——Part1现状——区块链可以视作一个在分布式环境下众多可信节点共同维护的且不可篡改的账本。在区块链系统中，数据以区块作为基本单位，区块链系统利用levelDB基于Key-Value结构的数据库存取数据，通过多节点冗余存储实现账本可信，然而随着区块链运行时间的增长，区块链的存储容量将呈线性增长，且这种数据的增长速度甚至会超过存储介质容量增长的速度，因此，区块链数据存储将成为限制区块链技术发展的重
10-leveldb repair流程及优化方法 anda0109 leveldb从入门到精通数据库数据库架构数据库开发 database nosql
leveldb做为一个单机存储引擎，难免遇到数据损坏的情况：比如意外断电、磁盘坏块等。轻者文件损坏无法读取，严重者则导致数据库无法启动。这个时候就需要进行数据修复了。leveldb提供的修复流程如下：(1)wal日志文件转化为sstable文件(2)扫描所有的sstable文件(a)smallest/largestforthetable(b)largestsequencenumberintheta
LSM-Tree (日志结构合并树) 茶本无香 lsm-tree
LSM-Tree（日志结构合并树）是一种高效处理写操作的存储结构，广泛应用于NoSQL数据库如LevelDB和RocksDB。其核心思想是将随机写入转换为顺序写入，提升吞吐量。以下是其原理及Java实现示例：###**LSM-Tree原理**1.**结构组成**：-**MemTable**：内存中的有序结构（如跳表），用于快速写入。-**ImmutableMemTable**：MemTable写满
ubuntu安装编译brpc 周子青
//安装git、g++、make、libssl-dev$sudoapt-getinstallgitg++makelibssl-dev//安装gflags、protobuf、leveldb$sudoapt-getinstallrealpathlibgflags-devlibprotobuf-devlibprotoc-devprotobuf-compilerlibleveldb-dev//安裝goog
【数据库系统】RocksDB 极简教程 AI天才研究院架构师必知必会系列数据库 rocksdb
目录RocksDB极简教程LSM-TreeVS.B-TreeRocksDBHighLevelArchitecture高层架构番外篇：LevelDB简介IO放大CompactionInmemory数据库事务(ACID)WAL日志文件结构FileformatRocksDBFeatures|特点Gettingstarted入门Overview概述OpeningADatabase打开数据库Status状态
ubuntu18安装pyenv Ramulet Python npm pycharm centos
安装依赖sudoapt-getinstalllibprotobuf-devlibleveldb-devlibsnappy-devlibopencv-devlibboost-all-devlibhdf5-serial-devlibgflags-devlibgoogle-glog-devliblmdb-devprotobuf-compiler-ysudoapt-getinstallbzip2-ysud
【LevelDB 和 Sqlite】秋夜白 sqlite 数据库
关于LevelDB的小总结：LevelDB和SQLite是两种不同类型的数据库:1.LevelDB:特点:NoSQL数据库键值(Key-Value)存储由Google开发数据按键排序存储支持批量操作简单的Get/Put/Delete接口示例操作:key1->value1key2->value22.SQLite:特点:关系型数据库(SQL)表格结构存储支持SQL查询支持事务支持外键和索引示例表:CR
goleveldb的原理简述（基于golang的goleveldb库）陈墨1234 golang进阶之路源码学习 golang 开发语言后端经验分享笔记 db
简介goleveldb是基于LSM-Tree实现的针对处理写多读少场景的解决方案，通常用于构建写多读少的存储引擎整体架构图如下基于用户接口层简述原理吧Get，按key查询数据，首先区内存中的数据，如果内存中没有则依次从硬盘中的ldb文件中取得数据。Put,按key更新数据，首先写内存数据，如果大小达到内存存储的阈值，则将immutable替换为memtable，新建一个logfile存储wal日志
Leveldb源码分析--9 sparkliang Leveldb 分布式系统
6SSTable之36.5读取sstable文件6.5.1类层次Sstable文件的读取逻辑在类Table中，其中涉及到的类还是比较多的，如图6.5-1所示。图6.5-1Table类导出的函数只有3个，先从这三个导出函数开始分析。其中涉及到的类（包括上图中为画出的）都会一一遇到，然后再一一拆解。本节分析sstable的打开逻辑，后面再分析key的查找与数据遍历。6.5.2Table::Open()
rust嵌入式key/value数据库 kk3909 rust
文章目录项目介绍sled已知问题如何使用leveldb-rs如何使用rust-rocksdb如何使用lmdb-rs如何使用功能对比性能测试对比插入不同的长度的key/valuemonotonicinsert/get/removerandominsert/get/remove项目介绍类型语言star简介sledrust4.6k嵌入式数据库,全新设计，beta尚未稳定LevelDBc++23.3kgo
windows vs 自己编译源码 leveldb 然后使用自己编译的文件 tenc1239 vs c++cmake c++
1准备源码文件1.1第一种方法git下载源码vs项目中gitleveldb源码和gitthird_partygoogletest-CSDN博客1.2第二种方法手动下载然后把第三方的源码下载复制到third_party对应的文件夹中没有文件夹third_party->powershellmkdirthird_party2编译leveldb源码2.1在leveldb文件夹目录下mkdirbuildcd
leveldb学习2 Tony_Xian C++c++
无论indexblock还是datablock两者的内部结构都相同(都是block的结构),均使用block的Seek方法进行二分查找,根据重启点进行二分查找查找key先从indexblock查找,再从datablock查找indexblock的key是两个datablock的分割点,大于等于当前block的所有key,小于下一个block的最小keyvalue是对应datablock地址的偏移量
日志打印宏的编写清风玉骨 mudo c++
参考文献整理：C/C++可变参数，“##__VA_ARGS__”宏的介绍和使用_##__va_args__-CSDN博客代码为了方便以后的测试，直接使用日志来进行测试的打印，就使用了宏日志#defineINF0#defineDBG1#defineERR2#defineLOG_LEVELDBG#defineLOG(level,format,...)\do\{\if(level
【图文详解】一文全面彻底搞懂HBase、LevelDB、RocksDB等NoSQL背后的存储原理：LSM-tree 日志结构合并树禅与计算机程序设计艺术
LSM树广泛用于数据存储，例如RocksDB、ApacheAsterixDB、Bigtable、HBase、LevelDB、ApacheAccumulo、SQLite4、Tarantool、WiredTiger、ApacheCassandra、InfluxDB和ScyllaDB等。在这篇文章中，我们将深入探讨LogStructuredMergeTree，又名LSM树：许多高度可扩展的NoSQL分布
浅谈目前主流NoSql数据库大飞攻城狮后端开发 nosql redis mongodb
浅谈目前主流NoSql数据库，编程学习资料点击免费领取前言无意翻资料发现目前好多noSql数据库，但是工作中貌似并没有接触到，很好奇他们的区别，所以就有了这篇文章。（整合了网上许多大佬的文章，如有侵权，麻烦私信告知。）采用浅谈也是为了方便大家无压力阅读，快速了解知识。如果有文章问题的地方麻烦评论做补充。感谢。目前我了解的主流Nosql如下：redismongoDBmemcacheLevelDBCa
利用C++读取图片数据内存，一键智能识别技术！ Python编程导师
关于使用C++接口来提取特征，caffe官方提供了一个extract_features.cpp的例程，但是这个文件的输入是blob数据，即使输入层使用的是ImageData，也需要在deploy.prototxt中指定图片的位置，很不方便。image如果想要使用opencv来读取一个图片，然后用caffe训练好的model提取特征，就需要对输入层进行改写。另外官方例程默认的输出是leveldb格式
从leveldb学编码技巧(3) wangjie_yy
leveldb中的大部分文件都是用一种类似日志的方式来写数据的，比如和memtable一一对应的log文件，以及manifest文件。他们的特点是：文件内容都是一条条记录，每条记录都有特定的格式。为了方便读取这类文件中的内容，leveldb使用一个log::Reader类完成读取和解析的工作。log::Reader提供了从文件中读取出一条完整记录的方法，定义如下：boolReadRecord(Sl
MAC安装和卸载redis xiaolyuh
安装卸载查询可安装的版本查询版本号brewsearchredis：olafwang@OLAFWANG-MB0etc%brewsearchredis==>Formulaehiredisredis✔[email protected]@4.0==>Caskshomebrew/cask/another-redis-desktop-managerhomebrew/cask/redis安装
大白话解析LevelDB: VersionEdit Howard0o0 大白话解析LevelDB 数据库 c++
文章目录VersionEditVersionEdit::EncodeTo(std::string*dst)VersionEdit::DecodeFrom(constSlice&src)VersionEditLevelDB在进行Compaction的过程中，会增加一些SST并且删除一些SST，这些操作都会引起数据库状态的变化。每个数据库状态都对应一个Version版本，Version里对应的数据库状
大白话解析LevelDB: VersionSet Howard0o0 大白话解析LevelDB 数据库 c++
文章目录VersionSetVersionSet接口概览VersionSet中各个接口的实现VersionSet::LogAndApply(VersionEdit*edit,port::Mutex*mu)VersionSet::Builder的实现VersionSet::Builder的构造VersionSet::Builder::Apply(VersionEdit*edit)VersionSet
大白话讲解 LevelDB 0: 目录 Howard0o0 大白话解析LevelDB c++数据库
大白话讲解LevelDB大白话解析LevelDB1:把Key-Value写入MemTable大白话解析LevelDB2:MemTable落盘为SST文件
LevelDB 中各种文件的作用 Howard0o0 大白话解析LevelDB c++数据库
文章目录LevelDB中各种文件的作用SSTWALMANIFESTCURRENTLOCKLOGLevelDB中各种文件的作用在LevelDB中，有以下几种类型的文件:SST(SortedStringTable)文件名为xxx.ldb，存储实际的Key-Value数据。WAL(WriteAheadLog)文件名为xxx.log，记录最近的写操作，以便在系统崩溃后恢复数据。MANIFEST文件名为MA
大白话解析LevelDB: TableBuilder Howard0o0 大白话解析LevelDB 数据库 c++
文章目录TableBuilder`TableBuilder`的使用姿势SST的格式`TableBuilder`的代码实现`TableBuilder`的构造函数TableBuilder::Add(constSlice&key,constSlice&value)TableBuilder::WriteBlockTableBuilder::WriteRawBlockTableBuilder::Flush(
大白话解析LevelDB: WritableFile 接口 Howard0o0 大白话解析LevelDB c++数据库
文章目录WritableFileWritableFile的构造PosixWritableFilePosixWritableFile的构造PosixWritableFile::Append(constSlice&data)PosixWritableFile::FlushBuffer()PosixWritableFile::WriteUnbuffered(constchar*data,size_tsi
大白话解析LevelDB: Env Howard0o0 大白话解析LevelDB 数据库 c++
文章目录leveldb::Env跨平台运行环境的封装Env接口概览POSIX环境下的Env的实现POSIX下的Env::Default()的实现SingletonEnv的实现前置知识:placementnew与std::aligned_storageSingletonEnv的代码实现SingletonEnv的存在意义PosixEnv的构造函数PosixEnv的构造函数PosixEnv::NewSe
大白话解析LevelDB：数据格式 Howard0o0 大白话解析LevelDB 缓存 c++
文章目录LevelDB中的数据格式KeyUserKeyInternalKeyLookupKeyWriteBatchSSTDataBlockIndexBlockMetaBlock(FilterBlock)MetaIndexBlockFooterMANIFESTRecordLevelDB中的数据格式Key先说LevelDB里比较容易混淆的3种Key:UserKeyInternalKeyLookupKe
大白话解析LevelDB 2: MemTable 落盘为 SST 文件 Howard0o0 大白话解析LevelDB c++数据库
文章目录MemTable落盘为SST文件什么是`CompactMemTable`什么时候触发`CompactMemTable`如何触发`CompactMemTable``CompactMemTable`的过程将`MemTable`落盘成`SST`文件将`MemTable`生成一个新的`SST`文件:挑选合适的level-i用于放置新的`SST`将新SST的MetaData记录到`VersionEd
常见技术选型独处人
MQRocketMQ,RabbitMQ,Kafka,ActiveMQNoSQLRedis,Memcache分布式计算Blink,Storm,SparkDB关系型TiDB,MySQL,MongoDB,CassandraKVLevelDB,Rocksdb,PalDB文件BerkeleyDB,MapDB,ChronicleQueue,SQLite,RSocket时序型Influxdb,HiTSDB,Op
Ubuntu 16.04 + caffe环境搭建(CPU) 默写年华Antifragile
1.安装依赖sudoapt-getinstalllibprotobuf-devlibleveldb-devlibsnappy-devlibopencv-devlibhdf5-serial-devprotobuf-compilersudoapt-getinstall--no-install-recommendslibboost-all-devsudoapt-getinstalllibgflags-d
Db2插入数据溢出报错测试蓝黑2020 DB Java 数据库 db2 mybatis jdbc
本文是测试Db2数据库插入数据报错。具体来讲，是通过命令行、JDBC、Mybatis等各种方式，尝试把一个长度为11的字符串插入到VARCHAR(8)的字段，查看报错信息，方便以后遇到类似的错误时，能够帮助快速定位问题。测试环境Db2$db2levelDB21085IThisinstanceorinstall(instancename,whereapplicable:"db2inst1")uses
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

leveldb研究2- 存储分析，数据库日志文件格式，数据文件的格式和生成