巴山独钓

levelDB源码分析-Log文件

        levelDB中log文件在LevelDb中的主要作用是系统故障恢复时，能够保证不会丢失数据。因为在将记录写入内存的Memtable之前，会先写入Log文件，这样即使系统发生故障，Memtable中的数据没有来得及Dump到磁盘的SSTable文件，LevelDB也可以根据log文件恢复内存的Memtable数据结构内容，不会造成系统丢失数据，在这点上LevelDb和Bigtable是一致的。
        下面我们带大家看看log文件的具体物理和逻辑布局是怎样的，LevelDb对于一个log文件，会把它切割成以32K为单位的物理Block，每次读取的单位以一个Block作为基本读取单位，下图展示的log文件由3个Block构成，所以从物理布局来讲，一个log文件就是由连续的32K大小Block构成的。
log_format.txt:
        The log file contents are a sequence of 32KB blocks. The only exception is that the tail of the file may contain a partial block.
   Each block consists of a sequence of records:
       block := record* trailer?
    record := checksum: uint32       // crc32c of type and data[]
               length: uint16
               type: uint8                           // One of FULL, FIRST, MIDDLE, LAST
               data: uint8[length]

图1 log文件格式

在应用的视野里是看不到这些Block的，应用看到的是一系列的Key/Value对，在LevelDb内部，会将一个Key/Value对看做一条记录的数据，另外在这个数据前增加一个记录头，用来记载一些管理信息，以方便内部处理，图3.2显示了一个记录在LevelDb内部是如何表示的。

图2 记录结构

        记录头包含三个字段，ChechSum是对“类型”和“数据”字段的校验码，为了避免处理不完整或者是被破坏的数据，当LevelDb读取记录数据时候会对数据进行校验，如果发现和存储的CheckSum相同，说明数据完整无破坏，可以继续后续流程。“记录长度”记载了数据的大小，“数据”则是上面讲的Key/Value数值对，“类型”字段则指出了每条记录的逻辑结构和log文件物理分块结构之间的关系，具体而言，主要有以下四种类型：FULL/FIRST/MIDDLE/LAST。
      如果记录类型是FULL，代表了当前记录内容完整地存储在一个物理Block里，没有被不同的物理Block切割开；如果记录被相邻的物理Block切割开，则类型会是其他三种类型中的一种。我们以图1所示的例子来具体说明。
        假设目前存在三条记录，Record A，Record B和Record C，其中Record A大小为10K，Record B 大小为80K，Record C大小为12K，那么其在log文件中的逻辑布局会如图3.1所示。Record A是图中蓝色区域所示，因为大小为10K<32K，能够放在一个物理Block中，所以其类型为FULL；Record B 大小为80K，而Block 1因为放入了Record A，所以还剩下22K，不足以放下Record B，所以在Block 1的剩余部分放入Record B的开头一部分，类型标识为FIRST，代表了是一个记录的起始部分；Record B还有58K没有存储，这些只能依次放在后续的物理Block里面，因为Block 2大小只有32K，仍然放不下Record B的剩余部分，所以Block 2全部用来放Record B，且标识类型为MIDDLE，意思是这是Record B中间一段数据；Record B剩下的部分可以完全放在Block 3中，类型标识为LAST，代表了这是Record B的末尾数据；图中黄色的Record C因为大小为12K，Block 3剩下的空间足以全部放下它，所以其类型标识为FULL。

从这个小例子可以看出逻辑记录和物理Block之间的关系，LevelDb一次物理读取为一个Block，然后根据类型情况拼接出逻辑记录，供后续流程处理。

// 记录类型
enum RecordType {
            // Zero is reserved for preallocated files
            kZeroType = 0,

            kFullType = 1,

            // For fragments
            kFirstType = 2,
            kMiddleType = 3,
            kLastType = 4
};

static const int kBlockSize = 32768;        // 32k Block

// recored header is checksum (4 bytes), length (2 bytes), type (1 byte).
static const int kHeaderSize = 4 + 2 + 1;

写日志类Writer：

	namespace log {
        class Writer {
            public:
            // Create a writer that will append data to "*dest".
            // "*dest" must be initially empty.
            // "*dest" must remain live while this Writer is in use.
            explicit Writer(WritableFile* dest);
            ~Writer(){}

            Status AddRecord(const Slice& slice);						// 添加一个记录

            private:
            WritableFile* dest_;										// class WritableFile;为写文件类
            int block_offset_;       // Current offset in block

            // crc32c values for all supported record types.  These are
            // pre-computed to reduce the overhead of computing the crc of the
            // record type stored in the header.
            uint32_t type_crc_[kMaxRecordType + 1];						// 每种type都预先计算出CRC，kMaxRecordType = kLastType;

            Status EmitPhysicalRecord(RecordType type, const char* ptr, size_t length);// 写入一个Record

            // No copying allowed
            Writer(const Writer&);									// 禁止拷贝构造函数及赋值运算符重载
            void operator=(const Writer&);
            };
	}

	    Writer::Writer(WritableFile* dest)								// 构造函数，参数：写文件句柄
         : dest_(dest),
         block_offset_(0) {
            for (int i = 0; i <= kMaxRecordType; i++) {
                char t = static_cast(i);
                type_crc_[i] = crc32c::Value(&t, 1);						// 首先计算每个Type对应的CRC
            }
        }
        
        Status Writer::AddRecord(const Slice& slice) {					// 添加一个记录
            const char* ptr = slice.data();
            size_t left = slice.size();

            // Fragment the record if necessary and emit it.  Note that if slice
            // is empty, we still want to iterate once to emit a single		// 如果Slice为空，则增加一个zero-length的记录
            // zero-length record
            Status s;
            bool begin = true;
            do {
                const int leftover = kBlockSize - block_offset_;			// 当前Block剩余容量
                assert(leftover >= 0);
                if (leftover < kHeaderSize) {							// 剩余容量比kHeaderSize还小，则填充trailer
                    // Switch to a new block
                    if (leftover > 0) {
                        // Fill the trailer (literal below relies on kHeaderSize being 7)
                        assert(kHeaderSize == 7);
                        dest_->Append(Slice("\x00\x00\x00\x00\x00\x00", leftover));	// leftover<7, dest_追加leftover个0
                    }
                    block_offset_ = 0;
                }

                // Invariant: we never leave < kHeaderSize bytes in a block.
                assert(kBlockSize - block_offset_ - kHeaderSize >= 0);

                const size_t avail = kBlockSize - block_offset_ - kHeaderSize; // 当前block剩余可用大小(除去kHeaderSize)
                const size_t fragment_length = (left < avail) ? left : avail;  // 分片

                RecordType type;
                const bool end = (left == fragment_length);                    // 是否为最后一个
                if (begin && end) {									  // 开始 && 结束，则type为FullType
                    type = kFullType;
                } else if (begin) {									  // 开始 && 非结束，则type为kFirstType
                    type = kFirstType;
                } else if (end) {										  // 非开始 && 结束，则type为kLastType
                    type = kLastType;
                } else {											  // 其它为kMiddleType
                    type = kMiddleType;
                }

                s = EmitPhysicalRecord(type, ptr, fragment_length);			  // 保存一条fragment_length字节长度的数据到log文件，类型为type，开始地址为ptr
                if(!s.ok()){ 										  // 写入失败，则跳出循环
                    break ;
                }
                ptr += fragment_length;
                left -= fragment_length;
                begin = false;
            } while (/*s.ok() &&*/ left > 0);
            return s;
        }
        
        // 保存一条n字节长度的记录，记录类型为t，记录数据开始地址为ptr
        Status Writer::EmitPhysicalRecord(RecordType t, const char* ptr, size_t n) 
        {
            assert(n <= 0xffff);  // Must fit in two bytes
            assert(block_offset_ + kHeaderSize + n <= kBlockSize);

            // Format the header
            char buf[kHeaderSize];  							// 7bytes: CheckSum(4) + 记录长度(2) + Type(1)
            buf[4] = static_cast(n & 0xff);
            buf[5] = static_cast(n >> 8 & 0xff);  			// 长度高位在后
            buf[6] = static_cast(t);

            // Compute the crc of the record type and the payload.
            uint32_t crc = crc32c::Extend(type_crc_[t], ptr, n);	// 计算CRC
            crc = crc32c::Mask(crc);                 			// Adjust for storage
            EncodeFixed32(buf, crc);                    			// 将CRC放入header前4字节

            // Write the header and the payload
            Status s = dest_->Append(Slice(buf, kHeaderSize));		// header写入文件
            if (s.ok()) {                                     		// header写入成功
                s = dest_->Append(Slice(ptr, n));             		// 将记录数据写入文件
                if (s.ok()) {
                    s = dest_->Flush();                       		// flush到文件
                }
            }
            block_offset_ += kHeaderSize + n;                 		// Block offset移动
            return s;
        }

读日志类Reader：


        class Reader {
            public:
            // Interface for reporting errors.
            class Reporter
            {
                public:
                virtual ~Reporter();

                // Some corruption was detected.  "size" is the approximate number
                // of bytes dropped due to the corruption.
                virtual void Corruption(size_t bytes, const Status& status) = 0;
            };

            // Create a reader that will return log records from "*file".
            // "*file" must remain live while this Reader is in use.
            //
            // If "reporter" is non-NULL, it is notified whenever some data is
            // dropped due to a detected corruption.  "*reporter" must remain
            // live while this Reader is in use.
            //
            // If "checksum" is true, verify checksums if available.
            //
            // The Reader will start reading at the first record located at physical
            // position >= initial_offset within the file.			// 读取Block是从position（>= initial_offset）位置开始的
            Reader(SequentialFile* file, Reporter* reporter, bool checksum, uint64_t initial_offset);

            ~Reader();

            // Read the next record into *record.  Returns true if read
            // successfully, false if we hit end of the input.  May use
            // "*scratch" as temporary storage.  The contents filled in *record
            // will only be valid until the next mutating operation on this
            // reader or the next mutation to *scratch.
            bool ReadRecord(Slice* record, std::string* scratch);					// 读取一个record

            // Returns the physical offset of the last record returned by ReadRecord.
            //
            // Undefined before the first call to ReadRecord.
            uint64_t LastRecordOffset();

            private:
            SequentialFile* const file_;
            Reporter* const reporter_;
            bool const checksum_;
            char* const backing_store_;
            Slice buffer_;
            bool eof_;   // Last Read() indicated EOF by returning < kBlockSize

            // Offset of the last record returned by ReadRecord.
            uint64_t last_record_offset_;
            // Offset of the first location past the end of buffer_.
            uint64_t end_of_buffer_offset_;

            // Offset at which to start looking for the first record to return
            uint64_t const initial_offset_;

            // Extend record types with the following special values
            enum
            {
                kEof = kMaxRecordType + 1,
                // Returned whenever we find an invalid physical record.
                // Currently there are three situations in which this happens:
                // * The record has an invalid CRC (ReadPhysicalRecord reports a drop)
                // * The record is a 0-length record (No drop is reported)
                // * The record is below constructor's initial_offset (No drop is reported)
                kBadRecord = kMaxRecordType + 2
            };

            // Skips all blocks that are completely before "initial_offset_".
            //
            // Returns true on success. Handles reporting.
            bool SkipToInitialBlock();											// 文件读取指针跳到记录所在的block的文件偏移位置

            // Return type, or one of the preceding special values
            unsigned int ReadPhysicalRecord(Slice* result);						// 从sst文件读取一个Block数据

            // Reports dropped bytes to the reporter.
            // buffer_ must be updated to remove the dropped bytes prior to invocation.
            void ReportCorruption(size_t bytes, const char* reason);
            void ReportDrop(size_t bytes, const Status& reason);

            // No copying allowed
            Reader(const Reader&);
            void operator=(const Reader&);
        };
        
主要函数为：
        
        // 文件读取指针跳到记录所在的block的文件偏移位置
        bool Reader::SkipToInitialBlock()
        {
            size_t offset_in_block = initial_offset_ % kBlockSize;             // 对应的记录内偏移地址
            uint64_t block_start_location = initial_offset_ - offset_in_block; // Block的起始位置

            // Don't search a block if we'd be in the trailer
            if (offset_in_block > kBlockSize - 6)			       // 因为读取Block是从position（>= initial_offset）位置开始的，
            {												     // 所以如果处于Block的最后6个字节中，则肯定会从下一个Block开始
                offset_in_block = 0;
                block_start_location += kBlockSize;         		     // 跳到下一Block
            }

            end_of_buffer_offset_ = block_start_location;

            // Skip to start of first block that can contain the initial record
            if (block_start_location > 0)
            {
                Status skip_status = file_->Skip(block_start_location); // 文件定位到指定地址处(记录所在的Block开始位置)
                if (!skip_status.ok())
                {
                    ReportDrop(block_start_location, skip_status);
                    return false;
                }
            }

            return true;
        }
        // 从sst文件读取一个Block数据
        unsigned int Reader::ReadPhysicalRecord(Slice* result)
        {
            while (true)
            {
                if (buffer_.size() < kHeaderSize) // buffer_: 剩余数据，当长度小于头部长度时，剩余的数据已无效（填充的trailer信息）
                {
                    if (!eof_)
                    {
                        // Last read was a full read, so this is a trailer to skip
                        buffer_.clear();
                        // 读取下一个Block
                        Status status = file_->Read(kBlockSize, &buffer_, backing_store_);// backing_store_用于读取记录时存放的空间
                        end_of_buffer_offset_ += buffer_.size();
                        if (!status.ok())
                        {
                            buffer_.clear();
                            ReportDrop(kBlockSize, status);
                            eof_ = true;
                            return kEof;
                        }
                        else if (buffer_.size() < kBlockSize) // 文件结束
                        {
                            eof_ = true;
                        }
                        continue;							// 防止到达文件结尾时，读取的部分数据非法，continue进行判断（下面的条件分支）
                    }
                    else if (buffer_.size() == 0) // 到达文件结束，且已经没有数据了
                    {
                        // End of file
                        return kEof;
                    }
                    else
                    {
                        size_t drop_size = buffer_.size();
                        buffer_.clear();
                        ReportCorruption(drop_size, "truncated record at end of file");
                        return kEof;
                    }
                }

                // Parse the header
                const char* header = buffer_.data();
                const uint32_t a = static_cast(header[4]) & 0xff; // 记录长度(低位)
                const uint32_t b = static_cast(header[5]) & 0xff; // 记录长度(高位)
                const unsigned int type = header[6];                        // 记录Type
                const uint32_t length = a | (b << 8);                       // 记录长度
                if (kHeaderSize + length > buffer_.size())			    // 长度非法
                {
                    size_t drop_size = buffer_.size();
                    buffer_.clear();
                    ReportCorruption(drop_size, "bad record length");
                    return kBadRecord;
                }

                if (type == kZeroType && length == 0)				    // 类型非法
                {
                    // Skip zero length record without reporting any drops since
                    // such records are produced by the mmap based writing code in
                    // env_posix.cc that preallocates file regions.
                    buffer_.clear();
                    return kBadRecord;
                }

                // Check crc
                if (checksum_)
                {
                    uint32_t expected_crc = crc32c::Unmask(DecodeFixed32(header));  	// CRC
                    uint32_t actual_crc = crc32c::Value(header + 6, 1 + length);		// 计算CRC
                    if (actual_crc != expected_crc)								// CRC校验
                    {
                        // Drop the rest of the buffer since "length" itself may have
                        // been corrupted and if we trust it, we could find some
                        // fragment of a real log record that just happens to look
                        // like a valid log record.
                        size_t drop_size = buffer_.size();
                        buffer_.clear();
                        ReportCorruption(drop_size, "checksum mismatch");
                        return kBadRecord;
                    }
                }

                buffer_.remove_prefix(kHeaderSize + length);            // 当前数据指针后移

                // Skip physical record that started before initial_offset_
                if (end_of_buffer_offset_ - buffer_.size() - kHeaderSize - length < initial_offset_)
                {
                    result->clear();
                    return kBadRecord;
                }

                *result = Slice(header + kHeaderSize, length);
                return type;
            }// while
        }
        // 读取一个record
        bool Reader::ReadRecord(Slice* record, std::string* scratch)
        {
            if (last_record_offset_ < initial_offset_)
            {
                if (!SkipToInitialBlock())// 文件读取指针跳到记录所在的Block的文件偏移位置
                {        
                    return false;
                }
            }

            scratch->clear();
            record->clear();
            bool in_fragmented_record = false;
            // Record offset of the logical record that we're reading
            // 0 is a dummy value to make compilers happy
            uint64_t prospective_record_offset = 0;

            Slice fragment;
            while (true)
            {
                uint64_t physical_record_offset = end_of_buffer_offset_ - buffer_.size(); // 当前记录偏移位置
                const unsigned int record_type = ReadPhysicalRecord(&fragment);  // 读取一个record片段
                switch (record_type)
                {
                    case kFullType:
                        if (in_fragmented_record)
                        {
                            // Handle bug in earlier versions of log::Writer where
                            // it could emit an empty kFirstType record at the tail end
                            // of a block followed by a kFullType or kFirstType record
                            // at the beginning of the next block.
                            if (scratch->empty())
                            {
                                in_fragmented_record = false;
                            }
                            else
                            {
                                ReportCorruption(scratch->size(), "partial record without end(1)");
                            }
                        }
                        prospective_record_offset = physical_record_offset;
                        scratch->clear();
                        *record = fragment;
                        last_record_offset_ = prospective_record_offset;    // last_record_offset_为上一record的偏移
                        return true;

                    case kFirstType:
                        if (in_fragmented_record)
                        {
                            // Handle bug in earlier versions of log::Writer where
                            // it could emit an empty kFirstType record at the tail end
                            // of a block followed by a kFullType or kFirstType record
                            // at the beginning of the next block.
                            if (scratch->empty())
                            {
                                in_fragmented_record = false;
                                } 
                            else
                            {
                                ReportCorruption(scratch->size(), "partial record without end(2)");
                            }
                        }
                        prospective_record_offset = physical_record_offset;
                        scratch->assign(fragment.data(), fragment.size());
                        in_fragmented_record = true;
                        break;

                    case kMiddleType:
                        if (!in_fragmented_record)
                        {
                            ReportCorruption(fragment.size(),
                            "missing start of fragmented record(1)");
                        }
                        else    // 此类型为一个中间片段，append
                        {
                            scratch->append(fragment.data(), fragment.size());
                        }
                        break;

                    case kLastType:
                        if (!in_fragmented_record)
                        {
                            ReportCorruption(fragment.size(),
                            "missing start of fragmented record(2)");
                        }
                        else
                        {
                            scratch->append(fragment.data(), fragment.size());
                            *record = Slice(*scratch);
                            last_record_offset_ = prospective_record_offset;// last_record_offset_为上一record的偏移
                            return true;
                        }
                        break;

                    case kEof:
                        if (in_fragmented_record)
                        {
                            ReportCorruption(scratch->size(), "partial record without end(3)");
                            scratch->clear();
                        }
                        return false;

                    case kBadRecord:
                        if (in_fragmented_record)
                        {
                            ReportCorruption(scratch->size(), "error in middle of record");
                            in_fragmented_record = false;
                            scratch->clear();
                        }
                        break;

                    default:
                        char buf[40];
                        snprintf(buf, sizeof(buf), "unknown record type %u", record_type);
                        ReportCorruption(
                        (fragment.size() + (in_fragmented_record ? scratch->size() : 0)),
                        buf);
                        in_fragmented_record = false;
                        scratch->clear();
                        break;
                }// switch
            } // while
            return false;
        }

使用方法：
日志文件每个record中数据域格式就是WriteBatch::rep_格式。

1、在DBImpl::Write中调用，写的是log文件：

                status = log_->AddRecord(WriteBatchInternal::Contents(updates));
	
		WriteBatchInternal::Contents(updates)返回的数据格式为：
		// 格式:
		// WriteBatch::rep_ :=
		//    sequence: fixed64
		//    count: fixed32
		//    data: record[count]
		// record :=
		//    kTypeValue varstring varstring |
		//+   kTypeDeletion varstring
		// varstring :=
		//    len: varint32
		//    data: uint8[len]

2、在DBImpl::NewDB中调用，写的是manifest文件：

	  std::string record;
          new_db.EncodeTo(&record);	# 具体数据格式在manifest中介绍
          s = log.AddRecord(record);

goleveldb的原理简述（基于golang的goleveldb库）陈墨1234 golang进阶之路源码学习 golang 开发语言后端经验分享笔记 db
简介goleveldb是基于LSM-Tree实现的针对处理写多读少场景的解决方案，通常用于构建写多读少的存储引擎整体架构图如下基于用户接口层简述原理吧Get，按key查询数据，首先区内存中的数据，如果内存中没有则依次从硬盘中的ldb文件中取得数据。Put,按key更新数据，首先写内存数据，如果大小达到内存存储的阈值，则将immutable替换为memtable，新建一个logfile存储wal日志
Leveldb源码分析--9 sparkliang Leveldb 分布式系统
6SSTable之36.5读取sstable文件6.5.1类层次Sstable文件的读取逻辑在类Table中，其中涉及到的类还是比较多的，如图6.5-1所示。图6.5-1Table类导出的函数只有3个，先从这三个导出函数开始分析。其中涉及到的类（包括上图中为画出的）都会一一遇到，然后再一一拆解。本节分析sstable的打开逻辑，后面再分析key的查找与数据遍历。6.5.2Table::Open()
rust嵌入式key/value数据库 kk3909 rust
文章目录项目介绍sled已知问题如何使用leveldb-rs如何使用rust-rocksdb如何使用lmdb-rs如何使用功能对比性能测试对比插入不同的长度的key/valuemonotonicinsert/get/removerandominsert/get/remove项目介绍类型语言star简介sledrust4.6k嵌入式数据库,全新设计，beta尚未稳定LevelDBc++23.3kgo
windows vs 自己编译源码 leveldb 然后使用自己编译的文件 tenc1239 vs c++cmake c++
1准备源码文件1.1第一种方法git下载源码vs项目中gitleveldb源码和gitthird_partygoogletest-CSDN博客1.2第二种方法手动下载然后把第三方的源码下载复制到third_party对应的文件夹中没有文件夹third_party->powershellmkdirthird_party2编译leveldb源码2.1在leveldb文件夹目录下mkdirbuildcd
leveldb学习2 Tony_Xian C++c++
无论indexblock还是datablock两者的内部结构都相同(都是block的结构),均使用block的Seek方法进行二分查找,根据重启点进行二分查找查找key先从indexblock查找,再从datablock查找indexblock的key是两个datablock的分割点,大于等于当前block的所有key,小于下一个block的最小keyvalue是对应datablock地址的偏移量
日志打印宏的编写清风玉骨 mudo c++
参考文献整理：C/C++可变参数，“##__VA_ARGS__”宏的介绍和使用_##__va_args__-CSDN博客代码为了方便以后的测试，直接使用日志来进行测试的打印，就使用了宏日志#defineINF0#defineDBG1#defineERR2#defineLOG_LEVELDBG#defineLOG(level,format,...)\do\{\if(level
【图文详解】一文全面彻底搞懂HBase、LevelDB、RocksDB等NoSQL背后的存储原理：LSM-tree 日志结构合并树禅与计算机程序设计艺术
LSM树广泛用于数据存储，例如RocksDB、ApacheAsterixDB、Bigtable、HBase、LevelDB、ApacheAccumulo、SQLite4、Tarantool、WiredTiger、ApacheCassandra、InfluxDB和ScyllaDB等。在这篇文章中，我们将深入探讨LogStructuredMergeTree，又名LSM树：许多高度可扩展的NoSQL分布
浅谈目前主流NoSql数据库大飞攻城狮后端开发 nosql redis mongodb
浅谈目前主流NoSql数据库，编程学习资料点击免费领取前言无意翻资料发现目前好多noSql数据库，但是工作中貌似并没有接触到，很好奇他们的区别，所以就有了这篇文章。（整合了网上许多大佬的文章，如有侵权，麻烦私信告知。）采用浅谈也是为了方便大家无压力阅读，快速了解知识。如果有文章问题的地方麻烦评论做补充。感谢。目前我了解的主流Nosql如下：redismongoDBmemcacheLevelDBCa
利用C++读取图片数据内存，一键智能识别技术！ Python编程导师
关于使用C++接口来提取特征，caffe官方提供了一个extract_features.cpp的例程，但是这个文件的输入是blob数据，即使输入层使用的是ImageData，也需要在deploy.prototxt中指定图片的位置，很不方便。image如果想要使用opencv来读取一个图片，然后用caffe训练好的model提取特征，就需要对输入层进行改写。另外官方例程默认的输出是leveldb格式
从leveldb学编码技巧(3) wangjie_yy
leveldb中的大部分文件都是用一种类似日志的方式来写数据的，比如和memtable一一对应的log文件，以及manifest文件。他们的特点是：文件内容都是一条条记录，每条记录都有特定的格式。为了方便读取这类文件中的内容，leveldb使用一个log::Reader类完成读取和解析的工作。log::Reader提供了从文件中读取出一条完整记录的方法，定义如下：boolReadRecord(Sl
MAC安装和卸载redis xiaolyuh
安装卸载查询可安装的版本查询版本号brewsearchredis：olafwang@OLAFWANG-MB0etc%brewsearchredis==>Formulaehiredisredis✔[email protected]@4.0==>Caskshomebrew/cask/another-redis-desktop-managerhomebrew/cask/redis安装
大白话解析LevelDB: VersionEdit Howard0o0 大白话解析LevelDB 数据库 c++
文章目录VersionEditVersionEdit::EncodeTo(std::string*dst)VersionEdit::DecodeFrom(constSlice&src)VersionEditLevelDB在进行Compaction的过程中，会增加一些SST并且删除一些SST，这些操作都会引起数据库状态的变化。每个数据库状态都对应一个Version版本，Version里对应的数据库状
大白话解析LevelDB: VersionSet Howard0o0 大白话解析LevelDB 数据库 c++
文章目录VersionSetVersionSet接口概览VersionSet中各个接口的实现VersionSet::LogAndApply(VersionEdit*edit,port::Mutex*mu)VersionSet::Builder的实现VersionSet::Builder的构造VersionSet::Builder::Apply(VersionEdit*edit)VersionSet
大白话讲解 LevelDB 0: 目录 Howard0o0 大白话解析LevelDB c++数据库
大白话讲解LevelDB大白话解析LevelDB1:把Key-Value写入MemTable大白话解析LevelDB2:MemTable落盘为SST文件
LevelDB 中各种文件的作用 Howard0o0 大白话解析LevelDB c++数据库
文章目录LevelDB中各种文件的作用SSTWALMANIFESTCURRENTLOCKLOGLevelDB中各种文件的作用在LevelDB中，有以下几种类型的文件:SST(SortedStringTable)文件名为xxx.ldb，存储实际的Key-Value数据。WAL(WriteAheadLog)文件名为xxx.log，记录最近的写操作，以便在系统崩溃后恢复数据。MANIFEST文件名为MA
大白话解析LevelDB: TableBuilder Howard0o0 大白话解析LevelDB 数据库 c++
文章目录TableBuilder`TableBuilder`的使用姿势SST的格式`TableBuilder`的代码实现`TableBuilder`的构造函数TableBuilder::Add(constSlice&key,constSlice&value)TableBuilder::WriteBlockTableBuilder::WriteRawBlockTableBuilder::Flush(
大白话解析LevelDB: WritableFile 接口 Howard0o0 大白话解析LevelDB c++数据库
文章目录WritableFileWritableFile的构造PosixWritableFilePosixWritableFile的构造PosixWritableFile::Append(constSlice&data)PosixWritableFile::FlushBuffer()PosixWritableFile::WriteUnbuffered(constchar*data,size_tsi
大白话解析LevelDB: Env Howard0o0 大白话解析LevelDB 数据库 c++
文章目录leveldb::Env跨平台运行环境的封装Env接口概览POSIX环境下的Env的实现POSIX下的Env::Default()的实现SingletonEnv的实现前置知识:placementnew与std::aligned_storageSingletonEnv的代码实现SingletonEnv的存在意义PosixEnv的构造函数PosixEnv的构造函数PosixEnv::NewSe
大白话解析LevelDB：数据格式 Howard0o0 大白话解析LevelDB 缓存 c++
文章目录LevelDB中的数据格式KeyUserKeyInternalKeyLookupKeyWriteBatchSSTDataBlockIndexBlockMetaBlock(FilterBlock)MetaIndexBlockFooterMANIFESTRecordLevelDB中的数据格式Key先说LevelDB里比较容易混淆的3种Key:UserKeyInternalKeyLookupKe
大白话解析LevelDB 2: MemTable 落盘为 SST 文件 Howard0o0 大白话解析LevelDB c++数据库
文章目录MemTable落盘为SST文件什么是`CompactMemTable`什么时候触发`CompactMemTable`如何触发`CompactMemTable``CompactMemTable`的过程将`MemTable`落盘成`SST`文件将`MemTable`生成一个新的`SST`文件:挑选合适的level-i用于放置新的`SST`将新SST的MetaData记录到`VersionEd
常见技术选型独处人
MQRocketMQ,RabbitMQ,Kafka,ActiveMQNoSQLRedis,Memcache分布式计算Blink,Storm,SparkDB关系型TiDB,MySQL,MongoDB,CassandraKVLevelDB,Rocksdb,PalDB文件BerkeleyDB,MapDB,ChronicleQueue,SQLite,RSocket时序型Influxdb,HiTSDB,Op
Ubuntu 16.04 + caffe环境搭建(CPU) 默写年华Antifragile
1.安装依赖sudoapt-getinstalllibprotobuf-devlibleveldb-devlibsnappy-devlibopencv-devlibhdf5-serial-devprotobuf-compilersudoapt-getinstall--no-install-recommendslibboost-all-devsudoapt-getinstalllibgflags-d
Db2插入数据溢出报错测试蓝黑2020 DB Java 数据库 db2 mybatis jdbc
本文是测试Db2数据库插入数据报错。具体来讲，是通过命令行、JDBC、Mybatis等各种方式，尝试把一个长度为11的字符串插入到VARCHAR(8)的字段，查看报错信息，方便以后遇到类似的错误时，能够帮助快速定位问题。测试环境Db2$db2levelDB21085IThisinstanceorinstall(instancename,whereapplicable:"db2inst1")uses
比特币源码阅读(leveldb-CBlockFileInfo) 坠叶飘香
CBlockFileInfo:包含存储block的文件的基本信息，具体的内容见下图2018-08-0716-10-53的屏幕截图.pngsrc/chain.hclassCBlockFileInfo{public:unsignedintnBlocks;//!inlinevoidSerializationOp(Stream&s,Operationser_action){READWRITE(VARINT
Leveldb代码阅读笔记 xiannvlei 技能建设笔记
整体架构如上图，leveldb的数据存储在内存以及磁盘上，其中：memtable：存储在内存中的数据，使用skiplist实现。immutablememtable：与memtable一样，只不过这个memtable不能再进行修改，会将其中的数据落盘到level0的sstable中。多层sstable：leveldb使用多个层次来存储sstable文件，这些文件分布在磁盘上，这些文件都是根据键值有序
LevelDB 完全解析（6）：Filter linjinhe
前文回顾LevelDB完全解析（0）：基本原理和整体架构LevelDB完全解析（1）：MemTableLevelDB完全解析（2）：LogLevelDB完全解析（3）：SSTableLevelDB完全解析（4）：ManifestLevelDB完全解析（5）：CacheBloomFilterLevelDB可以设置通过bloomfilter来减少不必要的读I/O次数。1970年，BurtonHowar
分布式块存储 ZBS 的自主研发之旅｜元数据管理志凌海纳SmartX 分布式
重点内容元数据管理十分重要，犹如整个存储系统的“大黄页”，如果元数据操作出现性能瓶颈，将严重影响存储系统的整体性能。如何提升元数据处理速度与高可用是元数据管理的挑战之一。SmartX分布式存储ZBS采用LogReplication的机制，在元数据存储方案上选择将LevelDB和Zookeeper相结合，从而以更加精简的架构实现了高可靠、高性能与轻量级的元数据服务。更多ZBS架构设计与技术解读，请阅
数据结构 | Log-Structured Merge Tree (LSM Tree) 赵同学的代码时间数据结构 lsm-tree
今天介绍LSMTree这个数据结构，严格意义上来说，他并不像他的名字一样是一棵树型的数据结构，而更多是一种设计思想。LSMTree最先在1996年被提出，后来被广泛运用于现代NoSQL（非关系型数据库）系统中，包括BigTable,Dynamo,HBase,Cassandra,LevelDB,RocksDB,andAsterixDB.LSMTree主要是瞄准了IO操作中，顺序写的速度比随机写快几个
时间序列数据的存储和计算 - 开源时序数据库解析 chuange6363 大数据数据库数据结构与算法
开源时序数据库如图是17年6月在db-engines上时序数据库的排名，我会挑选开源的、分布式的时序数据库做详细的解析。前十的排名中，RRD是一个老牌的单机存储引擎，Graphite底层是Whisper，可以认为是一个优化的更强大的RRD数据库。kdb+、eXtremeDB和Axibase都未开源，不做解析。InfluxDB开源版和Prometheus的底层都是基于levelDB自研的单机的存储引
caffe+ubuntu18.04+cuda10.2编译配置 s1037222866 caffe 人工智能深度学习
安装相应依赖apt-getinstalllibprotobuf-devlibleveldb-devlibsnappy-devlibopencv-devlibhdf5-serial-devprotobuf-compilerapt-getinstall--no-install-recommendslibboost-all-devapt-getinstallpython-devapt-getinstal
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

levelDB源码分析-Log文件

你可能感兴趣的:(levelDB)