初识LevelDB

概述

        因为工作的关系接触到了KV系统,而levelDB又是第一个接触到的KV系统,想整理成博客系列,这个系列的博客以转载为主,因为碰到的几篇博客写的确实很不错,对于有疑问的地方可能会加上自己的注释和理解。

初识levelDB

        说起LevelDb也许您不清楚,但是如果作为IT工程师,不知道下面两位大神级别的工程师,那您的领导估计会Hold不住了:Jeff Dean和Sanjay Ghemawat。这两位是Google公司重量级的工程师,为数甚少的Google Fellow之二。

Jeff Dean其人: Google大规模分布式平台GFS,Bigtable和MapReduce主要设计和实现者。

http://research.google.com/people/jeff/index.html

Sanjay Ghemawat其人:Google大规模分布式平台GFS,Bigtable和MapReduce主要设计和实现工程师。

http://research.google.com/people/sanjay/index.html

        LevelDb就是这两位大神级别的工程师发起的开源项目,简而言之,LevelDb是能够处理十亿级别规模Key-Value型数据持久性存储的C++程序库。正像上面介绍的,这二位是Bigtable的设计和实现者,如果了解Bigtable的话,应该知道在这个影响深远的分布式存储系统中有两个核心的部分:Master Server和Tablet Server。其中Master Server做一些管理数据的存储以及分布式调度工作,实际的分布式数据存储以及读写操作是由Tablet Server完成的,而LevelDb则可以理解为一个简化版的Tablet Server。

        LevelDb有如下一些特点:

  • 首先,LevelDb是一个持久化存储的KV系统,和Redis这种内存型的KV系统不同,LevelDb不会像Redis一样狂吃内存,而是将大部分数据存储到磁盘上。
  • 其次,LevleDb在存储数据时,是根据记录的key值有序存储的,就是说相邻的key值在存储文件中是依次顺序存储的,而应用可以自定义key大小比较函数,LevleDb会按照用户定义的比较函数依序存储这些记录。
  • 再次,像大多数KV系统一样,LevelDb的操作接口很简单,基本操作包括写记录,读记录以及删除记录。也支持针对多条操作的原子批量操作。
  • 另外,LevelDb支持数据快照(snapshot)功能,使得读取操作不受写操作影响,可以在读操作过程中始终看到一致的数据。
  • 除此外,LevelDb还支持数据压缩等操作,这对于减小存储空间以及增快IO效率都有直接的帮助。

        LevelDb性能非常突出,官方网站报道其随机写性能达到40万条记录每秒,而随机读性能达到6万条记录每秒。总体来说,LevelDb的写操作要大大快于读操作,而顺序读写操作则大大快于随机读写操作。至于为何是这样,看了后续推出的LevelDb介绍,估计您会了解其内在原因。

注:转载自:朗格科技  http://www.samecity.com/blog/Article.asp?ItemID=84


你可能感兴趣的:(分布式KV)