DB最初开发的目的是以新的HASH访问算法来代替旧的hsearch函数和大量的dbm实现(如AT&T的dbm,Berkeley的ndbm,GNU项目的gdbm),DB的第一个发行版在1991年出现,当时还包含了B+树数据访问算法。在1992年,BSD UNIX第4.4发行版中包含了DB1.85版。基本上认为这是DB的第一个正式版。在1996年中期,Sleepycat软件公司成立,提供对DB的商业支持。在这以后,DB得到了广泛的应用,当前最新版本是4.3.27。
DB支持几乎所有的现代操作系统,如LINUX、UNIX、WINDOWS等,也提供了丰富的应用程序接口,支持C、C++、JAVA、PERL、TCL、PYTHON、PHP等。DB的应用十分广泛,在很多知名的软件中都能看到其身影。例如参考资料2中作者谈到利用DB在LINUX下实现内核级文件系统;参考资料3中通过实际测试数据说明DB提高了OPENLDAP的效率。LINUX下的软件包管理器RPM也使用DB管理软件包相关数据,可以使用命令file查看RPM数据目录/var/lib/rpm下的文件,则有形式如下的输出:
Dirnames: Berkeley DB (Btree, version 9, native byte-order)
Filemd5s: Berkeley DB (Hash, version 8, native byte-order)
值得注意的是DB是嵌入式数据库系统,而不是常见的关系/对象型数据库,对SQL语言不支持,也不提供数据库常见的高级功能,如存储过程,触发器等。
dbm,sdbm,ndbm,gdbm,jdbm,bdb
w3c-dbm和sdbm都是非常简单的kv store的两个实现,不支持事务,也不保证数据的可靠。但是通过分析这两个project,对hash如何结合disk来使用有一定的认识,这和in-memory的hash还是有一定的区别的。下一篇文章会分析jdbm的实现,它通过WAL(write-ahead-log)实现事务。并且对kv的组织和w3c-dbm,sdbm也不一样。
Berkeley DB并不是一个关系型的数据库。不能应用标准的SQL语句对数据库操作,对它的操作要调用专用的API实现。这些API提供了查询、插入、删除等功能。
Berkeley DB提供了四种存储数据的模式:Btree,Hash,Queue和Recno。在打开数据库的时候要指定一种存储模式
Btree 模式是以排序的二叉树的方式存储,
Hash是以线性哈希表的方式存储。
Queue用逻辑记录号做为键值,以定长的数据为记录值。
Recno方式也以逻辑记 录号做为键值,但可以保存定长或变长的记录值。这里提到的逻辑记录号有两种,可变的和固定的。
SQLite与Berkeley DB相比,在操作语句上更类似关系型数据库的产品。绝大多数标准的SQL92语句SQLite都能支持。
将于2010年3月底正式发布最新版本Oracle Berkeley DB 11g release 2。除了对原有Oracle Berkeley DB的功能进行了一定的改进和增强(比如提升了数据压缩功能、性能优化、C/C++中系统资源自动管理功能等等),本次发布的版本中最引人瞩目的变化是引入了对SQL92的支持,这一新增的接口称为Oracle Berkeley DB SQL,简称BDBSQL。这是自Berkeley DB诞生20多年来第一次支持SQL接口。这无论是对开源社区,还是对嵌入式数据库行业来说,都将是一件喜事。
For compatibility with programs using old UNIX dbm function, the package also provides traditional dbm and ndbm interfaces.
GNU dbm (or GDBM, for short) is a library of database functions that use extensible hashing and work similar to the standard UNIX dbm.
DB的设计思想是简单、小巧、可靠、高性能。如果说一些主流数据库系统是大而全的话,那么DB就可称为小而精。DB提供了一系列应用程序接口(API), 调用本身很简单,应用程序和DB所提供的库在一起编译成为可执行程序。这种方式从两方面极大提高了DB的效率。第一:DB库和应用程序运行在同一个地址空 间,没有客户端程序和数据库服务器之间昂贵的网络通讯开销,也没有本地主机进程之间的通讯;第二:不需要对SQL代码解码,对数据的访问直截了当。
berkley db管理工具
rpm,subversion都使用bdb数据库,包名叫db4
[root@localhost db]# rpm -qa|grep db
db4-4.7.25-18.el6_4.x86_64
gdbm-1.8.0-36.el6.x86_64
dbus-glib-0.86-6.el6.x86_64
dbus-libs-1.2.24-7.el6_3.x86_64
db4-utils-4.7.25-18.el6_4.x86_64
[root@localhost rpm]# pwd
/var/lib/rpm
[root@localhost rpm]# ll
total 28664
-rw-r--r--. 1 root root 1548288 Jul 17 15:00 Basenames
-rw-r--r--. 1 root root 12288 Jul 17 15:00 Conflictname
-rw-r--r--. 1 root root 24576 Jul 17 17:04 __db.001
-rw-r--r--. 1 root root 229376 Jul 17 17:04 __db.002
-rw-r--r--. 1 root root 1318912 Jul 17 17:04 __db.003
-rw-r--r--. 1 root root 753664 Jul 17 17:04 __db.004
-rw-r--r--. 1 root root 782336 Jul 17 15:00 Dirnames
-rw-r--r--. 1 root root 2547712 Jul 17 15:00 Filedigests
-rw-r--r--. 1 root root 12288 Jul 17 15:00 Group
-rw-r--r--. 1 root root 12288 Jul 17 15:00 Installtid
-rw-r--r--. 1 root root 12288 Jul 17 15:00 Name
-rw-r--r--. 1 root root 12288 Jul 17 15:00 Obsoletename
-rw-r--r--. 1 root root 21786624 Jul 17 15:00 Packages
-rw-r--r--. 1 root root 1282048 Jul 17 15:00 Providename
-rw-r--r--. 1 root root 557056 Jul 17 15:00 Provideversion
-rw-r--r--. 1 root root 12288 Jun 24 10:56 Pubkeys
-rw-r--r--. 1 root root 110592 Jul 17 15:00 Requirename
-rw-r--r--. 1 root root 69632 Jul 17 15:00 Requireversion
-rw-r--r--. 1 root root 24576 Jul 17 15:00 Sha1header
-rw-r--r--. 1 root root 12288 Jul 17 15:00 Sigmd5
-rw-r--r--. 1 root root 12288 Jun 24 10:57 Triggername
[root@localhost lib]# cd /root/svnrepo/db/
[root@localhost db]# ll
total 2216
-rw-r--r--. 1 root root 8192 Jul 17 16:09 changes
-rw-r--r--. 1 root root 8192 Jul 17 16:06 checksum-reps
-rw-r--r--. 1 root root 8192 Jul 17 15:26 copies
-rw-r--r--. 1 root root 24576 Jul 17 16:15 __db.001
-rw-r--r--. 1 root root 368640 Jul 17 16:15 __db.002
-rw-r--r--. 1 root root 1318912 Jul 17 16:15 __db.003
-rw-r--r--. 1 root root 393216 Jul 17 16:15 __db.004
-rw-r--r--. 1 root root 1499136 Jul 17 16:15 __db.005
-rw-r--r--. 1 root root 57344 Jul 17 16:15 __db.006
-rw-r--r--. 1 root root 2422 Jul 17 15:26 DB_CONFIG
-rw-r-----. 1 root root 50 Jul 17 16:15 __db.register
-r--r--r--. 1 root root 2 Jul 17 15:26 format
-rw-r--r--. 1 root root 4 Jul 17 15:26 fs-type
-rw-r--r--. 1 root root 8192 Jul 17 15:26 locks
-rw-r--r--. 1 root root 8192 Jul 17 15:26 lock-tokens
-rw-r--r--. 1 root root 1048576 Jul 17 16:15 log.0000000001
-rw-r--r--. 1 root root 8192 Jul 17 15:26 miscellaneous
-rw-r--r--. 1 root root 8192 Jul 17 16:09 node-origins
-rw-r--r--. 1 root root 8192 Jul 17 16:09 nodes
-rw-r--r--. 1 root root 8192 Jul 17 16:09 representations
-rw-r--r--. 1 root root 8192 Jul 17 16:09 revisions
-rw-r--r--. 1 root root 8192 Jul 17 16:09 strings
-rw-r--r--. 1 root root 8192 Jul 17 16:09 transactions
-rw-r--r--. 1 root root 8192 Jul 17 15:26 uuids
11:54:52 36 ~:#db_stat -d /var/lib/rpm/Basenames Thu Jun 25 12:04:32 2015 Local time 61561 Hash magic number 9 Hash version number Little-endian Byte order Flags 367 Number of pages in the database 4096 Underlying database page size 0 Specified fill factor 21451 Number of keys in the database 21451 Number of data items in the database 192 Number of hash buckets 197782 Number of bytes free on bucket pages (74% ff) 46 Number of overflow pages 80396 Number of bytes free in overflow pages (57% ff) 63 Number of bucket overflow pages 182945 Number of bytes free in bucket overflow pages (29% ff) 0 Number of duplicate pages 0 Number of bytes free in duplicate pages (0% ff) 1 Number of pages on the free list
oracle berkeley DB programmer reference guide的第一章较为有用,值得一看
http://docs.oracle.com/cd/E17076_04/html/index.html
关系数据库,k/v数据库,内存数据库
大数据时代的 9 大Key-Value存储数据库
bdb是kv数据库,sqlite是嵌入式关系数据库
Oracle Berkeley DB bdb的介绍下面这句话很重要,提纲挈领
Provides an open source embeddable database library, allowing developers
the choice of SQL, Key/Value, XML/XQuery or Java Object storage for their data model.
data model
在过去的十年中,计算世界已经改变。现在不仅在大公司,甚至一些小公司也积累了TB量级的数据。各种规模的组织开始有了处理大数据的需求,而目前关系型数据库在可缩放方面几乎已经达到极限。
一个解决方案是使用键值(Key-Value)存储数据库,这是一种NoSQL(非关系型数据库)模型,其数据按照键值对的形式进行组织、索引和存储。KV存储非常适合不涉及过多数据关系业务关系的业务数据,同时能有效减少读写磁盘的次数,比SQL数据库存储拥有更好的读写性能。
SQL
sql数据库存储
关系模型
Key/Value
kv存储
这是一种NoSQL(非关系型数据库)模型
以MemcacheDB、Tokyo Tyrant为代表的key-value分布式存储,在上万并发连接下,轻松地完成高速查询。而MySQL,在几百个并发连接下,就基本上崩溃了。
Scalaris 是一个采用Erlang开发的分布式 key-value 存储系统,提供的 API 包括:Java、Python、Ruby和JSON。
XML/XQuery
解释XQuery最佳方式是这样讲:XQuery 相对于 XML 的关系,等同于 SQL 相对于数据库表的关系。
XQuery 被设计用来查询 XML 数据 - 不仅仅限于 XML 文件,还包括任何可以 XML 形态呈现的数据,包括数据库。
XQuery 是用于 XML 数据查询的语言
XQuery 被所有主要的数据库引擎支持(IBM、Oracle、Microsoft等等)
Java Object storage
Object storage systems allow relatively inexpensive, scalable and self-healing retention of massive amounts of unstructured data.
Object storage is used for diverse purposes such as storing photos on Facebook, songs on Spotify, or files in online collaboration services, such as Dropbox
相对便宜的,可扩展的和自修复的
对像存储被用于多种目的,例如存储图片在facebook,歌曲在spotify,文件放在在线协作服务里如dropbox。
Object Storage (also known as object-based storage) is a storage architecture that manages data as objects, as opposed to other storage architectures like file systems which manage data as a file hierarchy and block storage which manages data as blocks within sectors and tracks. Each object typically includes the data itself, a variable amount of metadata, and a globally unique identifier.
http://www.sqlite.org/docs.html
sqlite的sql语法
先将sqlite数据库文件复制到一个安全的地方再做实验,系统中已知的两个sqlite数据库文件 sqlite3 /var/cache/yum/x86_64/6/base/617a880b84a87969e04bfeebb1b96d5f4 [root@svnserv ~]# sqlite3 /home/svnroot/flt8a-2-server/db/rep-cache.db SQLite version 3.3.6 Enter ".help" for instructions sqlite> .show echo: off explain: off headers: off mode: list nullvalue: "" output: stdout separator: "|" width: sqlite> .databases seq name file --- --------------- ---------------------------------------------------------- 0 main /home/svnroot/flt8a-2-server/db/rep-cache.db sqlite> .table rep_cache sqlite> .schema rep_cache CREATE TABLE rep_cache (hash text not null primary key, revision integer not null, offset integer not null, size integer not null, expanded_size integer not null); sqlite> .mode column sqlite> select * from rep_cache where revision >= 2710; e943a0338d96f6488ebddd5f435c05c5f47104d4 2710 0 499 1185 153deb942c12bbd61b7dce98de4e8c22dc29a835 2711 0 147 215586 sqlite> .mode html sqlite> select * from rep_cache where revision >= 2710; <TR><TD>e943a0338d96f6488ebddd5f435c05c5f47104d4</TD> <TD>2710</TD> <TD>0</TD> <TD>499</TD> <TD>1185</TD> </TR> <TR><TD>153deb942c12bbd61b7dce98de4e8c22dc29a835</TD> <TD>2711</TD> <TD>0</TD> <TD>147</TD> <TD>215586</TD> </TR> sqlite> .mode insert sqlite> select * from rep_cache where revision >= 2710; INSERT INTO table VALUES('e943a0338d96f6488ebddd5f435c05c5f47104d4',2710,0,499,1185); INSERT INTO table VALUES('153deb942c12bbd61b7dce98de4e8c22dc29a835',2711,0,147,215586); sqlite> .mode line sqlite> select * from rep_cache where revision >= 2710; hash = e943a0338d96f6488ebddd5f435c05c5f47104d4 revision = 2710 offset = 0 size = 499 expanded_size = 1185 hash = 153deb942c12bbd61b7dce98de4e8c22dc29a835 revision = 2711 offset = 0 size = 147 expanded_size = 215586 sqlite> .mode list sqlite> select * from rep_cache where revision >= 2710; e943a0338d96f6488ebddd5f435c05c5f47104d4|2710|0|499|1185 153deb942c12bbd61b7dce98de4e8c22dc29a835|2711|0|147|215586 sqlite> .mode tabs sqlite> select * from rep_cache where revision >= 2710; e943a0338d96f6488ebddd5f435c05c5f47104d4 2710 0 499 1185 153deb942c12bbd61b7dce98de4e8c22dc29a835 2711 0 147 215586 sqlite> .mode tcl sqlite> select * from rep_cache where revision >= 2710; "e943a0338d96f6488ebddd5f435c05c5f47104d4" "2710" "0" "499" "1185" "153deb942c12bbd61b7dce98de4e8c22dc29a835" "2711" "0" "147" "215586" sqlite> select date('now'); "2015-06-25" sqlite> select strftime('%s','now'); "1435201574" 返回当前年的第10月的第一个星期二的日期 sqlite> select date('now','start of year','+9 months','weekday 2'); "2015-10-06"
[root@fgy ~]# rpm -ql sqlite
/usr/bin/sqlite3
/usr/lib64/libsqlite3.so.0
/usr/lib64/libsqlite3.so.0.8.6
/usr/share/doc/sqlite-3.6.20
/usr/share/doc/sqlite-3.6.20/README
/usr/share/man/man1/sqlite3.1.gz
5 个免费的受欢迎的 SQLite 管理工具
用yumi制作centos6.5u盘启动盘时repodata目录下也有sqlite库文件。
14:22:45 12 /var/cache/yum/x86_64/6/base:#ll
total 20396
-rw-r--r--. 1 root root 20873216 Mar 11 06:26 9a3a8909e656c27cd85c75a2d53b491040effa3f170b0369172433843e1829d7-primary.sqlite
-rw-r--r--. 1 root root 0 Apr 15 11:48 cachecookie
-rw-r--r--. 1 root root 472 Apr 15 11:48 mirrorlist.txt
drwxr-xr-x. 2 root root 4096 Apr 15 11:49 packages
-rw-r--r--. 1 root root 3751 Oct 24 21:59 repomd.xml
14:22:45 13 /var/cache/yum/x86_64/6/base:#pwd
/var/cache/yum/x86_64/6/base