首先,我们要了解Berkeley DB的一些基本特性,在IBM的开发网站上有篇文章对其有比较清晰的介绍;
这篇文章讲到了BDB的设计思想和核心数据结构、以及数据访问算法;并有常用函数使用范例;算是接触BDB的一个入门好材料;
进入以下url阅读:
http://www.ibm.com/developerworks/cn/linux/l-embdb/index.html
我现在的问题是,我们需要使用BDB的话,有以下问题需要解决:
如何使用各个常用操作?
数据访问算法的选择?
性能如何?需要做一个贴近实际的性能测试;
BDB支持多索引,那么多索引是如何建立的?
针对特定环境,如何建立合适的索引?
如何封装,以便于我们方便的使用?
如何将SQL移植为NOSQL?
在接下来的学习中,我将集中解决以上问题;
在这篇文章中,我们学习BDB的常用操作。
oracle Berkeley DB官网:
http://www.oracle.com/us/products/database/berkeley-db/overview/index.html
http://www.oracle.com/technetwork/products/berkeleydb/downloads/index.html?ssSourceSiteId=ocomen
下载版本:Berkeley DB 6.0.20.tar.gz
进入对应环境的安装目录:
cd build_unix
../dist/configure --prefix=/opt/app/todeav1/soft/bdb/
BDB_HOME=/opt/app/todeav1/colin/db;export BDB_HOME
LIBPATH=$BDB_HOME/bin:$LIBPATH; export LIBPATH
LD_LIBRARY_PATH=$BDB_HOME/lib:$LD_LIBRARY_PATH;export LD_LIBRARY_PATH
g++ -o test demo.cpp -I$BDB_HOME/include/ -L$BDB_HOME/lib/ -ldb –lpthread
首先调用db_create()函数来创建DB 结构的一个实例,然后再调用DB->open()函数来完成真正的打开操作。
Berkeley DB 将所有对数据库的操作都封装在名为DB 的结构中。db_create()函数的作用就是创建一个该结构。
将磁盘上保存的文件作为数据库打开是由DB->open()函数来完成的,其原型如下所示:
int DB->open(DB *db, DB_TXN *txnid, const char *file, const char *database, DBTYPE type, u_int32_t flags, int mode); eg: if ((ret = db_create(&dbp, NULL, 0)) != 0) { fprintf(stderr, "db_create: %s\n", db_strerror(ret)); exit (1); } if ((ret = dbp->open(dbp, NULL, DATABASE, NULL, DB_BTREE, DB_CREATE, 0664)) != 0) { dbp->err(dbp, ret, "%s", DATABASE); exit (1); }
参数“DATABASE”指明对应的磁盘文件名为demo.db;参数“DB_BTREE”表示数据库底层使用的数据结构是B 树;而参数“DB_CREATE”和“0664”则表明当数据库文件不存在时创建一个新的数据库文件,并且将该文件的属性值设置为0664。
错误处理是在打开数据库时必须的例行检查,这可以通过调用DB->err()函数来完成。其中 参数“ret”是在调用Berkeley DB 函数后返回的错误代码,其余参数则用于显示结构化的错 误信息。
向Berkeley DB 数据库中添加数据可以通过调用DB->put()函数来完成,其原型如下所示:
int DB->put(DB *db, DB_TXN *txnid, DBT *key, DBT *data,
u_int32_t flags);
在向数据库中添加数据时,如果给定的关键字已经存在,大多数应用会对于已经存在的数据。
采用覆盖原则。也就是说,如果数据库中已经保存了一个“sport/basketball”对,再次调用DB->put()函数添加一个“sport/football”对,那么先前保存的那些数据将会被覆盖。但Berkeley DB 允许在调用DB->put()函数时指定参数“DB_NOOVERWRITE”,声明不对数据库中已经存在的数据进行覆盖,一旦给出“DB_NOOVERWRITE”标记,如果DB->put()函数在执行过程中发现给出的关键字在数据库中已经存在了,就无法成功地把该Key/Data 对添加到数据库中,于是将返回错误代码 “DB_KEYEXIST”。
从Berkeley DB 数据库中检索数据可以通过调用DB->get()函数来完成,其原型如下所示:
int DB->get(DB *db, DB_TXN *txnid, DBT *key, DBT *data,
u_int32_t flags);
在进行数据检索时,对DB->get()函数的返回值进行处理是必不可少的,因为它携带着检索操作是否成功完成等信息。下面列出的是DB->get()函数的返回值:
◆0 函数调用成功,指定的关键字被找到;
◆DB_NOTFOUND 函数调用成功,但指定的关键字未被找到;
◆大于0 函数调用失败,可能出现了系统错误。
从Berkeley DB 数据库中删除数据可以通过调用DB->del()函数来完成,其原型如下所示:
int DB->del(DB *db, DB_TXN *txnid, DBT *key, u_int32_t flags);
删除数据只需给出相应的关键字,不用指明与之对应的数据。
eg: key.data = "sport"; key.size = sizeof("sport"); if ((ret = dbp->del(dbp, NULL, &key, 0)) == 0) printf("db: %s: key was deleted.\n", (char*)key.data); else dbp->err(dbp, ret, "DB->del");
对于一次完整的数据库操作过程来说,关闭数据库是不可或缺的一个 节。这是因为Berkeley DB 需要依赖于系统底层的缓冲机制,也就是说只有在数据库正常关闭的时候,修改后的数据才有可能全部写到磁盘上,同时它所占用的资源也才能真正被全部释放。关闭数据库的操作是通过调用DB->close()函数来完成的,其原型如下所示:
int DB->close(DB *db, u_int32_t flags);
Berkeley DB的所有操作都是在内存中进行,在关闭数据库句柄时,会将所有数据写入到硬盘中;在程序运行中,如需要同步数据到硬盘,可调用sync()函数:
注:这个函数在4.3之前的版本是无参的,而在之后的版本增加参数,修改之前的例子需注意兼容;
dbp->sync(dbp,0);
这篇文章对插入时每个操作有个详细的说明,并给出了进一步学习的文档link;
Berkeley DB示例程序详解 (1)
http://www.bdbchina.com/2009/02/berkeley-db%E7%A4%BA%E4%BE%8B%E7%A8%8B%E5%BA%8F%E8%AF%A6%E8%A7%A3-1/
Berkeley DB 官方开发者文档
http://docs.oracle.com/cd/E17076_03/html/index.html
官方主页:http://www.oracle.com/database/berkeley-db/db/index.html
产品下载:http://www.oracle.com/technology/software/products/berkeley-db/index.html
Berkeley DB中国研发团队博客:
http://www.bdbchina.com/
文档中心:http://www.oracle.com/technology/documentation/berkeley-db/db/index.html
Berkeley DB官方论坛(貌似已经无人维护):
https://forums.oracle.com/community/developer/english/berkeley_db_family