MongoDB之bson的介绍


MongoDB之bson的介绍

 转自:http://blog.csdn.net/amuseme_lu/article/details/6573912

1. 什么是bson

BSON是一种类json的一种二进制形式的存储格式,简称Binary JSON,它和JSON一样,支持内嵌的文档对象和数组对象,但是BSON有JSON没有的一些数据类型,如Date和BinData类型。

BSON可以做为网络数据交换的一种存储形式,这个有点类似于Google的Protocol Buffer,但是BSON是一种schema-less的存储形式,它的优点是灵活性高,但它的缺点是空间利用率不是很理想,

BSON有三个特点:轻量性、可遍历性、高效性

{“hello":"world"} 这是一个BSON的例子,其中"hello"是key name,它一般是cstring类型,字节表示是cstring::= (byte*) "/x00" ,其中*表示零个或多个byte字节,/x00表示结束符;后面的"world"是value值,它的类型一般是string,double,array,binarydata等类型。

 

2. bson在MongoDB中的使用

MongoDB使用了BSON这种结构来存储数据和网络数据交换。把这种格式转化成一文档这个概念(Document),因为BSON是schema-free的,所以在MongoDB中所对应的文档也有这个特征,这里的一个Document也可以理解成关系数据库中的一条记录(Record),只是这里的Document的变化更丰富一些,如Document可以嵌套。

MongoDB以BSON做为其存储结构的一种重要原因是其可遍历性。

 

3. 几个BSON的例子

3.1 一个Document的BSON表示:

[c-sharp]  view plain copy
  1. {  
  2. title:"MongoDB",  
  3. last_editor:"192.168.1.122",  
  4. last_modified:new Data("27/06/2011"),  
  5. body:"MongoDB introduction",  
  6. categories:["Database","NoSQL","BSON"],  
  7. revieved:false  
  8. }  
 

这是一个简单的BSON结构体,其中每一个element都是由key/value对组成的

3.2 一个嵌套的例子

[c-sharp]  view plain copy
  1. {  
  2. name:"lemo",  
  3. age:"12",  
  4. address:{  
  5. city:"suzhou",  
  6. country:"china",  
  7. code:215000  
  8. }  
  9. scores:[  
  10. {"name":"english","grade:3.0},  
  11. {"name":"chinese","grade:2.0}  
  12. ]  
  13. }  
 

这是一种相对复杂点的例子,其中包括了地址对象和分数对象数组,这里使用了嵌套文档对象与文档对象数据来表示单个学生的信息,这种嵌套的文档结构要使用关系数据库来做是比较复杂的。

 

4. BSON c++ 代码分析

MongoDB源代码树中包括了BSON的代码库,你只要包含bson.h这个头文件就行了,其中有四个类是比较重要的:

[c-sharp]  view plain copy
  1. * mongo::BSONObj,这个是BSON对象的表示  
  2. * mongo::BSONElement,这个是BSON对象中元素的表示方法   
  3. * mongo::BSONObjBuilder,这是构建BSON对象的类  
  4. * mongo::BSONObjIterator,这是用来遍历BSON对象中每一个元素的一个迭代器  
 

 

下面是创建一个BSON对象

[c-sharp]  view plain copy
  1. BSONObjBuilder b;  
  2. b.append("name","lemo"),  
  3. b.append("age",23);  
  4. BSONObj p = b.obj();  
 

 

或者

[c-sharp]  view plain copy
  1. BSONObj p = BSONObjBuilder().append("name","lemo").append("age",23).obj();  
 

或者用流的方法来

[c-sharp]  view plain copy
  1. BSONObjBuilder b;  
  2. b << "name" << "lemo" << "age" << 23;  
  3. BSONObj p = b.obj();  
 

 

或者用宏来创建一个对象

[c-sharp]  view plain copy
  1. BSONObj p = BSON( "name" << "Joe" << "age" << 33 );  
 

这里分析一下这四个类的一些代码:

mongo::BSONObj主要是用于存储BSON对象的,具体的存储格式如下

[c-sharp]  view plain copy
  1.      <unsigned totalSize> {<byte BSONType><cstring FieldName><Data>}* EOO  
  2.         --------------------              -------------                -----------------               ----           ---  
  3. totalSize: 一个总的字节长度,包含自身  
  4. BSONType: 对象类型,这里有Boolean,String,Date等类型,具体可以参考bsontypes.h这个文件  
  5. FieldName: 这里表示字段名  
  6. Data: 这里是放具体的数据,数据的存储方式根据不同的BSONType来  
  7. * : 表示可以有多个元素组成  
  8. EOO: 这是一个结束符,一般是/x00来表示  
 

一般来说,BSONObj的创建都是通过BSONObjBuilder来做的,除非你已经得到了其字节流,那可以直接生成BSONObj

 

mongo::BSONElement 它主要是用于存储对象中的单个元素,存储格式如下

[c-sharp]  view plain copy
  1. <type><fieldName><value>  
 

这个对象主要是指向BSONObj对象中具体元素的地址,它不实际存储元素的值。

mongo::BSONObjBuilder 它主要是用于生成BSONObj,这个对象集成了StringBuilder,它主要用于存储实际的字节点,用于替换std::stringstream,而这个StringBuilder集成了BufBuilder,这是一个可以动态增长内存缓冲区,但最大容量不能超过64MB的大小,也就是说一个BSONObj最大不能超过64MB。

 

mongo::BSONOBjIterator 它主要是用来遍历BSONObj对象中的每一个元素,提供了类似于stl iterator的一些接口,它还提供了一个ForEach宏来提供更方便的操作,如

[c-sharp]  view plain copy
  1. if (foo) {  
  2.            BSONForEach(e, obj)  
  3.                doSomething(e);  
  4.        }  
 

 

 

5. 参考

* http://www.mongodb.org/pages/viewpage.action?pageId=16646453 

* http://bsonspec.org/

* http://www.mongodb.org/display/DOCS/BSON

你可能感兴趣的:(MongoDB之bson的介绍)