MongoDB的文档类似于JSON,JSON只是一种简单的表示数据的方式,只包含了6种数据类型(null、布尔、数字、字符串、数组及对象).
JSON的数据类型的局限性:
1.无日期类型,对日期型的处理较为繁琐
2.无法区分浮点数和整数、32位和64位
3.其他类型表示局限 如函数、正则式等
Mongodb使用BSON(Binary JSON)来组织数据,BSON还提供日期、32位数字、64位数字等类型。下面为在mongodb shell中这些类型在文档中是如何表示:
1、null 用于表示空值或者不存在的字段。
{"name":null}
2.布尔 布尔类型、即true和false
{"flag":true}/{"flag":false}
3.数字 mongodb中分32位整数、64位整数、64位浮点数
>javascript只支持64位浮点数,shell中对32位的整数会进行自动的转换:
默认情况下,shell中的数字被mongdb当做是双精度。若从数据库中获取一个32位整数,修改了文档后在将文档保存到数据库的时候,这个整数已被转换成了浮点数(整数不变也会转换)。
>shell中会用内嵌文档的方式显示64位整数:
数字智能表示为双精度数(64位浮点数)的另一个问题是,有些64位的整数并不能精确的表示64位浮点数。因此要是存入了一个64位整数然后在shell中查看,它显示一个内嵌的文档,表示可能不准确。
如:
插入文档{"name":"apple","num":5},其中"num"设置为64位整数5.
查看如下:
{ "_id" : ObjectId("5000f7af32e3988ad237a202"), "name" : "apple", "num" : {"floatApprox" : 5} }
插入文档{"name":"orange","num":9223372036854775807}
查看如下:
{ "_id" : ObjectId("5000f7af32e3988ad237a203"), "name" : "apple", "num" : {"floatApprox" : 9223372036854776000 ,"top" : 2147483647 , "bottom" : 4294967295} }
以上实例(可自己尝试见证)文档参见:Mongodb权威指南
我在本机(win7 32位)插入如下文档:
{"name":"apple","num":5}
{"name":"orange","num":9223372036854775807}
{"name":"peach","num":922337203685477580743254354565678678998935345}
>db.a.find()
{ "_id" : ObjectId("5000f7af32e3988ad237a204"), "name" : "apple", "num" : 5 }
{ "_id" : ObjectId("5000f87432e3988ad237a205"), "name" : "orange", "num" : 9223372036854776000 }
{ "_id" : ObjectId("5000fbd232e3988ad237a206"), "name" : "peach", "num" : 9.223372036854776e+44 }
64位浮点数:
{"num":3.14}/{"num":3}
4.字符串 UTF-8字符串都可以表示为字符串类型的数据
{"name":"orange"}
5.符号 shell中不支持,并将数据库里的符号类型都转换成字符串
6.对象id是文档的12字节的唯一ID
{"x":Object()}
Mongodb中存储的(同一个集合内)文档必须有,只有唯一的“_id”键。值可为任意类型,必须保证其唯一性,默认为ObjectId对象。至于mongodb为什么用ObjectId对象,以及它有什么好处等请翻阅相关资料。
下面是ObjectId的构成:
ObjectId使用12字节的存储空间,每个字节两位十六进制数字,是一个24位的字符串。12字节按照如下方式生成:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11
时间戳 | 机器码 | PID | 计数器
-----------------------------------------------
>时间戳:从标准的纪元开始的时间戳,单位为秒。
>机器码:所在主机的唯一标示符,通常为机器主机名的散列值。
>PID:产生ObjectId的进程标示符。
>计数器:自动增加计数器,同一秒最多允许每个进程拥有256的3次方(16777216)个不同的ObjectId。
文档的"_id"键:
1.插入文档的时候,没有该键,系统自动创建一个。
2.mongodb服务器可自动创建,通常在客户端由驱动程序完成:
>减少数据库扩展的负担
>驱动程序提供丰富的API,可返回ObjectId,也可插入文档;若有服务器生成的话,驱动程序需单独的查询来确定插入的文档中的"_id"值。
7.日期型 存储的是从标准纪元开始的毫秒数,不存储时区。
{"name":"xx","date":new Date()} 本机查看:{ "_id" : ObjectId("5001047632e3988ad237a206"), "name" : "xx", "date" : ISODate("2012-07-14T05:32:38.189Z") }
8.正则式 文档中可以包含正则表达式,采用javascript的正则表达式语法
{"regex":/[0-9]/g}
9.代码或者函数 javascript代码(mongodb中值直接保存到数据库,不对值进行执行,因此不存在安全问题)
{"setName":function(){var name="jk";alert(name)}}
10.二进制数 可以由任意字节的串组成。shell中无法使用。
11.最大值 BSON包括一个特殊类型,表示可能的最大值。shell没有这个类型。
12.最小值 BSON包括一个特殊类型,表示可能的最小值。shell没有这个类型。
13.未定义(undefined) 文档中也可以使用未定义类型
{"name":undefined}
14.数组 值的集合或者列表可以表示成数组
{"name":["s","d","f"]}
15.内嵌文档 文档可以包含文档,作为值嵌入到父文档中
{"sch" : "s"
"catl" : {
"c1" : {"cls1" : "cs1","cls2" : "cs2","cls3" : "cs3"}
"c2" : {"cls1" : "cs1","cls2" : "cs2","cls3" : "cs3"}
"c3" : {"cls1" : "cs1","cls2" : "cs2","cls3" : "cs3"}
}
}
从面向对象的角度来理解文档,文档就是个对象,文档里面的key/value就是属性和属性值。