ttlsa教程系列之mongodb---(一)mongodb介绍

最近抽出点时间,总结下mongodb知识,写个系统专题供网友们参考学习。mongodb介于关系型数据库和非关系型数据库之间,mongodb势头很火的,许多公司都在使用这款数据库,某些公司将mysql数据库转换到mongodb数据库上。Cassandra、Couchbase和HBase是MongoDB三大竞争对手。 一. mongodb介绍 1. mongodb主要特性 a.模式自由,支持动态查询,全文索引(2.4版本开始支持),方便查询文档中的对象和数组 b.文档存储类型 c.高效的数据存储,支持二进制数据以及大型对象如视频、图片等 d.多种架构,支持复制,故障恢复 e.自动分片 f.高度伸缩性,可动态添加服务器 2. mongodb适用场景 a.持久化缓存层 b.实时数据存储 c.BSON数据格式非常适合文档化格式的存储和查询 d.数十台或上百台的数据库集群 3. mongodb不适用场景 a. 高度事务性系统 b. 商业智能应用 c. 复杂的跨表级联查询 二. mongodb工作方式 1. mongodb使用内存映射文件进行数据管理。把所有空闲内存当缓存使用,而且不能指定内存大小。 2. mongodb数据空间采用预分配。为每个数据库分配一系列文件,每个数据文件预分配一个大小,第一个文件名字为xxx.0,大小64M,第二个文件名字为xxx.1,大小128M,第三个文件名字为xxx.2,大小为256M,以此类推。在32位系统下支持的最大文件为2G。随着数据量的递增,在数据库工作目录下会看到不断递增的文件。 3. mongodb没有自增序列。mongodb中存储的文档必须要有一个_id键,这个值可以是任何类型的,默认是objectid对象。当BSON对象插入到数据库时,会自动生成一个objectid对象作为_id插入到集合中作为该文档的主键。在一个集合里,每个文档都有唯一的_id值,来确保集合里每个文档都能被唯一标识。如果有两个集合的话,两个集合都可以有一个值为123的_id键,但每个集合里只能有一个_id是123的文档。_id值由4字节的时间戳,3字节的机器号,2字节的进程id和3自己的自增计数组成。_id值也可以手工生成,只要确保唯一性即可。 4. 每个插入的BSON对象大小不能超过4M,否则需要使用GridFS来存储。 5. 删除数据后不会释放空间。为了避免数据的大规模移动,原记录空间不删除,只标记已删除,可以重复利用。如果为了收回空间可以进行repair操作,不过特别注意这个操作需要锁表的。 6. use database_name时,并不产生新的数据库,只有插入文档时产生。 三. mongodb数据类型 mongodb支持基本的数据类型string、integer、boolean、double、null、array、object。除外还支持date、objectid、binary data、regular expression、code数据类型。 四. mongodb命令规则 1. 集合名不能为空 2. 集合名不能含有空字符,空字符表示集合名的结尾 3. 集合名不能以system.开头。system为系统保留的。system.users这个集合保存数据库的用户信息,system.namespaces保存着所有数据库集合的信息,system.indexes索引文件,system.profile数据库的相关信息 4. 用户创建的集合名字不能含有保留字符$ 五. 数据库 1. 数据库命名规则 a. 不能是空字符串 b. 不能含有‘’,空格,.,$,/,\,空字符 c. 应全部小写 d. 最多64个字节 2. 特殊数据库 a. admin root数据库,用户添加到这个数据库,同时一些特定的命令也只能从这个数据库运行,比如列出所有数据库或关闭数据库(需要在启用验证模式下) b. local 这个数据库永远不会被复制,用来存储限于本地服务器的集合。 c. config 用于保存分片的相关信息。 六. mongodb驱动连接 格式如下: mongodb://[username:password@]host1[:port1][,host2[:port2],...[,hostN[:portN]]][/[database][?options]] 说明: mongodb:// 标示标准连接方式 username:password 可选的,连接mongodb的用户名和密码 hostX 要连接的服务器ip portX 要连接的服务器端口 /database 要登录的数据库名 ?options 连接可选选项,采用kv方式,每对kv值用&或;分割 ?options项有: 1. Replica set replicaSet=name 驱动程序将验证连接的replicaset的名字与name是否相匹配,意味着指定的主机地址,都可以连接replicaSet中所有的成员。 2. Single server slaveOk=true|false true从可以读。默认情况下从不可写不可读的。 3.其他设置 a. safe=true|false true为了保证更新成功,驱动程序将每次更新后发送getLastError命令。默认是false。 b. w=n mongodb集群中,n台服务器成功写入算更新成功。设置了此项后,safe=true隐式启用。 c. wtimeoutMS=ms 写超时时间。设置了此项后,safe=true隐式启用。 d. fsync=true|false true: 每次更新完后进行fsync操作确保数据刷新到磁盘上。设置了此项后,safe=true隐式启用。 e. journal=true|false true: Sync to journal。设置了此项后,safe=true隐式启用。 d. connectTimeoutMS=ms 连接超时时间。 e. socketTimeoutMS=ms socket连接超时时间。 实例如下:
mongodb://localhost
mongodb://user:password@localhost
mongodb://user:password@localhost/database
mongodb://example1.com:27017,example2.com:27017
mongodb://localhost,localhost:27018,localhost:27019
mongodb://host1,host2,host3/?slaveOk=true
mongodb://localhost/?safe=true
mongodb://host1,host2,host3/?safe=true;w=2;wtimeoutMS=2000
mongodb://rs1.example.com:27017,rs2.example.com:27017/?replicaSet=myReplSetName
mongodb://localhost/?journal=true&w=majority&wTimeoutMS=20000
PHP驱动连接实例:
$m = new MongoClient("mongodb://localhost/?journal=true&w=majority&wTimeoutMS=20000");
$m = new MongoClient("mongodb://rs1.example.com:27017,rs2.example.com:27017/?replicaSet=myReplSetName"));
$m = new MongoClient("mongodb://rs1.example.com:27017", array("replicaSet" => "myReplSetName"));
$m = new MongoClient("mongodb://rs1.example.com:27017,rs2.example.com:27017", array("replicaSet" => "myReplSetName","wTimeoutMS"=>20000));
下一节将讲解mongodb的安装,请关注,有问题请跟帖说明或进Q群:39514058 转载请注明出处:http://www.ttlsa.com/html/1594.html

你可能感兴趣的:(mongodb,mongo)