内 容 简 介
本文介绍了MongoDB数据库的优点的数据存储模式的安装部署过程。
利用MongoDB在存储海量数据上的优势,部署存储空间大数据。
·欢迎批评指正补充
由于编者水平有限,所搜集资料也很有限,制定的规范肯定有考虑不周全、甚至完全错误的地方,欢迎大家批评指正。这些内容肯定很不全面,有什么好的原则、经验,也欢迎补充。
MongoDB官方已经发布了Win,Linux,MAC ,Solaris 4种平台的发布包,最新的版本是3.2.3,MongoDB遵循了偶数版本较为稳定的发布策略,这里推荐下载(2.4.x,2.6.x,3.0.x)版本。(安装版本推荐使用64位版本,因为MongoDB自身并不管理内存,这些工作都是交由操作系统完成,所以寻址空间只支持2.8G,同时MongoDB的性能与内存大小有直接关联)下载地址是http://www.mongodb.org/downloads
下载完成后,解压,就可以直接运行bin目录下的二进制文件,一般意义上的安装MongoDB,就是安装MongoDB的服务端进程mongod,如图1-1所示。
图1-1 解压后的文件
bin目录下的mongod.exe在运行时需要配置数据文件目录,如:D:\mongodb\db_rs0\data\rs0_0;同时指定一个日志接收文件,如: D:\mongodb\db_rs0\logs\1.log;配置服务配置文件的路径,如:D:\mongodb\db_rs0\logs,也可以直接运行下列命令>mongod -- dbpath D:/mongodb\db_rs0\data\rs0_0 ,Linux下的安装可以利用对应的包管理器,系统自动创建目录和日志文件。
Mongo复制集的配置:
复制集操作实现了数据库的冗余,用于数据从故障中的恢复,同时以复制集的冗余也保证了分片功能的稳定。
一般来说,一个复制集至少需要3个节点,每个节点都是mongod的一个实例,节点之间通过心跳检测检查对方状态。复制集分为:Primary,Second,Arbiter节点,primary负责读写,second负责备份,(在对数据一致性要求不是很严格的情况下,有时可以让primary只负责写,副节点负责读操作,在MongoDB空闲时完成数据的更新,这样能提高一定的性能)arbiter不参与数据处理,arbiter只在primary节点故障时,起到裁决新primary节点的任务。
具体配置如下:
1:、创建3个节点的数据目录
D:\mongodb\db_rs0\data\rs0_0;
D:\mongodb\db_rs0\data\rs0_1;
D:\mongodb\db_rs0\data\rs0_2;
2、创建3个节点的日志目录
D:\mongodb\db_rs0\logs\rs0_0.log;
D:\mongodb\db_rs0\logs\rs0_1.log;
D:\mongodb\db_rs0\logs\rs0_2.log;
3、创建3个节点的启动配置文件
D:\mongodb\configs_rs0\rs0_0.conf;
D:\mongodb\configs_rs0\rs0_1.conf;
D:\mongodb\configs_rs0\rs0_2.conf;
4、3个节点的配置文件的配置
dbpath=D:\mongodb\db_rs0\data\rs0_0 这里是该节点的数据目录
logpath=D:\mongodb\db_rs0\logs\rs0_0.log 这里是该节点的日志目录
journal=true 是否需要Journal日志功能
port=40000 端口号
replSet=rs0 复制集号
5、编写MongoDB实例启动代码
rs0start.bat:
@D:\mongodb\bin\mongod -config D:\mongodb\configs_rs0\rs0_0.conf
rs1start.bat:
@D:\mongodb\bin\mongod -config D:\mongodb\configs_rs0\rs0_1.conf
rs2start.bat:
@D:\mongodb\bin\mongod -config D:\mongodb\configs_rs0\rs0_1.conf
运行上面3个启动代码,就开启了MongoDB实例服务,第一次使用需要对复制集初始化,以及设置primary,second,arbiter节点。
6、运行mongo客户端:
>mongo --port 40000(服务端口号)
>rs.initiate() (初始化rs0对象,这里其实是在磁盘上开辟空间,MongoDB会保留一部分磁盘空间,并不删除,提高数据处理响应速度)
(这里返回如果是OK,初始化就完成了)
>rs.conf() (查看节点信息)
添加其余两个节点作为second与arbiter节点
rs0:primary>rs.add("主机号(IP):端口号")
{“ok”:1}
rs0.primary>rs.addArb("主机名(IP):端口号")
注意:
如果需要修改replica域名信息:
cfg=rs.conf()
cfg.members[复制集号].host="Ip:port"
rs.reconfig(cfg)
Mongo分片的配置:
分片集群操作实现了数据的海量存储,查询。
分片集群分为3个部分:shard,mongos路由进程,配置服务器,其中shard就是单个mongod实例(一般是一个复制集,每个复制集的节点可以不布置到同一个主机);mongos路由进程对客户端是透明的,在用户看来,整个集群就是一个服务;配置服务器其本质也是一个mongod实例,它存储了分片信息,以提供给上层的mongos路由进程使用,这里存储了所有数据库的分片情况,正是有了这些信息,在分片集群上的查询的速度有了保证。
具体配置如下:
1、复制集的配置如1.3所示,只是需要配置多个复制集
2、配置configure服务器
(为了保证分片集群在故障后的恢复,一般将服务器也设置成复制集的形式)
configure服务配置文件:
dbpath= D:\mongodb\db_configs\data\db_config0
logpath= D:\mongodb\db_configs\logs\db_config0.log
journal=true
port=40006
configsvr=true 声明这是一个集群的configure服务
3、启动mongos路由服务器:
配置cfg_mongos.conf:
logpath=D:\mongodb\mongos\logs\mongos.log
port=40009
configdb=IP1:PORT1, IP2:PORT2, IP3:PORT3
4启动路由服务器:
>mongos --config D:\mongodb\mongos\cfg_mongos.conf
5、添加复制集至集群中:
>mongo --port 40009
mongos>sh.addShard("复制集名/复制集中不包含arbiter的所有节点")
分片设置完成后,需要对选定的数据库集合分片,首先需要使数据库支持分片
如下:
1、连接到集群中的mongos实例:
>mongo --port 40009
2、创建或打开数据库
mongos>use 数据库名
3、使数据库支持分片
mongos>sh.enableSharding("数据库名")
4、创建基于片键的索引使集合分片
mongos>db.users.ensureIndex({片键:1})
mongos>db.shardCollection(“库名.集合名”,{片键:1})
1、mongod启动后,默认是没有打开权限认证的功能的,需要mongod实例修改配置文件
如下:
dbpath= D:\mongodb\db_rs0\data\rs0_0
logpath= D:\mongodb\db_rs0\logs\rs0_0.log
journal=true
port=40000
auth=true
2、启动mongod命令
rs0start.bat:
@D:\mongodb\bin\mongod -config D:\mongodb\configs_rs0\rs0_0.conf
3、创建角色:
>db.createUser(
{
user:"角色名",
pwd:"密码",
roles:[{role:"系统角色",db:"admin(admin是用于管理角色的数据库,保存权限信息)"}
]
}
)
4、下次登陆就需要:
>mongo --port 端口号 -u 角色名 -p密码 --authenticationDatabase admin
注意:
1、系统角色:readAnyDatabase(只读)
readwriteAnyDatabase(读写)
userAdminAnyDatabase(用户管理)
dbAdminAnyDatabase(管理)
root(包括上面4个)
2、复制集,分片权限:
每个节点启动的指令
>mongo --keyFile 存储密码的txt文件路径
其余设置与单个实例设置相同