MongoDB主要是有四个组件:mongos、config server、shard、replica set。
- mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。
- config server,顾名思义为配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!
- shard,分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。
- replica set,中文翻译副本集,其实就是shard的备份,防止shard挂掉之后数据丢失。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。仲裁者(Arbiter),是复制集中的一个MongoDB实例,它并不保存数据。仲裁节点使用最小的资源并且不要求硬件设备,不能将Arbiter部署在同一个数据集节点中,可以部署在其他应用服务器或者监视服务器中,也可部署在单独的虚拟机中。为了确保复制集中有奇数的投票成员(包括primary),需要添加仲裁节点做为投票,否则primary不能运行时不会自动切换primary。
lk | slave2 | slave3 | slave4 | slave5 |
---|---|---|---|---|
mongos | mongos | mongos | ||
config server | config server | config server | shard1 | shard1 |
shard1 | shard2 | shard2 | shard2 | shard3 |
shard3 | shard3 | shard4 | shard4 | shard4 |
副本集 | 端口 |
---|---|
config server | 21000 |
mongos | 20000 |
shard1 | 27001 |
shard2 | 27002 |
shard3 | 27003 |
shard4 | 27004 |
注意:一个机器归于多个副本集时,要用不同的端口号以示区别
解压
tar -xzvf mongodb-linux-x86_64-3.4.6.tgz
mkdir
cp -R
在每台机器中创建文件夹
mkdir -p /usr/local/mongodb/conf
mkdir -p /usr/local/mongodb/mongos/log
mkdir -p /usr/local/mongodb/config/data
mkdir -p /usr/local/mongodb/config/log
mkdir -p /usr/local/mongodb/shard1/data
mkdir -p /usr/local/mongodb/shard1/log
mkdir -p /usr/local/mongodb/shard2/data
mkdir -p /usr/local/mongodb/shard2/log
mkdir -p /usr/local/mongodb/shard3/data
mkdir -p /usr/local/mongodb/shard3/log
vim /etc/profile
# 内容
export MONGODB_HOME=/usr/local/mongodb
export PATH=$MONGODB_HOME/bin:$PATH
# 使立即生效
source /etc/profile
对于config server也创建副本集
修改配置文件
主要配置的是文件路径,数据库路径和日志路径
还有ip(本机),端口(21000),副本集名称,等等
vi /usr/local/mongodb/conf/config.conf
## 配置文件内容
pidfilepath = /usr/local/mongodb/config/log/configsrv.pid
dbpath = /usr/local/mongodb/config/data
logpath = /usr/local/mongodb/config/log/congigsrv.log
logappend = true
bind_ip = 0.0.0.0
port = 21000
fork = true
#declare this is a config db of a cluster;
configsvr = true
#副本集名称
replSet=configs
#设置最大连接数
maxConns=20000
mongod -f /usr/local/mongodb/conf/config.conf
#连接
mongo --port 21000
#config变量
config = {
... _id : "configs",
... members : [
... {_id : 0, host : "10.113.10.1:21000" },
... {_id : 1, host : "10.113.10.2:21000" },
... {_id : 2, host : "10.113.10.3:21000" }
... ]
... }
#初始化副本集
rs.initiate(config)
这里的id号,要和配置文件中的副本集名称相同
host后面是IP地址和端口
以shard1为例
vim /usr/local/mongodb/conf/shard1.conf
#配置文件内容
#——————————————–
vim /usr/local/mongodb/conf/shard1.conf
pidfilepath = /usr/local/mongodb/shard1/log/shard1.pid
dbpath = /usr/local/mongodb/shard1/data
logpath = /usr/local/mongodb/shard1/log/shard1.log
logappend = true
bind_ip = 0.0.0.0
port = 27001
fork = true
#打开web监控
httpinterface=true
rest=true
#副本集名称
replSet=shard2
#declare this is a shard db of a cluster;
shardsvr = true
#设置最大连接数
maxConns=20000
mongod -f /usr/local/mongodb/conf/shard2.conf
mongo --port 27001
use admin
config = {
... _id : "shard1",
... members : [
... {_id : 0, host : "10.113.10.4:27001" , arbiterOnly: true},
... {_id : 1, host : "10.113.10.5:27001" },
... {_id : 2, host : "10.113.10.1:27001"}
... ]
... }
rs.initiate(config);
依次配置shard2,shard3和shard4
配置路由服务器 mongos
修改mongos配置文件
vi /usr/local/mongodb/conf/mongos.conf
pidfilepath = /usr/local/mongodb/mongos/log/mongos.pid
logpath = /usr/local/mongodb/mongos/log/mongos.log
logappend = true
bind_ip = 0.0.0.0
port = 20000
fork = true
#监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字
configdb = configs/10.113.10.1:21000,10.113.10.2:21000,10.113.10.3:21000
#设置最大连接数
maxConns=20000
mongos -f /usr/local/mongodb/conf/mongos.conf
目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。
mongo --port 20000
#使用admin数据库
user admin
#串联路由服务器与分配副本集
sh.addShard("shard1/10.113.10.1:27001,10.113.10.4:27001,10.113.10.5:27001")
sh.addShard("shard2/10.113.10.2:27002,10.113.10.3:27002,10.113.10.4:27002")
sh.addShard("shard3/10.113.10.1:27003,10.113.10.2:27003,10.113.10.5:27003")
sh.addShard("shard4/10.113.10.4:27004,10.113.10.5:27004,10.113.10.3:27004")
#查看集群状态
sh.status()
希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。
#指定testdb分片生效
db.runCommand( { enablesharding :"testdb"});
#指定数据库里需要分片的集合和片键
db.runCommand( { shardcollection : "testdb.table1",key : {id: 1} } )
我们设置testdb的 table1 表需要分片,根据 id 进行分片
#插入测试数据
for (var i = 1; i <= 100000; i++) db.table1.save({id:i,"test1":"testval1"});
#查看分片情况如下,部分无关信息省掉了
db.table1.stats();
#指定testdb分片生效
db.runCommand( { enablesharding :"testdb2"});
#指定数据库里需要分片的集合和片键
db.runCommand( { shardcollection : "testdb2.table",key : {_id: "hashed"} } )
测试和上面相同
use testdb2
#插入测试数据
for (var i = 1; i <= 100000; i++) db.table.save({id:i,"test1":"testval1"});
#查看分片情况如下,部分无关信息省掉了
db.table.stats();
测试结果
mongos> db.table.stats();
{
"sharded" : true,
"capped" : false,
"ns" : "testdb2.table",
"count" : 100000,
"size" : 5400000,
"storageSize" : 1781760,
"totalIndexSize" : 3514368,
"indexSizes" : {
"_id_" : 1130496,
"_id_hashed" : 2383872
},
"avgObjSize" : 54,
"nindexes" : 2,
"nchunks" : 8,
"shards" : {
"shard1" : {
"ns" : "testdb2.table",
"size" : 1348866,
"count" : 24979,
"avgObjSize" : 54,
"storageSize" : 376832,
"capped" : false,
"wiredTiger" : {
"metadata" : {
"formatVersion" : 1
},
},
........
"shard2" : {
"ns" : "testdb2.table",
"size" : 1358640,
"count" : 25160,
"avgObjSize" : 54,
"storageSize" : 471040,
"capped" : false,
"wiredTiger" : {
"metadata" : {
"formatVersion" : 1
},
},
.....
"shard3" : {
"ns" : "testdb2.table",
"size" : 1350000,
"count" : 25000,
"avgObjSize" : 54,
"storageSize" : 466944,
"capped" : false,
"wiredTiger" : {
"metadata" : {
"formatVersion" : 1
},
},
......
"shard4" : {
"ns" : "testdb2.table",
"size" : 1342494,
"count" : 24861,
"avgObjSize" : 54,
"storageSize" : 466944,
"capped" : false,
"wiredTiger" : {
"metadata" : {
"formatVersion" : 1
},
.......
"ok" : 1
}
},
"ok" : 1
}
可以看出来,数据是分片计算的
mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos.
mongod -f /usr/local/mongodb/conf/config.conf
mongod -f /usr/local/mongodb/conf/shard1.conf
mongod -f /usr/local/mongodb/conf/shard2.conf
mongod -f /usr/local/mongodb/conf/shard3.conf
mongod -f /usr/local/mongodb/conf/shard4.conf
mongos -f /usr/local/mongodb/conf/mongos.conf
killall mongod
killall mongos
ERROR: child process failed, exited with error number 100
mongod.lock
> rs.initiate(config);
{
"ok" : 0,
"errmsg" : "replSetInitiate quorum check failed because not all proposed set members responded affirmatively: 10.113.10.1:27001 failed with Connection refused",
"code" : 74,
"codeName" : "NodeNotFound"
}
需要彻底关闭防火墙,然后重启
关闭firewall:
systemctl stop firewalld.service #停止firewall
systemctl disable firewalld.service #禁止firewall开机启动
firewall-cmd –state #查看默认防火墙状态(关闭后显示notrunning,开启后显示running)关闭iptables
暂时关闭iptables
/etc/init.d/iptables stop
永久关闭
chkconfig iptables off