- 复制集介绍
- 复制集群架构
- 投票选举机制
- 复制集群成员说明
- 优先级为0复制集成员
- 仲裁节点架构
- 复制集集群环境部署
- 环境说明
- 前期准备
- 环境配置
- 配置文件
- 启动MongoDB实例
- 配置复制集
- 复制集常用命令
- 修改优先级
- 复制测试
- 创建复制集中的账户
- 用户中权限的说明
- 为复制集集群添加权限认证
- 添加安全认证配置
- keyfile文件操作
- 认证验证
- 客户端验证
- 参考文献
复制集介绍
MongoDB中的复制集(也被称为副本)是一组维护相同数据集的mongod进程。副本集提供冗余性及和高可用,是所有生产部署的基础。
简单来说,复制集有多台MongoDB组成的一个集群,集群中有一个主节点(Primary)和N个副本节点(Secondary)等,它们有相同的数据库,假如主MongoDB服务器或者MongoDB实例Down机之后,其它的副本服务器可以继续提供服务,实现数据的高可用及可靠性。
复制集群架构
术语介绍:
术语 | 类型 | 描述 |
---|---|---|
Primary | 主节点 | 负责整个集群的读写操作,包含了所有改变操作的日志 |
Secondary | 备节点 | 同步主服务器所有的数据,负责集群的读取请求,主服务器宕机可以称为主节点 |
Arbiter | 仲裁者 | 在主节点宕机后只进行投票,不参与选举,不同步主节点数据 |
此架构由一个Primary节点和两个Secondary节点组成
1)Primary节点为主节点,所有的写操作或者更改操作都只能从Primary节点中操作(复制集内的所有成员都可以接收读操作,但是,默认情况下,应用程序将其读操作指向主成员),主节点上所有的更改及写操作都会记录到oplog日志中。
2)两台Secondary节点复制Primary节点的oplog日志,通过异步的方式去执行oplog日志中的记录来和Primary节点达到数据一致性。
3)oplog作用主要是记录主节点的写入操作,充当复制源。
4)如果Primary节点无故Down机之后,复制集集群会通过投票机制在两台Secondary中选举一台升级为Primary节点。
投票选举机制
MongoDB节点之间维护心跳检查,主节点选举由心跳触发。
心跳检查
MongoDB复制集成员会向自己之外的所有成员发送心跳并处理响应信息,因此每个节点都维护着该节点看到的其它所有节点的状态信息,节点根据自己的集群状态判断是否需要更新新的Primary。
在实现的时候主要由两个异步的过程分别处理心跳响应和超时,每个复制集成员都会在后台运行与复制集所有节点的心跳线程,在以下几种情况下会触发状态检测过程:
- Secondary节点权重(Priority)比Primary节点高时,发起替换选举;
- Secondary节点发现集群中没有Primary时,发起选举;
- Primary节点不能访问到大部分成员时主动降级,降级操作会断开连接,终止用户请求等;
- 复制集成员心跳检测结果发生变化,比如某个节点挂了或者新增节点,发起重新投票选举规则;
- 超过4s没有执行状态检测过程,发起替换选举;
选举发起
发起选举的节点首先需要做一些条件判断,维护主节点的有N个备用节点,备用节点中的所有节点都可能被选举成为主节点,成为主节点前每个备节点都会检测自身以及全局条件是否满足,检测条件如下:
- 是否看见复制集中是否有Majority在线
- 自身Priority是否大于0
- 自身不为arbiter
- 自身opTime不能落后于最新节点10s以上
- 自身存储的集群程序按信息为最新
如果所有条件满足,则将自身添加到主节点的备用列表中,否则,将自身从列表中移除
自身检测
- MongoDB选举需要获得大多数投票才能通过,如果没有节点投反对票,且获得成票数超过有权投票节点总数的1/2,则能成为Primary。否则进入下一轮选举。为避免陷入无限重复选举,MongoDB建议复制集的成员个数为奇数,当Secondary为双数时,可以增加一个Arbiter节点。
- 选举过程中,复制集没有主节点,所有成员都是只读状态
- 选举过程很复杂,一般情况下需要5s左右进行选主。
- 如果新选择的主节点立刻挂掉,至少需要30s时间重新选主。
大多数的定义
假设复制集内投票成员数量为N,则大多数 = N/2 + 1 ,当复制集内存活成员数量不足大多数时,整个复制集将无法选举出Primary,复制集将无法提供写服务,处于只读状态。
我们按照上面的架构来举例,三台MongoDB,一台Primary,两台Secondary,主节点挂了之后,只有两台Secondary可以投票,根据公式我们来算 “2/2 + 1 = 2”,也就是算大多数等于2,但是当复制集内存活的成员数量不足大多数时,我们的大多数为2,集群成员也为2,所以这两台集群成员会发起选举投票机制,如果两台Secondary节点自身条件都满足的情况下,则先发起选举节点的成员成为Primary节点
投票成员数 | 大多数 | 容忍失效数 |
---|---|---|
1 | 1 | 0 |
2 | 2 | 0 |
3 | 2 | 1 |
4 | 3 | 1 |
5 | 3 | 2 |
6 | 4 | 2 |
7 | 4 | 3 |
复制集群成员说明
Secondary
正常情况下,复制集的Seconary会参与Primary选举(自身也可能会被选为Primary),并从Primary同步最新写入的数据,以保证与Primary存储相同的数据。Secondary可以提供读服务,增加Secondary节点可以提供复制集的读服务能力,同时提升复制集的可用性。另外,Mongodb支持对复制集的Secondary节点进行灵活的配置,以适应多种场景的需求。
Arbiter
Arbiter节点只参与投票,不能被选为Primary,并且不从Primary同步数据。比如你部署了一个2个节点的复制集,1个Primary,1个Secondary,任意节点宕机,复制集将不能提供服务了(无法选出Primary),这时可以给复制集添加一个Arbiter节点,即使有节点宕机,仍能选出Primary。Arbiter本身不存储数据,是非常轻量级的服务,当复制集成员为偶数时,最好加入一个Arbiter节点,以提升复制集可用性。
Priority0
Priority0节点的选举优先级为0,不会被选举为Primary。比如你跨机房A、B部署了一个复制集,并且想指定Primary必须在A机房,这时可以将B机房的复制集成员Priority设置为0,这样Primary就一定会是A机房的成员。(注意:如果这样部署,最好将『大多数』节点部署在A机房,否则网络分区时可能无法选出Primary)
Vote0
Mongodb 3.0里,复制集成员最多50个,参与Primary选举投票的成员最多7个,其他成员(Vote0)的vote属性必须设置为0,即不参与投票。
Hidden
Hidden节点不能被选为主(Priority为0),并且对Driver不可见。因Hidden节点不会接受Driver的请求,可使用Hidden节点做一些数据备份、离线计算的任务,不会影响复制集的服务。
Delayed
Delayed节点必须是Hidden节点,并且其数据落后与Primary一段时间(可配置,比如1个小时)。因Delayed节点的数据比Primary落后一段时间,当错误或者无效的数据写入Primary时,可通过Delayed节点的数据来恢复到之前的时间点。
优先级为0复制集成员
此架构由一个Primary节点和两个Secondary节点组成
1)此架构由一台Primary主节点和两台Secondary备节点组成,其原理就是主从复制架构的原理,两台Secondary节点同样通过oplog日志来与Primary主节点达成数据一致
2)与其不同的是在Data Center2节点上的Secondary备用节点的实例优先级priority为0,则不参与选举,也不可能会成为Primary节点,将其优先级配置为0,主要是防止它成为主节点,这在多数据中心的部署特别有用。
3)优先级值范围为 0-100(0表示不参与选举),在复制集群中,优先级高的优先成为主节点,假如我们原来集群中有三台节点,主节点优先级为2,其它两台备节点优先级为1,当我们新加入到集群一台MongoDB实例,给它优先级设置为4,则该实例在加入集群后就会自动抢夺Primary到本机。
仲裁节点架构
一个主库:负责整个集群的所有写、更改操作
一个从库:通过oplog日志来与主节点数据达成一致
一个Airbiter节点,在选举中,只进行投票,不能成为主库,而且不复制Primary的任何数据,因此这个架构中只能提供一个完成的副本Secondary,Arbiter只需要很少的资源,代价是有限的冗余和容错,当Primary节点故障后,Aribiter将票数头给Secondary,使其成为Primary节点,如果Primary节点再次故障后,集群将不可用,Arbiter节点也未存储任何数据。
集群中还有其它的节点成员,但是我们用的比较少,所以此文章中没有提到。
可以自行查阅官方文档:https://docs.mongodb.com/manual/core/replica-set-members/
复制集集群环境部署
环境说明
本次使用一台设备多实例进行,如果你准备在多台设备上部署,你需要考虑的如下:
1)时钟是否一致
2)网络是否通畅
3)SElinux是否关闭或者策略放通
4)环境是否一致
[root@MongoDB ~]# lsb_release -a
LSB Version: :core-4.1-amd64:core-4.1-noarch:cxx-4.1-amd64:cxx-4.1-noarch:desktop-4.1-amd64:desktop-4.1-noarch:languages-4.1-amd64:languages-4.1-noarch:printing-4.1-amd64:printing-4.1-noarch
Distributor ID: CentOS
Description: CentOS Linux release 7.6.1810 (Core)
Release: 7.6.1810
Codename: Core
[root@MongoDB ~]# hostname -I
10.211.55.12 192.168.0.100 fdb2:2c26:f4e4:0:21c:42ff:fedf:4d85
前期准备
#创建用户组
useradd mongod
echo 'abcdef' | passwd --stdin mongod
#下载MongoDB
wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.2.0.tgz
#添加文件打开数和mongod用户进程连接数
cat >> /etc/security/limits.conf << EOF
* soft nofile 65536
* hard nofile 65536
mongod soft nproc 32768
mongod hard nproc 32768
EOF
#使下面两个文件修改为never
echo never > /sys/kernel/mm/transparent_hugepage/enabled
echo never > /sys/kernel/mm/transparent_hugepage/defrag
#开机自动修改
cat >> /etc/rc.local << EOF
if test -f /sys/kernel/mm/transparent_hugepage/enabled;then
echo never > /sys/kernel/mm/transparent_hugepage/enabled
fi
if test -f /sys/kernel/mm/transparent_hugepage/defrag;then
echo never > /sys/kernel/mm/transparent_hugepage/defrag
fi
EOF
此步骤完成后
#官方给出MongoDB需要以下两个库的依赖
yum install libcurl openssl -y
#解压并复制程序文件到bin目录
mkdir /usr/local/mongodb
tar xf mongodb-linux-x86_64-rhel70-4.2.0.tgz
cp -rf mongodb-linux-x86_64-rhel70-4.2.0/bin/ /usr/local/mongodb/
chown -Rf mongod.mongod /usr/local/moongodb/
#添加程序环境
cat >> /etc/profile << EOF
export MONGODB_HOME=/usr/local/mongodb
export PATH=\$MONGODB/bin:\$PATH
EOF
source /etc/profile
环境配置
1)接下来使用mongod用户来操作
su mongod
2)创建文件目录
#!/bin/bash
for i in 27017 27018 27019
do
mkdir -p /usr/local/mongodb/$i/{conf,data,logs,run}
done
配置文件
编辑一台配置文件,然后复制到其它实例,配置文件为yaml语法
关于以下配置文件详解,请参考:”https://abcops.cn/mongodb-conf/“
cat > mongod.conf << EOF
systemLog:
destination: file
path: /usr/local/mongodb/27017/logs/mongodb.log
logAppend: true
verbosity: 0
logRotate: rename
storage:
journal:
enabled: true
dbPath: /usr/local/mongodb/27017/data
directoryPerDB: true
engine: wiredTiger
wiredTiger:
engineConfig:
cacheSizeGB: 1
directoryForIndexes: true
journalCompressor: zlib
collectionConfig:
blockCompressor: zlib
indexConfig:
prefixCompression: true
processManagement:
fork: true
pidFilePath: /usr/local/mongodb/27017/run/mongod.pid
net:
port: 27017
bindIp: 10.211.55.12
maxIncomingConnections: 65536
wireObjectCheck: true
ipv6: false
replication:
oplogSizeMB: 4096
replSetName: abcops_repl
setParameter:
connPoolMaxShardedConnsPerHost: 200
connPoolMaxConnsPerHost: 200
EOF
复制配置文件到目录中,并修改其端口及目录位置
#!/bin/bash
for i in 27017 27018 27019
do
\cp /home/mongod/mongod.conf /usr/local/mongodb/$i/conf
sed -i "s/27017/$i/g" /usr/local/mongodb/$i/conf/mongod.conf
done
启动MongoDB实例
启动脚本如下
#!/bin/bash
for i in 27017 27018 27019
do
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/$i/conf/mongod.conf
done
关闭脚本如下
#!/bin/bash
for i in 27017 27018 27019
do
/usr/local/mongodb/bin/mongod --shutdown -f /usr/local/mongodb/$i/conf/mongod.conf
done
三个实例启动后,不代表复制集已经搭建成功了,还需要进行复制集初始化
配置复制集
连接任何一个实例都可以进行配置
这是我连接27017的实例
/usr/local/mongodb/bin/mongo --host 10.211.55.12 --port 27017
> use admin
> config={
_id:'abcops_repl',
members:[
{_id: 0, host: '10.211.55.12:27017',priority:2},
{_id: 1, host: '10.211.55.12:27018',priority:1},
{_id: 2, host: '10.211.55.12:27019',arbiterOnly:true},
]
}
> rs.initiate(config)
#以上参数解析
use admin:进入admin数据库
config:配置复制集
_id:'abcops_repl':指定复制集组名称,与配置文件中的 replSetName 参数需要保持一致
members:规定的函数,不能更改
_id:设置组成员的ID编号,可以自定义,我这里为 0、1、2
host:指定加入复制集成员的IP地址及端口,我们在配置文件中指定了bindIp为10.211.55.12,这里就不能写127.0.0.1,必须写为bind_Ip指定的地址
priority:指定优先级0-100,优先级最高的成为Primary节点,优先级为可选选项,如果不指定默认都为1
arbiterOnly:是否开启仲裁节点true/false
rs.initiate(config):初始化复制集配置
以上参数图示如下,给你提供下参照

图中开始为SECONDARY
,代表复制集集群正在进行选举Primary节点,大概5s左右,根据选举机制选举成功后,成为主节点的SECONDARY状态变为PRIMARY
复制集常用命令
1)查看谁是主节点
abcops_repl:PRIMARY> db.isMaster()
2)查看当前复制集集群中成员的配置
abcops_repl:PRIMARY> rs.conf()
3)查看复制集集群成员状态
abcops_repl:PRIMARY> rs.status()
4)新增节点到复制集
新增节点之前,该实例的配置中的replSetName
复制集名称,必须和集群一致
abcops_repl:PRIMARY> rs.add("10.211.55.12:27020")
5)新增仲裁节点
abcops_repl:PRIMARY> rs.addArb("10.211.55.12:27020")
6)从复制集内删除节点
abcops_repl:PRIMARY> rs.remove("10.211.55.12:27020")
7)检查oplog日志时间和大小
abcops_repl:PRIMARY> rs.printReplicationInfo()
configured oplog size: 4096MB
log length start to end: 2422secs (0.67hrs)
oplog first event time: Wed Sep 11 2019 12:22:13 GMT+0800 (CST)
oplog last event time: Wed Sep 11 2019 13:02:35 GMT+0800 (CST)
now: Wed Sep 11 2019 13:02:37 GMT+0800 (CST)
8)降级服务器
此操作只能在PRIMARY上操作
通过执行rs.stepDown命令将当前主服务器主动降级为备用节点,120单位为s,为120秒内这个实力不能把自己选为PRIMARY角色,120秒后由于它本身的优先级较高,所以会重新抢占PRIMARY节点。
abcops_repl:PRIMARY> rs.stepDown(120)
9)允许在Secondary节点可以进行查询
在副本节点上操作
rs.slaveOk()
10)查看当前连接
db.getMongo()
修改优先级
修改27018的优先级为3,使其优先级超过27017实例,夺得PRIMARY角色,此操作需在PRIMARY上执行
abcops_repl:PRIMARY> config=rs.conf()
abcops_repl:PRIMARY> config.members[1].priority=3
3
abcops_repl:PRIMARY> rs.reconfig(config)
{
"ok" : 1,
"$clusterTime" : {
"clusterTime" : Timestamp(1568179129, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
},
"operationTime" : Timestamp(1568179129, 1)
}
abcops_repl:PRIMARY> rs.conf()
abcops_repl:SECONDARY> db.isMaster()
#以上参数解析
config=rs.conf():将现有的配置读取到变量中进行存储
config.members[1].priority=3:修改变量中的值,1是指执行rs.conf()中看到节点的顺序,不是ID号哦,rs.conf()看到的顺序是从0开始排序,三个副本集排序就是0-3
rs.reconfig(config):将修改后的数据同步到配置,使修改生效
rs.conf():查看当前配置,可以看到优先级哦
db.isMaster():查看谁是Primary节点
复制测试
1)插入数据
#连接当前Primary节点
/usr/local/mongodb/bin/mongo --host 10.211.55.12 --port 27018
#进入abcops数据库,在documents文档中插入以下JSON格式的数据
abcops_repl:PRIMARY> use abcops
abcops_repl:PRIMARY> db.documents.insert(
{name: "xuweiliang",
age: 25,
Job: "DevOps"}
)
#查看documents文档中的数据
abcops_repl:PRIMARY> db.documents.find()
{ "_id" : ObjectId("5d78863768fbf9eac4704232"), "name" : "xuweiliang", "age" : 25, "Job" : "DevOps" }
#查看复制节点状态
abcops_repl:PRIMARY> rs.printSlaveReplicationInfo()
source: 10.211.55.12:27017
syncedTo: Wed Sep 11 2019 13:30:42 GMT+0800 (CST)
0 secs (0 hrs) behind the primary
2)登录Secondary节点查看
/usr/local/mongodb/bin/mongo --host 10.211.55.12 --port 27017
abcops_repl:SECONDARY> rs.slaveOk() #运行副本节点可进行查询
abcops_repl:SECONDARY> show dbs #查看当前节点的数据库
abcops 0.000GB
admin 0.000GB
config 0.000GB
local 0.000GB
abcops_repl:SECONDARY> use abcops #abcops数据库已经从主节点同步至此
switched to db abcops
abcops_repl:SECONDARY> db.getCollectionNames() #以下连续三个命令都是查看进入到abcops库中的文档命令
[ "documents" ]
abcops_repl:SECONDARY> show collections
documents
abcops_repl:SECONDARY> show tables
documents
abcops_repl:SECONDARY> db.documents.find() #查看文档中的内容
{ "_id" : ObjectId("5d78863768fbf9eac4704232"), "name" : "xuweiliang", "age" : 25, "Job" : "DevOps" }
创建复制集中的账户
1)连接到主节点,创建用户
以下创建的用户及权限和角色请参考下面用户权限说明
/usr/local/mongodb/bin/mongo --host 10.211.55.12 --port 27018
abcops_repl:PRIMARY> use admin
abcops_repl:PRIMARY> db.createUser( {
user:'abcops',
pwd:'123456',
roles:[ { role: "root", db: "admin" } ]
}
)
Successfully added user: {
"user" : "abcops",
"roles" : [
{
"role" : "root",
"db" : "admin"
}
]
}
#查看所有创建的用户信息
abcops_repl:PRIMARY> show users
用户中权限的说明
权限 | 说明 |
---|---|
Read | 允许用户读取指定数据库 |
readWrite | 允许用户读写指定数据库 |
dbAdmin | 允许用户在指定数据库中指定管理函数,如(索引创建、删除、查看统计访问system.profile) |
userAdmin | 允许用户向system.users集合写入,可以找指定数据里面创建、删除和管理用户 |
clusterAdmin | 只在admin数据库中可用,赋予用户所有分片和复制集相关函数的管理权限 |
readAnyDatabase | 只在admin数据库中可用,赋予用户所有数据库的读权限 |
readWriteAnyDatabase | 只在admin数据库中可用,赋予用户所有数据库的读写权限 |
userWriteAnyDatabase | 只在admin数据库中可用,赋予用户所有数据库的userAdmin权限 |
dbAdminAnyDatabase | 只在admin数据库中可用,赋予用户所有数据库的dbAdmin权限 |
root | 只在admin数据库中可用,超级管理员 |
为复制集集群添加权限认证
复制集我们这里采用keyfile文件实现权限认证,并且副本集中的所有成员使用的keyfile必须一样
添加安全认证配置
三台实例必须都要配置
cat >> /usr/local/mongodb/27017/conf/mongod.conf << EOF
security:
authorization: enabled
clusterAuthMode: keyFile
keyFile: /usr/local/mongodb/27017/conf/keyfile
javascriptEnabled: true
EOF
cat >> /usr/local/mongodb/27018/conf/mongod.conf << EOF
security:
authorization: enabled
clusterAuthMode: keyFile
keyFile: /usr/local/mongodb/27018/conf/keyfile
javascriptEnabled: true
EOF
cat >> /usr/local/mongodb/27019/conf/mongod.conf << EOF
security:
authorization: enabled
clusterAuthMode: keyFile
keyFile: /usr/local/mongodb/27019/conf/keyfile
javascriptEnabled: true
EOF
keyfile文件操作
1)生产keyfile文件
openssl rand -base64 90 > ./keyfile
2)复制keyfile文件到其它实例中
#!/bin/bash
for i in 27017 27018 27019
do
\cp /home/mongod/keyfile /usr/local/mongodb/$i/conf/
done
3)修改keyfile权限
keyfile文件权限必须为 X00 ,不能给 group 和 other 成员分配任何权限,否则实例无法启动
#!/bin/bash
for i in 27017 27018 27019
do
chmod 400 /usr/local/mongodb/$i/conf/keyfile
done
4)重启所有实例
#!/bin/bash
for i in 27017 27018 27019
do
/usr/local/mongodb/bin/mongod --shutdown -f /usr/local/mongodb/$i/conf/mongod.conf
sleep 3s
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/$i/conf/mongod.conf
done
认证验证
登录验证可以在连接的时候指定用户名和密码,也可以先连接到数据库后再进行认证
1)登录指定用户密码
/usr/local/mongodb/bin/mongo --host 10.211.55.12 --port 27018 --username abcops -p 123456
abcops_repl:PRIMARY> show dbs
abcops 0.000GB
admin 0.000GB
config 0.000GB
local 0.000GB
2)先登录,后验证
abcops_repl:PRIMARY> use admin #必须要先切换到admin库中才可以进行进行验证
switched to db admin
abcops_repl:PRIMARY> db.auth( 'abcops','123456' ) #认证用户名及密码,认证成功返回1,否则返回0
1
abcops_repl:PRIMARY> show dbs
abcops 0.000GB
admin 0.000GB
config 0.000GB
local 0.000GB
abcops_repl:PRIMARY> db
admin
3)在备库进行验证
备库只能进行查询,勿要在备库上进行任何操作
/usr/local/mongodb/bin/mongo --host 10.211.55.12 --port 27017
abcops_repl:SECONDARY> rs.slaveOk()
abcops_repl:SECONDARY> use admin
switched to db admin
abcops_repl:SECONDARY> db.auth('abcops','123456')
1
客户端验证
参考文献
感谢各位:
https://docs.mongodb.com/manual/core/replica-set-members/
http://docs.mongodb.org/manual/tutorial/force-member-to-be-primary/
https://www.mongodb.org.cn/manual/replication/
https://blog.csdn.net/wentyoon/article/details/78986174
https://www.jianshu.com/p/55e2dafaccd0