MongoDB副本集(Replica Set)是一组维护相同数据集的 MongoDB 实例,它可以提供数据的冗余和高可用性。
副本集由一个主节点(Primary)和多个从节点(Secondary)组成。
副本集可以有一个或多个仲裁节点(Arbiter)。
类似于有自动故障恢复功能的主从集群。用多台机器进行同一数据的异步和同步,从而使得多台机器拥有同一数据的多个副本。并且当主库宕机时不需要用户干预的情况下自动切换其他备份服务器做主库。还可以利用副本服务器做只读服务器,实现读写分离,提高负载。通常在生产环境中使用3或5节点副本集,且部署主从节点到不同机器上,可以提供更高的数据冗余和可用性。
副本集使用(主-从-仲裁)节点的架构:
主从复制和副本集区别:
主从集群和副本集最大区别就是副本集没有固定的“主节点”;整个集群会选出一个“主节点”,当其挂掉后,又在剩下的从节点中选中其他节点为“主节点”,副本集总有一个活跃点 {主、primary} 和一个或多个备份节点 {从、secondary}。
MongoDB在副本集中,会自动进行主节点的选举,主节点选举的触发条件:
一旦触发选举,就要根据一定的规则来选主节点。
选举规则是根据票数来决定谁获胜:
“大多数”的定义为:假设副本集内投票成员数量为N,则大多数为 N/2+1。例如:3个投票成员,则大多数的值是2。当副本集内存活的数量不足大多数时,整个副本集将无法选举出Primary,副本集将无法提供写服务,处于只读状态。
数据的新旧是通过操作日志oplog来对比的。
目标:搭建一主一副本一仲裁:
mkdir -p ~/mongodb/replicaset/rs_27017/log ~/mongodb/replicaset/rs_27017/data/db
vim ~/mongodb/replicaset/rs_27017/mongod.conf
mongod.conf:
cd && pwd
查看家目录路径。# Where and how to store data.
storage:
dbPath: /home/cauchy/mongodb/replicaset/rs_27017/data/db
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/replicaset/rs_27017/log/mongod.log
# network interfaces
net:
port: 27017
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/replicaset/rs_27017/log/mongod.pid
replication:
replSetName: rs
#sharding:
# security:
# authorization: enabled
sudo mongod -f ~/mongodb/replicaset/rs_27017/mongod.conf
mkdir -p ~/mongodb/replicaset/rs_27018/log ~/mongodb/replicaset/rs_27018/data/db
vim ~/mongodb/replicaset/rs_27018/mongod.conf
mongod.conf:
# Where and how to store data.
storage:
dbPath: /home/cauchy/mongodb/replicaset/rs_27018/data/db
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/replicaset/rs_27018/log/mongod.log
# network interfaces
net:
port: 27018
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/replicaset/rs_27018/log/mongod.pid
replication:
replSetName: rs
#sharding:
# security:
# authorization: enabled
sudo mongod -f ~/mongodb/replicaset/rs_27018/mongod.conf
mkdir -p ~/mongodb/replicaset/rs_27019/log ~/mongodb/replicaset/rs_27019/data/db
vim ~/mongodb/replicaset/rs_27019/mongod.conf
mongod.conf:
# Where and how to store data.
storage:
dbPath: /home/cauchy/mongodb/replicaset/rs_27019/data/db
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/replicaset/rs_27019/log/mongod.log
# network interfaces
net:
port: 27019
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/replicaset/rs_27019/log/mongod.pid
replication:
replSetName: rs
#sharding:
# security:
# authorization: enabled
sudo mongod -f ~/mongodb/replicaset/rs_27019/mongod.conf
mongosh --port=27017
rs.initiate() # 使用默认配置初始化
使用 rs.conf()
、rs.status()
查看相应的信息
可以看到目前副本集中只有一个成员(members),主机(ac34057c51af:27017),仲裁节点(arbiterOnly:false),优先级权值(priority:1),并且当前(27017)节点初始化后变为主节点(primary)。
在主节点中添加从节点,将其他成员加入到副本集中
语法:
rs.add(host, arbiterOnly)
Parameter | Type | Description |
---|---|---|
host | string or document | 要添加到副本集的新成员。指定为字符串或配置文档:1)如果是一个字符串,则需要指定新成员的主机名和可选的端口号;2)如果是一个文档,请指定在members数组中找到的副本集成员配置文档。您必须在成员配置文档中指定主机字段。有关文档配置字段的说明,详见下方文档:“主机成员的配置文档” |
arbiterOnly | boolean | 可选的。仅在值为字符串时适用。如果为true,则添加的主机是仲裁者。 |
主机成员的配置文档:(可通过 rs.conf()
查看)
{
_id:<int>,
host:<string>,
arbiterOnly:<boolean>,
buildIndexes:<boolean>,
hidden:<boolean>,
priority:<number>,
tags:<document>,
slaveDelay:<int>,
votes:<number>
}
主机名直接用主机成员的配置文档中的即可
rs.add("ac34057c51af:27018", false)
rs.add(host,arbiterOnly) 或者 rs.addArb(host)
如下添加仲裁节点 rs.addArb("ac34057c51af:27019")
:
【错误信息】:【Reconfig attempted to install a config that would change the implicit default write concern. Use the setDefaultRWConcern command to set a cluster-wide write concern and try the reconfig again.】
【解决】:设置全局默认写入关注点,详细的 Write Concern 和 Read Concern 可参考官网文档。
以下操作将全局写入关注设置为:
w: 2
db.adminCommand({
"setDefaultRWConcern" : 1,
"defaultWriteConcern" : {
"w" : 2
}
})
设置完成后,再次执行:
rs.addArb("ac34057c51af:27019")
从副本集中删除节点
rs.remove(host)
use test
db.comment.insert({userid: "001", username: "cauchy", content: "专家有言:早上空腹不能吃饭", timestamp: new Date()})
成功读写操作:
mongosh --port=27018
db.getMongo().setReadPref("primaryPreferred")
执行成功,从节点只读不可写:
Read Preference:Read Preference — MongoDB Manual
readPreference 主要控制客户端 driver 从副本集(Replica Set)读数据的时候如何路由,如下图,这个特性可以方便的配置读写分离、就近去读等策略。
读策略各模式:
primary:只从 primary 节点读数据(默认模式)
primaryPreferred:先主后从。优先从 primary 读取,primary 不可用时从 secondary 读
secondary:只从副本集中 secondary 节点读数据
secondaryPreferred:先从后主。优先从 secondary 读取,如果 secondary 不可用时就从 primary 读
nearest:就近。根据网络距离,就近读取,根据客户端与服务端的 PingTime 实现
可以通过 rs.help()
返回副本集功能的基本帮助文档
分片是一种跨多台机器分布数据的方法,MongoDB使用分片来支持具有非常大的数据集和高吞吐量操作的部署。
换句话说:分片就是将数据拆分,将其分散到不同的机器上的过程。
分片包含的组件
mkdir -p ~/mongodb/sharded_cluster/shardrs_01_27018/data/db ~/mongodb/sharded_cluster/shardrs_01_27018/log
mkdir -p ~/mongodb/sharded_cluster/shardrs_01_27118/data/db ~/mongodb/sharded_cluster/shardrs_01_27118/log
mkdir -p ~/mongodb/sharded_cluster/shardrs_01_27218/data/db ~/mongodb/sharded_cluster/shardrs_01_27218/log
vim ~/mongodb/sharded_cluster/shardrs_01_27018/mongod.conf
vim ~/mongodb/sharded_cluster/shardrs_01_27118/mongod.conf
vim ~/mongodb/sharded_cluster/shardrs_01_27218/mongod.conf
shardrs_01_27018/mongod.conf
# mongod.conf
# for documentation of all options, see:
# http://docs.mongodb.org/manual/reference/configuration-options/
# Where and how to store data.
storage:
dbPath: /home/cauchy/mongodb/sharded_cluster/shardrs_01_27018/data/db
# engine:
# wiredTiger:
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/sharded_cluster/shardrs_01_27018/log/mongod.log
# network interfaces
net:
port: 27018
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/sharded_cluster/shardrs_01_27018/log/mongod.pid
# security:
# authorization: enabled
#operationProfiling:
replication:
replSetName: shardrs_01
sharding:
clusterRole: shardsvr
#sharding:
## Enterprise-Only Options:
#auditLog:
shardrs_01_27118/mongod.conf
shardrs_01_27218/mongod.conf
同理修改即可。
mkdir -p ~/mongodb/sharded_cluster/shardrs_02_27318/data/db ~/mongodb/sharded_cluster/shardrs_02_27318/log
mkdir -p ~/mongodb/sharded_cluster/shardrs_02_27418/data/db ~/mongodb/sharded_cluster/shardrs_02_27418/log
mkdir -p ~/mongodb/sharded_cluster/shardrs_02_27518/data/db ~/mongodb/sharded_cluster/shardrs_02_27518/log
vim ~/mongodb/sharded_cluster/shardrs_02_27318/mongod.conf
vim ~/mongodb/sharded_cluster/shardrs_02_27418/mongod.conf
vim ~/mongodb/sharded_cluster/shardrs_02_27518/mongod.conf
shardrs_02_27318/mongod.conf
# mongod.conf
# for documentation of all options, see:
# http://docs.mongodb.org/manual/reference/configuration-options/
# Where and how to store data.
storage:
dbPath: /home/cauchy/mongodb/sharded_cluster/shardrs_02_27318/data/db
# engine:
# wiredTiger:
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/sharded_cluster/shardrs_02_27318/log/mongod.log
# network interfaces
net:
port: 27318
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/sharded_cluster/shardrs_02_27318/log/mongod.pid
# security:
# authorization: enabled
#operationProfiling:
replication:
replSetName: shardrs_02
sharding:
clusterRole: shardsvr
#sharding:
## Enterprise-Only Options:
#auditLog:
shardrs_02_27418/mongod.conf
shardrs_02_27518/mongod.conf
同理修改即可。
mkdir -p ~/mongodb/sharded_cluster/configrs_27019/data/db ~/mongodb/sharded_cluster/configrs_27019/log
mkdir -p ~/mongodb/sharded_cluster/configrs_27119/data/db ~/mongodb/sharded_cluster/configrs_27119/log
mkdir -p ~/mongodb/sharded_cluster/configrs_27219/data/db ~/mongodb/sharded_cluster/configrs_27219/log
configrs_27019/mongod.conf
# mongod.conf
# for documentation of all options, see:
# http://docs.mongodb.org/manual/reference/configuration-options/
# Where and how to store data.
storage:
dbPath: /home/cauchy/mongodb/sharded_cluster/configrs_27019/data/db
# engine:
# wiredTiger:
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/sharded_cluster/configrs_27019/log/mongod.log
# network interfaces
net:
port: 27019
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/sharded_cluster/configrs_27019/log/mongod.pid
# security:
# authorization: enabled
#operationProfiling:
replication:
replSetName: configrs
sharding:
clusterRole: configsvr
## Enterprise-Only Options:
#auditLog:
configrs_27119/mongod.conf
configrs_27219/mongod.conf
同理修改即可。
两个副本集的初始化,和上文副本集中,连接节点处讲解一致
配置集没有仲裁节点,将两个节点以从节点的方式加入即可
mongos服务,不是mongod服务
mkdir -p ~/mongodb/sharded_cluster/mongos_27017/log
mkdir -p ~/mongodb/sharded_cluster/mongos_27117/log
vim ~/mongodb/sharded_cluster/mongos_27017/mongos.conf
vim ~/mongodb/sharded_cluster/mongos_27117/mongos.conf
mongos_27017/mongos.conf
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/sharded_cluster/mongos_27017/log/mongod.log
# network interfaces
net:
port: 27017
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/sharded_cluster/mongos_27017/log/mongod.pid
# security:
# authorization: enabled
#operationProfiling:
# replication:
sharding:
configDB: configrs/ac34057c51af:27019,ac34057c51af:27119,ac34057c51af:27219
#sharding:
## Enterprise-Only Options:
#auditLog:
mongos_27117/mongos.conf
# where to write logging data.
systemLog:
destination: file
logAppend: true
path: /home/cauchy/mongodb/sharded_cluster/mongos_27117/log/mongod.log
# network interfaces
net:
port: 27117
bindIp: 0.0.0.0
# how the process runs
processManagement:
fork: true
timeZoneInfo: /usr/share/zoneinfo
pidFilePath: /home/cauchy/mongodb/sharded_cluster/mongos_27117/log/mongod.pid
# security:
# authorization: enabled
#operationProfiling:
# replication:
sharding:
configDB: configrs/ac34057c51af:27019,ac34057c51af:27119,ac34057c51af:27219
#sharding:
## Enterprise-Only Options:
#auditLog:
sudo mongos -f ~/mongodb/sharded_cluster/mongos_27017/mongos.conf
sudo mongos -f ~/mongodb/sharded_cluster/mongos_27117/mongos.conf
此时路由还不能找到分片,要添加分片到路由中。
语法:
sh.addShard("IP:Port")
sh.enableSharding("库名")
需要先对对库开启分片功能
对集合分片,必须使用 sh.shardCollection()
方法指定集合和分片键
片键(Shard Key)是每条记录都必须包含的,且建立了索引的单个字段或复合字段,MongoDB 按照片键将数据划分到不同的数据块中,并将数据块均衡地分布到所有分片中。
语法:
sh.shardCollection(namespace,key,unique)
Parameter | Type | Description |
---|---|---|
namespace | string | 要(分片)共享对目标集合对命名空间,格式: |
key | document | 用作分片键的索引规范文档。shard键决定MongoDB如何在shard之间分发文档。除非集合为空,否则索引必须在shard collection命令之前存在。如果集合为空,则MongoDB在对集合进行分片之前创建索引,前提是支持分片键的索引不存在。简单来说:由包含字段和该字段的索引遍历方向的文档组成。 |
unique | boolean | 当值为true,片键字段上会限制为确保是唯一索引,哈希策略片键不支持唯一索引,默认为false |
测试 test_db 库的 comment 集合,以 username
为键,以哈希策略来分片:
sh.shardCollection("test_db.comment", {"username": "hashed"})
对于基于哈希的分片,MongoDB 计算一个学段的哈希值,并用这个哈希值来创建数据块。
在使用基于哈希分片的系统中,拥有"相近"片键的文档很可能不会存储在同一个数据块中,因此数据的分离性更好一些
测试哈希策略:
for(var i=0;i<1000;i++){db.comment.insert({userid: i, username: "cauchy"+i})}
在分片1中查看:
mongosh --port=27018
use test_db
db.comment.countDocuments()
在分片2中查看:
对于基于范围的分片,MongoDB按照片键的范围把数据分成不同部分。假设有一个数字的片键想象一个从负无穷到正无穷的直线,每一个片键的值都在直线上画了一个点。MongoDB 把这条直线划分为更短的不重叠的片段,并称之为数据块,每个数据块包含了片键在一定范围内的数据。
在使用片键做范围划分的系统中,拥有相近"片键的文档很可能存储诸在同一个数据块中,因此也会存储在同一个分片中。
sh.shardCollection("test_db.author", {"age": 1})
use config
db.databases.remove({"_id": "test_db"})
db.shards.remove({_id: "shardrs_01"})
db.shards.remove({_id: "shardrs_02"})
第二个路由节点直接同第一个创建即可,开启后不需要分配,由配置服务自动同步
参考上篇博客
可以使用任何方法生成密钥文件。例如,以下操作使用 openssl 生成密码文件,然后使用 chmod 来更改文件权限
仅为文件所有者提供读取权限:
openssl rand -base64 128 > ./mongo.keyfile
chmod 400 ./mongo.keyfile
所有副本集节点都必须要用同一份keyfile,一般是在一台机器上生成,然后拷贝到其他机器上,且必须有读的权
限。
一定要保证密钥文件一致,文件位置随便。但是为了方便查找,建议每台机器都防放到一个固定的位置,都防放到和配
置文件一起的目录中。
cp mongo.keyfile ~/mongodb/replicaset/rs_27017
cp mongo.keyfile ~/mongodb/replicaset/rs_27018
cp mongo.keyfile ~/mongodb/replicaset/rs_27019
...
security:
keyFile: /home/cauchy/mongodb/replicaset/rs_27017/mongo.keyfile
authorization: enabled
...
...
security:
keyFile: /home/cauchy/mongodb/replicaset/rs_27018/mongo.keyfile
authorization: enabled
...
...
security:
keyFile: /home/cauchy/mongodb/replicaset/rs_27019/mongo.keyfile
authorization: enabled
...
每个节点上都要添加 keyfile,其他步骤同副本集一样。
参考:https://www.bilibili.com/video/BV1bJ411x7mq