在搭建分片之前,先了解下分片中各个角色的作用:
① 配置服务器。是一个独立的mongod进程,保存集群和分片的元数据,即各分片包含了哪些数据的信息。最先开始建立,启用日志功能。像启动普通的mongod一样启动配置服务器,指定configsvr选项。不需要太多的空间和资源,配置服务器的1KB空间相当于真是数据的200MB。保存的只是数据的分布表。当服务不可用,则变成只读,无法分块、迁移数据。
② 路由服务器。即mongos,起到一个路由的功能,供程序连接。本身不保存数据,在启动时从配置服务器加载集群信息,开启mongos进程需要知道配置服务器的地址,指定configdb选项。
③ 分片服务器。是一个独立普通的mongod进程,保存数据信息。可以是一个副本集也可以是单独的一台服务器。
七台服务器,首先确定各个组件的数量。数据分片shard 5个,mongos 2个, config server 3个,分片用五台服务器单独部署,mongos 和 config server 部署在两台服务器。且每个shard部署一个副本集(一主二从),config server部署副本集(一主二从),
MongoDB版本选择:
服务器信息:
看一下物理部署图:
注:
这里的A、B、C、D、E对应ip为145、146、147、148、149的服务器
主机F【143】:部署一个mongos、一个config server
主机G【144】:部署一个mongos、两个config server
一、源码安装MongoDB
cd /usr/local
wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-3.2.8.tgz
tar –zxvf mongodb-linux-x86_64-rhel70-3.2.8.tgz
mv mongodb-linux-x86_64-rhel70-3.2.8 mongodb
#由于安装mongodb不需要编译,所以解压完之后编写启动文件即可启动mongodb服务。将启动参数写入启动文件会是一个很好的选择
二、创建相应目录
主机A(127.0.0.145)
#建立shard1数据文件存放目录
mkdir -p /data/shard1/data
#建立shard1日志文件存放目录
mkdir -p /data/shard1/log
#建立shard2数据文件存放目录
mkdir -p /data/shard2/data
#建立shard2日志文件存放目录
mkdir -p /data/shard2/log
#建立shard3数据文件存放目录
mkdir -p /data/shard3/data
#建立shard3日志文件存放目录
mkdir -p /data/shard3/log
主机B、C、D、E创建方法一样,只需需改数字即可
A:shard1、shard2、shard3
B:shard2、shard3、shard4
C:shard3、shard4、shard5
D:shard4、shard5、shard1
E:shard5、shard1、shard2
三、配置启动文件
A主机为例:
1、在目录下 /usr/local/mongodb/shard_conf/ 新建三个文件shard1.conf、shard2.conf、shard3.conf
2、编写配置信息
shard1.conf(#配置参数详细信息请参考这里)
shardsvr = true
port = 22001
dbpath = /data/shard1/data/
logpath = /data/shard1/log/shard1.log
logappend = true
fork = true
oplogSize = 10240
replSet = shard1
pidfilepath = /data/shard1/shard1.pid
directoryperdb = true
shard2.conf
shardsvr = true
port = 22002
dbpath = /data/shard2/data/
logpath = /data/shard2/log/shard2.log
logappend = true
fork = true
oplogSize = 10240
replSet = shard2
pidfilepath = /data/shard2/shard2.pid
directoryperdb = true
shard3.conf
shardsvr = true
port = 22003
dbpath = /data/shard3/data/
logpath = /data/shard3/log/shard3.log
logappend = true
fork = true
oplogSize = 10240
replSet = shard3
pidfilepath = /data/shard3/shard3.pid
directoryperdb = true
主机B、C、D、E创建方法一样,特别注意port、dbpath、logpath、replSet、pidfilepath的值,要不然你会遇到各种问题。
A安装shard1的主,shard2的从,shard3的从
B安装shard2的主,shard3的从,shard4的从
C安装shard3的主,shard4的从,shard5的从
D安装shard4的主,shard5的从,shard1的从
E安装shard5的主,shard1的从,shard2的从
主机F【一个mongos 和 一个config server】
文件位置:/usr/local/mongodb/mongos/mongos.conf
文件内容:
configdb = zero/127.0.0.143:21000,127.0.0.144:21000,127.0.0.144:21001
port = 20000
logpath = /data/mongos/log/mongos.log
fork = true
logappend = true
pidfilepath = /data/mongos/mongos.pid
文件位置:/usr/local/mongodb/config_server/config_server.conf
文件内容:
dbpath = /data/config_server/data
logpath = /data/config_server/log/config.log
port = 21000
logappend = true
configsvr = true
replSet = zero
fork = true
pidfilepath = /data/config_server/config_server.pid
主机G【一个mongos 和 两个config server】
文件位置:/usr/local/mongodb/mongos/mongos.conf
文件内容:
configdb = zero/127.0.0.143:21000,127.0.0.144:21000,127.0.0.144:21001
port = 20000
logpath = /data/mongos/log/mongos.log
fork = true
logappend = true
pidfilepath = /data/mongos/mongos.pid
文件位置:/usr/local/mongodb/config_server/config_server_21000.conf
文件内容:
dbpath = /data/config_server_21000/data
logpath = /data/config_server_21000/log/config.log
port = 21000
logappend = true
configsvr = true
replSet = zero
fork = true
pidfilepath = /data/config_server_21000/config_server.pid
文件位置:/usr/local/mongodb/config_server/config_server_21001.conf
文件内容:
dbpath = /data/config_server_21001/data
logpath = /data/config_server_21001/log/config.log
port = 21001
logappend = true
configsvr = true
replSet = zero
fork = true
pidfilepath = /data/config_server_21001/config_server.pid
四、按顺序开启服务
1、开启shard服务
A主机为例,B、C、D、E类似:
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/shard_conf/shard1.conf
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/shard_conf/shard2.conf
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/shard_conf/shard3.conf
2、开启config server服务
F主机
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/config_server/config_server.conf
G主机
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/config_server/config_server_21000.conf
/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/config_server/config_server_21001.conf
五、给shard和config server设置副本集
A主机为例(B、C、D、E、F类似注意members中ip地址不要搞错):
终端登录A主机
/usr/local/mongodb/bin/mongo 127.0.0.145:22001
#使用admin数据库
use admin
#定义副本集配置
config = { _id:"shard1", members:[
{_id:0,host:"127.0.0.145:22001",priority:10},
{_id:1,host:"127.0.0.149:22001",priority:5},
{_id:2,host:"127.0.0.148:22001",priority:1}
]
}
#初始化副本集配置
rs.initiate(config)
六、开启mongos服务
F主机
/usr/local/mongodb/bin/mongos -f /usr/local/mongodb/mongos/mongos.conf
G主机
/usr/local/mongodb/bin/mongos -f /usr/local/mongodb/mongos/mongos.conf
***********************************************************************************************************
目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,
不过应用程序连接到mongos路由服务器并不能使用分片机制,
还需要在程序里设置分片配置,让分片生效。
***********************************************************************************************************
七、让分片生效
登录mongos服务,F节点操作
#连接到mongos
/usr/local/mongodb/bin/mongo 127.0.0.143:20000
#使用admin数据库
useadmin
#串联路由服务器与分配副本集1
db.runCommand(
{
addshard:
"shard1/127.0.0.145:22001,127.0.0.149:22001,127.0.0.148:22001"
}
返回:{ "shardAdded": "shard1", "ok" : 1 },说明shard1生效
同理串联路由服务器与分配副本集2,3,4,5一样,注意addshard中ip的修改
#查看分片服务器的配置
db.runCommand( { listshards : 1} )
//。。。
***********************************************************************************************************
目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了,
但我们的目的是希望插入数据,数据能够自动分片,就差那么一点点。
连接在mongos上,准备让指定的数据库、指定的集合分片生效。
***********************************************************************************************************
八、让指定table分片生效并生成测试数据
#连接到mongos
/usr/local/mongodb/bin/mongo 127.0.0.143:20000
#一定是在admin数据下执行
use admin
#指定test_db分片生效
db.runCommand( { enablesharding:"test_db"});
{ "ok" : 1 }
#指定数据库里需要分片的集合和片键
db.runCommand( {shardcollection : "test_db.test_tab",key : {str: 'hashed'} } )
{ "collectionsharded": "test_db.test_tab", "ok" : 1 }
【注意:不要单独在自增或时间戳的字段作为分片片键,否则数据分布不均匀,除非使用hashed,片键的选取请参考文章】
【注意:片键所在字段强烈建议建立索引,所以建立如下索引】
use test_db
#建立索引
db.test_tab.ensureIndex({str: "hashed"})
#查看索引
db.test_tab.getIndexes()
#定义js函数,产生字符串
function getStr(){
var str ="abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
var s = '';
for(var i = 0; i < 5; i++){
var rand = Math.floor(Math.random() *str.length);
s += str.charAt(rand);
}
return s;
}
#插入测试数据
for (var i = 1; i <= 100000;i++){
db.test_tab.insert({"str":getStr()})
}
#查看分片情况如下
db.test_tab.stats()
查看每个shard里面count字段即可,如果数据大小相差不大,则数据分片均衡
#查看分片状态
sh.status()
九、总结
只要你理解了mongodb分片集群的核心,其实搭建起来还是挺简单的。不过这里需要注意的点还是挺多的,比如如果所有服务器时间相差太大集群搭建都会有问题;还有启动文件对应的参数;集群的安全等等。