MongoDB配置

    • 关于MongoDB
    • 环境
    • 安装过程
      • 解压安装包添加到Path
      • 配置config server
      • 配置shard
      • 启用分片
      • 测试
      • 启动关闭
    • 问题

关于MongoDB

MongoDB主要是有四个组件:mongos、config server、shard、replica set。
- mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。
- config server,顾名思义为配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!
- shard,分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。
- replica set,中文翻译副本集,其实就是shard的备份,防止shard挂掉之后数据丢失。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。仲裁者(Arbiter),是复制集中的一个MongoDB实例,它并不保存数据。仲裁节点使用最小的资源并且不要求硬件设备,不能将Arbiter部署在同一个数据集节点中,可以部署在其他应用服务器或者监视服务器中,也可部署在单独的虚拟机中。为了确保复制集中有奇数的投票成员(包括primary),需要添加仲裁节点做为投票,否则primary不能运行时不会自动切换primary。

环境

  • 分片以及副本集规划
lk slave2 slave3 slave4 slave5
mongos mongos mongos
config server config server config server shard1 shard1
shard1 shard2 shard2 shard2 shard3
shard3 shard3 shard4 shard4 shard4
副本集 端口
config server 21000
mongos 20000
shard1 27001
shard2 27002
shard3 27003
shard4 27004

注意:一个机器归于多个副本集时,要用不同的端口号以示区别

安装过程

解压安装包,添加到Path

解压

tar -xzvf mongodb-linux-x86_64-3.4.6.tgz
mkdir 
cp -R

在每台机器中创建文件夹

mkdir -p /usr/local/mongodb/conf
mkdir -p /usr/local/mongodb/mongos/log
mkdir -p /usr/local/mongodb/config/data
mkdir -p /usr/local/mongodb/config/log
mkdir -p /usr/local/mongodb/shard1/data
mkdir -p /usr/local/mongodb/shard1/log
mkdir -p /usr/local/mongodb/shard2/data
mkdir -p /usr/local/mongodb/shard2/log
mkdir -p /usr/local/mongodb/shard3/data
mkdir -p /usr/local/mongodb/shard3/log
  • 配置环境变量
vim /etc/profile
# 内容
export MONGODB_HOME=/usr/local/mongodb
export PATH=$MONGODB_HOME/bin:$PATH
# 使立即生效
source /etc/profile

配置config server

对于config server也创建副本集

修改配置文件
主要配置的是文件路径,数据库路径和日志路径
还有ip(本机),端口(21000),副本集名称,等等

vi /usr/local/mongodb/conf/config.conf

## 配置文件内容
pidfilepath = /usr/local/mongodb/config/log/configsrv.pid
dbpath = /usr/local/mongodb/config/data
logpath = /usr/local/mongodb/config/log/congigsrv.log
logappend = true

bind_ip = 0.0.0.0
port = 21000
fork = true

#declare this is a config db of a cluster;
configsvr = true

#副本集名称
replSet=configs

#设置最大连接数
maxConns=20000
  • 启动三台服务器的config server
mongod -f /usr/local/mongodb/conf/config.conf
  • 登陆config server副本集中任意一台,配置副本集
#连接
mongo --port 21000
#config变量
config = {
... _id : "configs",
... members : [
...  {_id : 0, host : "10.113.10.1:21000" },
...  {_id : 1, host : "10.113.10.2:21000" },
...  {_id : 2, host : "10.113.10.3:21000" }
... ]
... }

#初始化副本集
rs.initiate(config)

这里的id号,要和配置文件中的副本集名称相同
host后面是IP地址和端口

配置shard

以shard1为例

vim /usr/local/mongodb/conf/shard1.conf

#配置文件内容
#——————————————–
vim /usr/local/mongodb/conf/shard1.conf

pidfilepath = /usr/local/mongodb/shard1/log/shard1.pid
dbpath = /usr/local/mongodb/shard1/data
logpath = /usr/local/mongodb/shard1/log/shard1.log
logappend = true

bind_ip = 0.0.0.0
port = 27001
fork = true

#打开web监控
httpinterface=true
rest=true

#副本集名称
replSet=shard2

#declare this is a shard db of a cluster;
shardsvr = true

#设置最大连接数
maxConns=20000
  • 启动三台服务器的shard1 server
mongod -f /usr/local/mongodb/conf/shard2.conf
  • 登陆shard1中任意一台机器
mongo --port 27001

use admin

config = {
... _id : "shard1",
... members : [
...  {_id : 0, host : "10.113.10.4:27001" , arbiterOnly: true},
...  {_id : 1, host : "10.113.10.5:27001" },
...  {_id : 2, host : "10.113.10.1:27001"}
... ]
... }

rs.initiate(config);
  • 依次配置shard2,shard3和shard4

  • 配置路由服务器 mongos
    修改mongos配置文件

vi /usr/local/mongodb/conf/mongos.conf

pidfilepath = /usr/local/mongodb/mongos/log/mongos.pid
logpath = /usr/local/mongodb/mongos/log/mongos.log
logappend = true

bind_ip = 0.0.0.0
port = 20000
fork = true

#监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字
configdb = configs/10.113.10.1:21000,10.113.10.2:21000,10.113.10.3:21000  


#设置最大连接数
maxConns=20000
  • 启动三台服务器的mongos server

mongos -f /usr/local/mongodb/conf/mongos.conf

启用分片

目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。

  • 登陆任意一个mongos
mongo --port 20000

#使用admin数据库
user admin

#串联路由服务器与分配副本集
sh.addShard("shard1/10.113.10.1:27001,10.113.10.4:27001,10.113.10.5:27001")

sh.addShard("shard2/10.113.10.2:27002,10.113.10.3:27002,10.113.10.4:27002")
sh.addShard("shard3/10.113.10.1:27003,10.113.10.2:27003,10.113.10.5:27003")
sh.addShard("shard4/10.113.10.4:27004,10.113.10.5:27004,10.113.10.3:27004")

#查看集群状态
sh.status()

测试

希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。

  • 不启用分片
#指定testdb分片生效
db.runCommand( { enablesharding :"testdb"});
#指定数据库里需要分片的集合和片键
db.runCommand( { shardcollection : "testdb.table1",key : {id: 1} } )

我们设置testdb的 table1 表需要分片,根据 id 进行分片

#插入测试数据
for (var i = 1; i <= 100000; i++) db.table1.save({id:i,"test1":"testval1"});
#查看分片情况如下,部分无关信息省掉了
db.table1.stats();

  • 启用分片
#指定testdb分片生效
db.runCommand( { enablesharding :"testdb2"});
#指定数据库里需要分片的集合和片键
db.runCommand( { shardcollection : "testdb2.table",key : {_id: "hashed"} } )

测试和上面相同

use testdb2
#插入测试数据
for (var i = 1; i <= 100000; i++) db.table.save({id:i,"test1":"testval1"});
#查看分片情况如下,部分无关信息省掉了
db.table.stats();

测试结果

mongos> db.table.stats();
{
    "sharded" : true,
    "capped" : false,
    "ns" : "testdb2.table",
    "count" : 100000,
    "size" : 5400000,
    "storageSize" : 1781760,
    "totalIndexSize" : 3514368,
    "indexSizes" : {
        "_id_" : 1130496,
        "_id_hashed" : 2383872
    },
    "avgObjSize" : 54,
    "nindexes" : 2,
    "nchunks" : 8,
    "shards" : {
        "shard1" : {
            "ns" : "testdb2.table",
            "size" : 1348866,
            "count" : 24979,
            "avgObjSize" : 54,
            "storageSize" : 376832,
            "capped" : false,
            "wiredTiger" : {
                "metadata" : {
                    "formatVersion" : 1
                },
        },
        ........

        "shard2" : {
            "ns" : "testdb2.table",
            "size" : 1358640,
            "count" : 25160,
            "avgObjSize" : 54,
            "storageSize" : 471040,
            "capped" : false,
            "wiredTiger" : {
                "metadata" : {
                    "formatVersion" : 1
                },
        },
        .....

        "shard3" : {
            "ns" : "testdb2.table",
            "size" : 1350000,
            "count" : 25000,
            "avgObjSize" : 54,
            "storageSize" : 466944,
            "capped" : false,
            "wiredTiger" : {
                "metadata" : {
                    "formatVersion" : 1
                },
        },
        ......

        "shard4" : {
            "ns" : "testdb2.table",
            "size" : 1342494,
            "count" : 24861,
            "avgObjSize" : 54,
            "storageSize" : 466944,
            "capped" : false,
            "wiredTiger" : {
                "metadata" : {
                    "formatVersion" : 1
                },
                .......
            "ok" : 1
        }
    },
    "ok" : 1
}

可以看出来,数据是分片计算的

启动关闭

mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos.

  • 启动
mongod -f /usr/local/mongodb/conf/config.conf
mongod -f /usr/local/mongodb/conf/shard1.conf
mongod -f /usr/local/mongodb/conf/shard2.conf
mongod -f /usr/local/mongodb/conf/shard3.conf
mongod -f /usr/local/mongodb/conf/shard4.conf
mongos -f /usr/local/mongodb/conf/mongos.conf
  • 关闭
killall mongod
killall mongos

问题

  • mongo无法启动
    ERROR: child process failed, exited with error number 100
    很有可能是数据库关闭不当,导致.lock文件产生
    要删除数据库中的.lock文件
mongod.lock
  • 防火墙没有关闭
> rs.initiate(config);
{
    "ok" : 0,
    "errmsg" : "replSetInitiate quorum check failed because not all proposed set members responded affirmatively: 10.113.10.1:27001 failed with Connection refused",
    "code" : 74,
    "codeName" : "NodeNotFound"
}

需要彻底关闭防火墙,然后重启

关闭firewall:
systemctl stop firewalld.service #停止firewall
systemctl disable firewalld.service #禁止firewall开机启动
firewall-cmd –state #查看默认防火墙状态(关闭后显示notrunning,开启后显示running)

关闭iptables
暂时关闭iptables
/etc/init.d/iptables stop
永久关闭
chkconfig iptables off

你可能感兴趣的:(课程学习,实验,配置,大数据实验)