1、mongodb下载安装、配置
mongodb支持多操作系统,部分操作系统支持32位和64位,可以到官网下载自己需要的版本。
官网地址http://www.mongodb.org/downloads ,由于mongodb使用内存映射文件,数据大小的具体限制因系统而异。32位理论上最大限制为2.5G,2G属于安全限制,所以在生产环境下官方建议不要使用32位。
在linux系统下下载和安装mongodb非常简单,到官网下载压缩文件,使用tar解压到指定的文件夹就行了。
2、mongodb启动及关闭
2、1 启动mongodb
在mongodb解压后的目录下的bin目录下执行 mongod --dbpath /data
mongodb监听的端口是27017,可以通过ps -ef|grep mongod 查看mongodb是否启动。
mongod的主要参数有:
基本配置
--------------------------------------------------------------------------------
--quiet # 安静输出
--port arg # 指定服务端口号,默认端口27017
--bind_ip arg # 绑定服务IP,若绑定127.0.0.1,则只能本机访问,不指定默认本地所有IP
--logpath arg # 指定MongoDB日志文件,注意是指定文件不是目录
--logappend # 使用追加的方式写日志
--pidfilepath arg # PID File 的完整路径,如果没有设置,则没有PID文件
--keyFile arg # 集群的私钥的完整路径,只对于Replica Set 架构有效
--unixSocketPrefix arg # UNIX域套接字替代目录,(默认为 /tmp)
--fork # 以守护进程的方式运行MongoDB,创建服务器进程
--auth # 启用验证
--cpu # 定期显示CPU的CPU利用率和iowait
--dbpath arg # 指定数据库路径
--diaglog arg # diaglog选项 0=off 1=W 2=R 3=both 7=W+some reads
--directoryperdb # 设置每个数据库将被保存在一个单独的目录
--journal # 启用日志选项,MongoDB的数据操作将会写入到journal文件夹的文件里
--journalOptions arg # 启用日志诊断选项
--ipv6 # 启用IPv6选项
--jsonp # 允许JSONP形式通过HTTP访问(有安全影响)
--maxConns arg # 最大同时连接数 默认2000
--noauth # 不启用验证
--nohttpinterface # 关闭http接口,默认关闭27018端口访问
--noprealloc # 禁用数据文件预分配(往往影响性能)
--noscripting # 禁用脚本引擎
--notablescan # 不允许表扫描
--nounixsocket # 禁用Unix套接字监听
--nssize arg (=16) # 设置信数据库.ns文件大小(MB)
--objcheck # 在收到客户数据,检查的有效性,
--profile arg # 档案参数 0=off 1=slow, 2=all
--quota # 限制每个数据库的文件数,设置默认为8
--quotaFiles arg # number of files allower per db, requires --quota
--rest # 开启简单的rest API
--repair # 修复所有数据库run repair on all dbs
--repairpath arg # 修复库生成的文件的目录,默认为目录名称dbpath
--slowms arg (=100) # value of slow for profile and console log
--smallfiles # 使用较小的默认文件
--syncdelay arg (=60) # 数据写入磁盘的时间秒数(0=never,不推荐)
--sysinfo # 打印一些诊断系统信息
--upgrade # 如果需要升级数据库 * Replicaton 参数
--------------------------------------------------------------------------------
--fastsync # 从一个dbpath里启用从库复制服务,该dbpath的数据库是主库的快照,可用于快速启用同步
--autoresync # 如果从库与主库同步数据差得多,自动重新同步,
--oplogSize arg # 设置oplog的大小(MB) * 主/从参数
--------------------------------------------------------------------------------
--master # 主库模式
--slave # 从库模式
--source arg # 从库 端口号
--only arg # 指定单一的数据库复制
--slavedelay arg # 设置从库同步主库的延迟时间 * Replica set(副本集)选项:
--------------------------------------------------------------------------------
--replSet arg # 设置副本集名称 * Sharding(分片)选项
--------------------------------------------------------------------------------
--configsvr # 声明这是一个集群的config服务,默认端口27019,默认目录/data/configdb
--shardsvr # 声明这是一个集群的分片,默认端口27018
--noMoveParanoia # 关闭偏执为moveChunk数据保存
2、2 linux后台启动mongodb
2、3 停止mongodb
可以使用kill -2 mongodpid,不能使用kill -9强制停止mongodb,这样会导致mongodb内存中的数据无法刷入硬盘而导致数据丢失。
为了管理的方便,可以在mongodb启动是加入参数--pidfilepath /mongo_pid,指定pid存储的文件位置。在停止mongodb时,使用脚本:
#!/bin/bash
pid=`cat /mongo_pid`
kill -2 $pid
3、mongodb CRUD操作:
在mongodb解压后的目录下的bin目录下执行mongo,可以进入mongodb客户端(与mysql使用相似),当然如果为了方便,可以把bin目录加入系统变量,这样可以在任何目录执行mongodb相关的命令。
mongodb的数据库和集合(传统数据库的表)不需要在使用前事先建好。比如:
use foo --切换数据库为foo,如果foo数据库不存在,则mongodb会创建一个数据库foo。
db.blog.insert({"title":"test"}) --blog集合插入一个文档,如果blog不存在则创建一个集合blog。
mongodb常用的命令请查阅mongo官方网站,很详细。
4、replica set使用注意要点:
首先介绍一下在replica set里分为三种节点类型:
1、primary 负责client的读写。
2、secondary作为热备节点,应用Primary的oplog读取的操作日志,和primary保持一致,不提供读写操作!
secondary有两种类型:
1)normal secondary 随时和Primay保持同步,
2)delayed secondary 延时指定时间和primary保持同步,防止误操作.
3、arbiter.它不负责任何读写,只作为一个仲裁者,负责primary down的时候剩余节点的选举操作.
在Replica Set 如果主库down了,要进行故障切换,集群的选举策略:
当primary当了之后,剩下的节点会选择一个primary节点,仲裁节 点也会参与投票,避免僵局出现(如果没有仲裁节点,对于两节点的replica set 从节点down,主节点会变为secondary,导致整个replica set 不可用)选择依据为:优先级最高的且数据新鲜度最新的!
primary 节点使用心跳来跟踪集群中有多少节点对其可见。如果达不到1/2,活跃节点会自动降级为secondary。这样就能够防止上面说的僵局状态或者当网络切割后primary已经与集群隔离的时候!
我在测试时加入一个arbiter节点时,mongodb误把它当作primary节点,导致其他节点同步新增加的这个节点的数据,使之前的数据全部被回滚,后来没有重现出这个问题,应该是mongodb的bug,我使用的版本是mongodb-linux-x86_64-2.0.7。
5、mongostat mongodb数据库监控工具
mongostat是mongdb自带的状态检测工具,在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态,并输出。如果你发现数据库突然变慢或者有其他问题的话,你第一手的操作就考虑采用mongostat来查看mongo的状态。
它的输出有以下几列:
6、mongodb的性能及适应场景
我在测试时,在内存没有耗尽时,最快时每秒的写入可以达到2万条,内存耗尽时,数据的写入性能急剧下降,有时候还出现短暂的暂停,但是总体性能还是不错的。
由于mongodb不支持事务,所有mongodb适合一些对数据一致性要求不高,需要实时写入的项目。