你的MongoDB是否健康?
mongostat是mongdb自带的状态检测工具,在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态,并输出。如果你发现数据库突然变慢或者有其他问题的话,你第一手的操作就考虑采用mongostat来查看mongo的状态。
它的输出有以下几列:
inserts/s 每秒插入次数
query/s 每秒查询次数
update/s 每秒更新次数
delete/s 每秒删除次数
getmore/s 每秒执行getmore次数
command/s 每秒的命令数,比以上插入、查找、更新、删除的综合还多,还统计了别的命令
flushs/s 每秒执行fsync将数据写入硬盘的次数。
mapped/s 所有的被mmap的数据量,单位是MB,
vsize 虚拟内存使用量,单位MB
res 物理内存使用量,单位MB
faults/s 每秒访问失败数(只有Linux有),数据被交换出物理内存,放到swap。不要超过100,否则就是机器内存太小,造成频繁swap写入。此时要升级内存或者扩展
locked % 被锁的时间百分比,尽量控制在50%以下吧
idx miss % 索引不命中所占百分比。如果太高的话就要考虑索引是不是少了
q t|r|w 当Mongodb接收到太多的命令而数据库被锁住无法执行完成,它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度,都为0的话表示mongo毫无压力。高并发时,一般队列值会升高。
conn 当前连接数
time 时间戳
profiler可以监控具体某个数据库查询慢的以及不慢。
Profiler默认是关闭的,你可以选择全部开启,或者有慢查询的时候开启。
> use test switched to db test > db.setProfilingLevel(2); {"was" : 0 , "slowms" : 100, "ok" : 1} // "was" is the old setting > db.getProfilingLevel()
查看Profile日志
> db.system.profile.find().sort({$natural:-1}) {"ts" : "Thu Jan 29 2009 15:19:32 GMT-0500 (EST)" , "info" : "query test.$cmd ntoreturn:1 reslen:66 nscanned:0 query: { profile: 2 } nreturned:1 bytes:50" , "millis" : 0} ...
3个字段的意义
ts:时间戳
info:具体的操作
millis:操作所花时间,毫秒
不多说,此处有官方文档。注意,造成满查询可能是索引的问题,也可能是数据不在内存造成因此磁盘读入造成。
Mongodb自带了Web控制台,默认和数据服务一同开启。他的端口在Mongodb数据库服务器端口的基础上加1000,如果是默认的Mongodb数据服务端口(Which is 27017),则相应的Web端口为28017
这个页面可以看到
当前Mongodb的所有连接
各个数据库和Collection的访问统计,包括:Reads, Writes, Queries, GetMores ,Inserts, Updates, Removes
写锁的状态
以及日志文件的最后几百行(CentOS+10gen yum 安装的mongodb默认的日志文件位于/var/log/mongo/mongod.log)
Sniffer,中文可以翻译为嗅探器,是一种基于被动侦听原理的网络分析方式。使用这种技术方式,可以监视网络的状态、数据流动情况以及网络上传输的信息。
Mongodb提供了一个sniffer工具:mongosniff,这个工具可以从底层监控有哪些命令传送给了Mongodb,祥见官网: http://docs.mongodb.org/manual/reference/program/mongosniff/
mongotop提供了一个方法,用来跟踪一个MongoDB的实例,查看哪些大量的时间花费在读取和写入数据
获取当前数据库的信息,比如Obj总数、数据库总大小、平均Obj大小等
> use test switched to db test > db.stats() { "collections" : 9, "objects" : 4278845, "avgObjSize" : 224.56603031892953, "dataSize" : 960883236, "storageSize" : 1195438080, "numExtents" : 59, "indexes" : 13, "indexSize" : 801931264, "fileSize" : 6373244928, "ok" : 1 }
获取服务器的状态
{ "version" : "1.6.5", "uptime" : 7208469, "uptimeEstimate" : 7138829, "localTime" : "Wed Oct 26 2011 22:23:07 GMT+0800 (CST)", "globalLock" : { "totalTime" : 7208469556704, "lockTime" : 4959693717, "ratio" : 0.000688036992871448, "currentQueue" : { "total" : 0, "readers" : 0, "writers" : 0 } }, "mem" : { "bits" : 64, "resident" : 3131, "virtual" : 6172, "supported" : true, "mapped" : 4927 }, "connections" : { "current" : 402, "available" : 2599 }, "extra_info" : { "note" : "fields vary by platform", "heap_usage_bytes" : 832531920, "page_faults" : 8757 }, "indexCounters" : { "btree" : { "accesses" : 2821726, "hits" : 2821725, "misses" : 1, "resets" : 0, "missRatio" : 3.543930204420982e-7 } }, "backgroundFlushing" : { "flushes" : 120133, "total_ms" : 73235923, "average_ms" : 609.6236920746173, "last_ms" : 1332, "last_finished" : "Wed Oct 26 2011 22:22:23 GMT+0800 (CST)" }, "cursors" : { "totalOpen" : 0, "clientCursors_size" : 0, "timedOut" : 238392 }, "repl" : { "ismaster" : true }, "opcounters" : { "insert" : 269351, "query" : 19331151, "update" : 14199331, "delete" : 1, "getmore" : 145575, "command" : 55982302 }, "asserts" : { "regular" : 0, "warning" : 0, "msg" : 0, "user" : 27, "rollovers" : 0 }, "ok" : 1 }
需要关心的地方:
connections 当前连接和可用连接数,听过一个同行介绍过,mongodb最大处理到2000个连接就不行了(要根据你的机器性能和业务来设定),所以设大了没意义。设个合理值的话,到达这个值mongodb就拒绝新的连接请求,避免被太多的连接拖垮。
indexCounters:btree:misses 索引的不命中数,和hits的比例高就要考虑索引是否正确建立。你看我的”missRatio” : 3.543930204420982e-7,很健康吧。所以miss率在mongostat里面也可以看
其他的都能自解释,也不是查看mongo健康状况的关键,就不说明了。
Mongodb 的命令一般很快就完成,但是在一台繁忙的机器或者有比较慢的命令时,你可以通过db.currentOp()获取当前正在执行的操作。
在没有负载的机器上,该命令基本上都是返回空的, 在负载很高的情况下,可能意义也不是特别的大
> db.currentOp() { "inprog" : [ ] }
以下是一个有负载的机器上得到的返回值样例:
{ "opid" : "shard3:466404288", "active" : false, "waitingForLock" : false, "op" : "query", "ns" : "sd.usersEmails", "query" : { }, "client_s" : "10.121.13.8:34473", "desc" : "conn" },
字段名字都能自解释。如果你发现一个操作太长,把数据库卡死的话,可以用这个命令杀死他
> db.killOp("shard3:466404288")