什么是Jumbo chunk

就是超出设定的chunk大小的chunk,默认chunk大小为64M

为什么要处理Jumbo chunk

jumbo chunk无法被迁移

如何处理?

# 先找到Jumbo chunk信息
sh.status(true)

        { "phone" : NumberLong("xxxxxx") } -->> { "phone" : NumberLong("yyyyyyy") } on : shard_rep1 Timestamp(1, 19) jumbo

# 执行
# 对于上面的Jumbo块,执行如下命令
sh.splitFind("db.tb",{shardkeyX:"shardkeyXValue_in_range"})

脚本化自动处理

思路处理:

  • 1.既然sh.status(true)可以发现jumbo chunk那么config库中一定记录着jumbo信息
  • 2.从chunk的元数据表中找到标记为jumbo的数据快
  • 3.处理超大的数据块

    复制到mongos shell中执行即可

    db = db.getSiblingDB('config');
    var goblins=db.chunks.find({"jumbo":true})
    goblins.forEach( function (item) { 
    databaseDotTable = item.ns;
    minShardKeyInfo = item.min;
    maxShardKeyInfo = item.max
    for (var i in minShardKeyInfo) {
        var key=i;
        var value=minShardKeyInfo[i];
        if (typeof(value) === "function") {
            for (var j in maxShardKeyInfo) {
                value = maxShardKeyInfo[j]
            }
        }
    }
    var findFilter = {}
    findFilter[key] = value
    print(`Doing db.adminCommand({"${databaseDotTable}",{${key}:${value}})}`);
    result=db.adminCommand({split:databaseDotTable,find:findFilter});
    printjson(result)
    })

备注

1.官方推荐使用更加自动的sh.splitFind而不是原始的sh.splitAt函数