redis cluster集群中键的分布算法

redis cluster集群中键的分布算法_第1张图片

 Redis Cluster

Redis Cluster是Redis的作者 Antirez 提供的 Redis 集群方案 —— 官方多机部署方案,每组Redis Cluster是由多个Redis实例组成。如:当你配置了6个Redis实例,其中有3个作为主节点,其他3个作为从节点使用(最小配置)。使用Redis Cluster可以提高数据的安全性与服务的高可用性能,当其中有主节点宕机了,Redis Cluster会立马使用对应的选举机制,在从结点选出新的主节点,继续对客户端提供相应服务。

redis cluster集群中键的分布算法_第2张图片

3主3从的 Redis Cluster结构图

 

使用Redis Cluster的优势:

(1)实现主从复制的高可用性

(2)缓解单机QPS的压力,提高整个系统模块的QPS能力

(3)进行横向扩展(线性扩展),动态添加与删除节点

(4)进行网络流量分流,减小网络的压力

(5)进行负载均衡

 

在所有的 redis 实例节点之间彼此使用 Gossip 协议进行通信,通过 PING-PONG 机制来达到互联状态,在传输过程中使用特殊的二进制协议相互交互集群信息。Redis Cluster 在设计的时候使用了虚拟槽技术,每个节点上都有插槽(slot)和 cluster(集群管理插件),Antirez 将槽划分成 16384 个(即 0 ~ 16383)。

至于为何设计这个数量 Redis 作者给出了相应回答 (当我看到解释的时候,我立刻想膜拜orz大佬,真的可以随心而飞)。

------→ 作者的回答 (https://github.com/antirez/redis/issues/2576)

总结下来:

1.槽位越小,节点少的情况下,压缩率高。  

2.redis的集群主节点数量基本不可能超过1000个。

redis cluster集群中键的分布算法_第3张图片

 

Redis Cluster 集群引入了主从模式,一个主节点对应一个或者多个从节点,当主节点宕机的时候,就会启用从节点。当其它主节点 PING一个主节点时,如果半数以上的主节点与该主节点通信超时,那么认为主节点A下线,这时它的从节点会顶上去服务。但是如果该主节点和它的从节点都宕机了,那么此集群就无法再提供服务了。 在对应的所有键中通过 Redis 内部实现算法 CRC16 对键进行哈希算法运算得到一个整数值后在 mod上 16384后,将得到的值映射对应到编号为 0 ~ 16383的槽子中。 Cluster 还允许用户强制将某个 key 挂在特定槽位上,通过在 key 字符串里面写入 tag 标记,这时key 所挂在的槽位等于 tag 所在的槽位。其中集群槽子类似下图:

redis cluster集群中键的分布算法_第4张图片

 

 在 Redis 的crc16.c 中 CRC 16 实现方式:

static const uint16_t crc16tab[256]= {
    0x0000,0x1021,0x2042,0x3063,0x4084,0x50a5,0x60c6,0x70e7,
    0x8108,0x9129,0xa14a,0xb16b,0xc18c,0xd1ad,0xe1ce,0xf1ef,
    0x1231,0x0210,0x3273,0x2252,0x52b5,0x4294,0x72f7,0x62d6,
    0x9339,0x8318,0xb37b,0xa35a,0xd3bd,0xc39c,0xf3ff,0xe3de,
    0x2462,0x3443,0x0420,0x1401,0x64e6,0x74c7,0x44a4,0x5485,
    0xa56a,0xb54b,0x8528,0x9509,0xe5ee,0xf5cf,0xc5ac,0xd58d,
    0x3653,0x2672,0x1611,0x0630,0x76d7,0x66f6,0x5695,0x46b4,
    0xb75b,0xa77a,0x9719,0x8738,0xf7df,0xe7fe,0xd79d,0xc7bc,
    0x48c4,0x58e5,0x6886,0x78a7,0x0840,0x1861,0x2802,0x3823,
    0xc9cc,0xd9ed,0xe98e,0xf9af,0x8948,0x9969,0xa90a,0xb92b,
    0x5af5,0x4ad4,0x7ab7,0x6a96,0x1a71,0x0a50,0x3a33,0x2a12,
    0xdbfd,0xcbdc,0xfbbf,0xeb9e,0x9b79,0x8b58,0xbb3b,0xab1a,
    0x6ca6,0x7c87,0x4ce4,0x5cc5,0x2c22,0x3c03,0x0c60,0x1c41,
    0xedae,0xfd8f,0xcdec,0xddcd,0xad2a,0xbd0b,0x8d68,0x9d49,
    0x7e97,0x6eb6,0x5ed5,0x4ef4,0x3e13,0x2e32,0x1e51,0x0e70,
    0xff9f,0xefbe,0xdfdd,0xcffc,0xbf1b,0xaf3a,0x9f59,0x8f78,
    0x9188,0x81a9,0xb1ca,0xa1eb,0xd10c,0xc12d,0xf14e,0xe16f,
    0x1080,0x00a1,0x30c2,0x20e3,0x5004,0x4025,0x7046,0x6067,
    0x83b9,0x9398,0xa3fb,0xb3da,0xc33d,0xd31c,0xe37f,0xf35e,
    0x02b1,0x1290,0x22f3,0x32d2,0x4235,0x5214,0x6277,0x7256,
    0xb5ea,0xa5cb,0x95a8,0x8589,0xf56e,0xe54f,0xd52c,0xc50d,
    0x34e2,0x24c3,0x14a0,0x0481,0x7466,0x6447,0x5424,0x4405,
    0xa7db,0xb7fa,0x8799,0x97b8,0xe75f,0xf77e,0xc71d,0xd73c,
    0x26d3,0x36f2,0x0691,0x16b0,0x6657,0x7676,0x4615,0x5634,
    0xd94c,0xc96d,0xf90e,0xe92f,0x99c8,0x89e9,0xb98a,0xa9ab,
    0x5844,0x4865,0x7806,0x6827,0x18c0,0x08e1,0x3882,0x28a3,
    0xcb7d,0xdb5c,0xeb3f,0xfb1e,0x8bf9,0x9bd8,0xabbb,0xbb9a,
    0x4a75,0x5a54,0x6a37,0x7a16,0x0af1,0x1ad0,0x2ab3,0x3a92,
    0xfd2e,0xed0f,0xdd6c,0xcd4d,0xbdaa,0xad8b,0x9de8,0x8dc9,
    0x7c26,0x6c07,0x5c64,0x4c45,0x3ca2,0x2c83,0x1ce0,0x0cc1,
    0xef1f,0xff3e,0xcf5d,0xdf7c,0xaf9b,0xbfba,0x8fd9,0x9ff8,
    0x6e17,0x7e36,0x4e55,0x5e74,0x2e93,0x3eb2,0x0ed1,0x1ef0
};

//crc16算法 uint16_t crc16(
const char *buf, int len) { int counter; uint16_t crc = 0; for (counter = 0; counter < len; counter++) crc = (crc<<8) ^ crc16tab[((crc>>8) ^ *buf++)&0x00FF]; return crc; }

 

分配key到slot 的 keyHashSlot 算法如下:

unsigned int keyHashSlot(char *key, int keylen) {
    int s, e; /* start-end indexes of { and } */

    for (s = 0; s < keylen; s++)
        if (key[s] == '{') break;

    /* No '{' ? Hash the whole key. This is the base case. */
    if (s == keylen) return crc16(key,keylen) & 0x3FFF;

    /* '{' found? Check if we have the corresponding '}'. */
    for (e = s+1; e < keylen; e++)
        if (key[e] == '}') break;

    /* No '}' or nothing between {} ? Hash the whole key. */
    if (e == keylen || e == s+1) return crc16(key,keylen) & 0x3FFF;

    /* If we are here there is both a { and a } on its right. Hash
     * what is in the middle between { and }. */
    return crc16(key+s+1,e-s-1) & 0x3FFF;
}

公式:slot = CRC16(key)mod 16384  每个槽所映射的数据通常比较均匀。

 Redis Cluster 的每个节点会将集群的配置信息持久化到配置文件中,要提前设置文件是可以写的。

你可能感兴趣的:(redis cluster集群中键的分布算法)