前面一直在分析Redis的底层数据结构,Redis利用这些底层结构设计了它面向用户可见的五种数据结构,字符串、哈希,链表,集合和有序集合,然后用redisObject对这五种结构进行了封装。从这篇博客开始,带你一点点分析五种数据类型常见命令对应的源码实现,慢慢地解开Redis的面纱。
字符串概述
字符串是Redis中最为常见的数据存储类型,其底层实现是简单动态字符串sds,因此,该字符串类型是二进制安全的,这就意味着它可以接受任何格式的数据。另外,Redis规定,字符串类型最多可以容纳的数据长度为512M。Redis提供了下列函数,来检测字符串键的大小。
static int checkStringLength(client c, long long size) {
// 超出了512M,就直接报错
if (size > 5121024*1024) {
addReplyError(c,“string exceeds maximum allowed size (512MB)”);
return C_ERR;
}
return C_OK;
}
字符串结构
在RedisObject中提到,Redis的底层编码类型有三种:OBJ_ENCODING_RAW,OBJ_ENCODING_INT和OBJ_ENCODING_EMBSTR,分别对应的底层数据结构为sds,int,sds。字符串的数据结构如下:
typedef struct redisObject {
unsigned type:4; // 为OBJ_STRING
unsigned encoding:4; // 编码类型OBJ_ENCODING_RAW,OBJ_ENCODING_INT或OBJ_ENCODING_EMBSTR
unsigned lru:LRU_BITS; // LRU_BITS为24位,最近一次的访问时间
int refcount;
void *ptr;
} robj;
其中,有必要讲解一下OBJ_ENCODING_EMBSTR编码,其实这就是一个小的技巧,我们在创建RedisObject和其存放的数据时,通常是分开创建,然后将ptr指向对应的数据,这样就有两次申请内存的过程。
而embstr的做法是,首先计算RedisObject和数据占用的字节数,然后只用一次申请内存,数据直接存放在RedisObject后面,如下:
| stringObject | data |
↓ →→→→→↑
↓ ↑
| type | encoding | lru | refcount | ptr | data |
当然,embstr只适合常见长度较小的字符串时才显得效率高。如果长度过长,申请大内存段比较费力。因此,Redis规定了小于规定字节才采用embstr编码。
/* 当长度小于44字节时,采用embstr编码 */
#define OBJ_ENCODING_EMBSTR_SIZE_LIMIT 44
字符串命令
Redis为string提供了一系列的命令,用来操作和管理字符串,主要包括以下几个命令。
命令 命令描述
SET key value [ex 秒数][px 毫秒数][nx/xx] 设置指定key的值
GET key 获取指定key的值
APPEND key value 将value追加到指定key的值末尾
INCRBY key increment 将指定key的值加上增量increment
DECRBY key decrement 将指定key的值减去增量decrement
STRLEN key 返回指定key的值长度
SETRANGE key offset value 将value覆写到指定key的值上,从offset位开始
GETRANGE key start end 获取指定key中字符串的子串[start,end]
MSET key value [key value …] 一次设定多个key的值
MGET key1 [key2…] 一次获取多个key的值
上述命令均为常用的字符串命令,其实现在t_string.c文件中,我们进而来查看一下它们的实现源码。
void setCommand(client *c); // SET命令,设定键值对
void setnxCommand(client *c); // SETNX命令,key不存在时才设置值
void setexCommand(client *c); // SETEX命令,key存在时才设置值,到期时间为秒
void psetexCommand(redisClient *c) // PSETEX命令,key存在时才设置值,到期时间为毫秒
void setrangeCommand(client *c); // SETRANGE命令,范围性的设置值
void msetCommand(client *c); // MSET命令,一次设定对个键值对
void msetnxCommand(client *c); // MSETNX命令,key不存在时才设置值
void getCommand(client *c); // GET命令,获取key对应的value
void mgetCommand(client *c); // MGET命令,获取多个key对应的value
void getrangeCommand(client *c); // GETRANGE命令,范围性的获取值
void getsetCommand(client *c); // 获取指定的键,如果存在则修改其值;反之不进行操作
void incrCommand(client *c); // 值递增1操作
void decrCommand(client *c); // 值递减1操作
void incrbyCommand(client *c); // 值增加操作
void decrbyCommand(client *c); // 值减少操作
void appendCommand(redisClient *c) // 追加key对应的值
void strlenCommand(redisClient *c) // 获取key对应值得长度
接下来,我们以SET命令为例,来理解以下Redis处理字符串命令的过程。
例:SET命令实现流程
set命令用于设置指定的值,其具体命令格式如下:
set key value [ex 秒数] [px 毫秒数] [nx/xx]
其中,各个选项的含义如下:
ex 设置指定的到期时间,单位为秒
px 设置指定的到期时间,单位为毫秒
nx 只有在key不存在的时候,才设置key的值
xx 只有key存在时,才对key进行设置操作
例如,我们在Redis的客户端中输入:
127.0.0.1:6379> set zee 100 ex 1000 nx
OK
// 代表设定一组键值对[zee,100],其中,到期时间为1000秒,如果zee不存在则创建key并设定值
SET 命令的源码由setcommod函数实现,调用set命令需要传入一个client的指针,client类型里面包含了很多Redis对于交互命令的处理参数,我们没必要去管一些目前还用不上的参数,先来看看set命令需要用到的参数。
typedef struct client {
redisDb *db; // 当前数据库
robj **argv; // 命令参数
// …
} client;
很显然,db指向一个我们当前需要操作的数据库,argv指向待传入的命令参数。当我们执行set zee 100 ex 1000 nx命令时,argv中就包含六个RedisObject结构,其对应如下:
argv[0] – set
argv[1] – zee
argv[3] – 100
argv[4] – ex
argv[5] – 1000
argv[6] – nx
我们规定了到期时间为1000秒,且只有在zee键不存在的时候才设定该键的值。Redis为SET命令的操作设定了下列三个宏定义,用来标记SET的操作类型。
// 关于set命令的操作有三种宏定义
#define OBJ_SET_NO_FLAGS 0 // 没有设定参数
#define OBJ_SET_NX (1<<0) // 只有键不存在时才设定其值
#define OBJ_SET_XX (1<<1) // 只有键存在时才设定其值
#define OBJ_SET_EX (1<<2) // ex属性,到期时间单位为秒
#define OBJ_SET_PX (1<<3) // px属性,到期时间单位为毫秒
有了上述的理解之后,我们可以进入setCommand函数了。
/* set命令实现函数 */
void setCommand(client *c) {
int j;
robj *expire = NULL;
int unit = UNIT_SECONDS;
// 用于标记ex/px和nx/xx命令参数
int flags = OBJ_SET_NO_FLAGS;
// 从命令串的第四个参数开始,查看其是否设定了ex/px和nx/xx
for (j = 3; j < c->argc; j++) {
char *a = c->argv[j]->ptr;
robj next = (j == c->argc-1) ? NULL : c->argv[j+1];
if ((a[0] == ‘n’ || a[0] == ‘N’) &&
(a[1] == ‘x’ || a[1] == ‘X’) && a[2] == ‘\0’ &&
!(flags & OBJ_SET_XX)) // 标记
{
flags |= OBJ_SET_NX;
} else if ((a[0] == ‘x’ || a[0] == ‘X’) &&
(a[1] == ‘x’ || a[1] == ‘X’) && a[2] == ‘\0’ &&
!(flags & OBJ_SET_NX))
{
flags |= OBJ_SET_XX;
} else if ((a[0] == ‘e’ || a[0] == ‘E’) &&
(a[1] == ‘x’ || a[1] == ‘X’) && a[2] == ‘\0’ &&
!(flags & OBJ_SET_PX) && next)
{
flags |= OBJ_SET_EX;
unit = UNIT_SECONDS;
expire = next;
j++;
} else if ((a[0] == ‘p’ || a[0] == ‘P’) &&
(a[1] == ‘x’ || a[1] == ‘X’) && a[2] == ‘\0’ &&
!(flags & OBJ_SET_EX) && next)
{
flags |= OBJ_SET_PX;
unit = UNIT_MILLISECONDS;
expire = next;
j++;
} else {
// 如果不是上述参数,则需要报错,命令错误
addReply(c,shared.syntaxerr);
return;
}
}
// 判断value是否可以编码成整数,如果能则编码;反之不做处理
c->argv[2] = tryObjectEncoding(c->argv[2]);
// 调用底层函数进行键值对设定
setGenericCommand(c,flags,c->argv[1],c->argv[2],expire,unit,NULL,NULL);
}
/ 真正的set底层实现函数 */
void setGenericCommand(client *c, int flags, robj *key, robj *val, robj *expire, int unit, robj *ok_reply, robj abort_reply) {
long long milliseconds = 0; / initialized to avoid any harmness warning */
// 设定过期时间
if (expire) {
if (getLongLongFromObjectOrReply(c, expire, &milliseconds, NULL) != C_OK)
return;
if (milliseconds <= 0) {
addReplyErrorFormat(c,“invalid expire time in %s”,c->cmd->name);
return;
}
if (unit == UNIT_SECONDS) milliseconds *= 1000;
}
// 判断key是否存在,并根据nx和xx命令来决定是否set命令是否执行
if ((flags & OBJ_SET_NX && lookupKeyWrite(c->db,key) != NULL) ||
(flags & OBJ_SET_XX && lookupKeyWrite(c->db,key) == NULL))
{
addReply(c, abort_reply ? abort_reply : shared.nullbulk);
return;
}
// 将键值对关联到数据库
setKey(c->db,key,val);
// 设定该数据库为脏
server.dirty++;
// 设定过期时间
if (expire) setExpire(c->db,key,mstime()+milliseconds);
// 发送事件通知
notifyKeyspaceEvent(NOTIFY_STRING,“set”,key,c->db->id);
// 发送定期事件通知
if (expire) notifyKeyspaceEvent(NOTIFY_GENERIC,
“expire”,key,c->db->id);
// 向客户端发送命令处理结果
addReply(c, ok_reply ? ok_reply : shared.ok);
}
从SET命令中,衍生除了SETNX,SETEX,PSETEX等命令,其底层均是调用setGenericCommand来实现。
// key不存在时,才设定值,flag为REDIS_SET_NX;如果key存在则不做处理
// 命令形式为:setnx key value
void setnxCommand(client *c) {
c->argv[2] = tryObjectEncoding(c->argv[2]);
setGenericCommand(c,OBJ_SET_NX,c->argv[1],c->argv[2],NULL,0,shared.cone,shared.czero);
}
// key存在时才设置值,flag为REDIS_SET_NO_FLAGS,过期时间单位为秒,如果key不存在则不做处理
// 命令形式为:setex key seconds value (seconds为键过期时间,单位秒)
void setexCommand(client *c) {
// 这里为argv[3],因为value存放在此
c->argv[3] = tryObjectEncoding(c->argv[3]);
setGenericCommand(c,OBJ_SET_NO_FLAGS,c->argv[1],c->argv[3],c->argv[2],UNIT_SECONDS,NULL,NULL);
}
// key存在时才设置值,flag为REDIS_SET_NO_FLAGS,过期时间单位为毫秒
// PSETEX key milliseconds value(milliseconds为键过期时间,单位毫秒)
void psetexCommand(client *c) {
c->argv[3] = tryObjectEncoding(c->argv[3]);
setGenericCommand(c,OBJ_SET_NO_FLAGS,c->argv[1],c->argv[3],c->argv[2],UNIT_MILLISECONDS,NULL,NULL);
}
字符串小结
在字符串的处理命令中,涉及到很多数据库和事件的相关处理函数,现阶段我们可以忽略。本博客只是列举了set命令的源码处理过程,这些命令的处理大多是涉及到命令解析的过程,比较繁琐,但是很好理解。有兴趣的可以在深入到每个命令的源码中,一窥实现步骤。源码面前,了无秘密。