上个篇章回顾,我们上个章节,讲了redis的底层数据结构简单动态字符串(SDS)详解和压缩列表(ZipList)详解。了解到SDS是Redis字符串数据类型的底层数据结构,它具有可变长度、二进制安全、缓冲区预分配等特点。ZipList压缩列表是用来表示列表和哈希表的数据结构,它是一种紧凑的、压缩的数据结构,可以存储多个元素,并且支持在表头和表尾进行快速的插入和删除操作,可以有效地减少内存占用。
那么本章讲解Redis中的快表(QuickList),它是一种特殊的数据结构,用于存储一系列的连续节点,每个节点可以是一个整数或一个字节数组。快表是Redis中的底层数据结构之一,常用于存储有序集合(Sorted Set)等数据类型的底层实现。在本文中,我们将深入了解Redis中的快表,包括快表的结构和操作等。
Redis中的快表(QuickList)是由多个节点(Node)组成的双向链表,每个节点都是一个ziplist(压缩列表)。快表中的每个节点包含了多个元素,每个元素可以是一个整数或一个字节数组。快表的结构如下图所示:
+---------+---------+---------+-------+
| ziplist| ziplist| ziplist| ... |
+---------+---------+---------+-------+
| prev | next | len | len |
+---------+---------+---------+-------+
| ... | ... | ... | ... |
+---------+---------+---------+-------+
其中,ziplist是压缩列表,prev和next是指向前一个节点和后一个节点的指针,len是当前节点中元素的个数。
两端各有2个橙黄色的节点,是没有被压缩的。它们的数据指针zl指向真正的ziplist。中间的其它节点是被压缩过的,它们的数据指针zl指向被压缩后的ziplist结构,即一个quicklistLZF结构。
左侧头节点上的ziplist里有2项数据,右侧尾节点上的ziplist里有1项数据,中间其它节点上的ziplist里都有3项数据(包括压缩的节点内部)。这表示在表的两端执行过多次push和pop操作后的一个状态。
现在我们来大概计算一下quicklistNode
结构中的count字段这16bit是否够用。
Redis 6.0 版本中的快表(QuickList)与 Redis 4.0 版本中的快表基本结构相同,都是由多个 quicklistNode 节点组成,其中每个节点都包含一个 ziplist 和一些元数据信息。快表中的元素按照从表头到表尾的顺序依次存储。
typedef struct quicklist {
quicklistNode *head;
quicklistNode *tail;
unsigned long count;
unsigned int len; // quicklist 节点数
int fill : 16; // 压缩列表节点所能容纳的最大元素个数
unsigned int compress : 16; // 压缩比例,0 表示不压缩,1 表示每两个节点压缩一个节点
unsigned int bookmark_count; // 快照节点数量
quicklistBookmark *bookmarks; // 快照节点数组
} quicklist;
head 和 tail:分别指向快表的头部和尾部 quicklistNode 节点。
count:快表中元素的数量。
len:快表中 quicklistNode 节点的数量。
fill:ziplist 节点所能容纳的最大元素个数。
compress:压缩比例,0 表示不压缩,1 表示每两个节点压缩一个节点。
bookmark_count 和 bookmarks:快照节点数量和快照节点数组,用于支持快照功能。
在表头或表尾插入元素:根据情况选择头部或尾部的 ziplist,并在 ziplist 的头部或尾部插入元素。
在表头或表尾删除元素:根据情况选择头部或尾部的 ziplist,并在 ziplist 的头部或尾部删除元素。
按索引获取元素:首先根据索引定位到对应的 quicklistNode,然后在 quicklistNode 的 ziplist 中按照索引获取元素。
范围查询元素:首先根据起始索引定位到对应的 quicklistNode,然后在 quicklistNode 的 ziplist 中按照范围查询元素。
插入或删除元素时,如果某个 quicklistNode 的元素个数超过了指定的阈值,可以选择将该 quicklistNode 压缩为一个新的 quicklistNode,以减少内存占用。
支持快照功能,可以在快表中的任意位置插入一个快照节点,用于快速恢复数据。
我们已经知道,ziplist
大小受到list-max-ziplist-size
参数的限制。按照正值和负值有两种情况:
当这个参数取正值的时候,就是恰好表示一个quicklistNode结构中zl所指向的ziplist所包含的数据项的最大值。list-max-ziplist-size
参数是由quicklist结构的fill字段来存储的,而fill字段是16bit,所以它所能表达的值能够用16bit来表示。
当这个参数取负值的时候,能够表示的ziplist最大长度是64 Kb。而ziplist中每一个数据项,最少需要2个字节来表示:1个字节的prevrawlen,1个字节的data(len字段和data合二为一;详见上一篇)。所以,ziplist中数据项的个数不会超过32 K,用16bit来表达足够了。
实际上,在目前的quicklist的实现中,ziplist的大小还会受到另外的限制,根本不会达到这里所分析的最大值。
在快表中,每个节点的大小是固定的。因此,当节点中的元素数量增加时,需要动态地添加新的节点来存储数据,这样可以保持快表的高效性。
Redis中的快表支持以下常用的操作:
quicklist *ql = quicklistNew();
quicklistPushTail(ql, s, len);
其中,s是一个字节数组,len是字节数组的长度,表示在快表的尾部添加一个字节数组元素。
quicklistPushTail(ql, &value, sizeof(value));
其中,value是一个整数,表示在快表的尾部添加一个整数元素。
quicklistDelIndex(ql, node, index);
其中,node是指向要删除的节点的指针,index是节点中要删除元素的下标。
for (quicklistNode *node = ql->head; node; node = node->next) {
unsigned char *data = NULL;
unsigned int sz;
long long val;
int ret = quicklistGet(node, &data, &sz, &val);
if (ret == -1) {
printf("data: %s, size: %d\n", data, sz);
} else {
printf("value: %lld\n", val);
}
}
其中,node是指向当前节点的指针,data是节点中的字节数组元素,sz是字节数组元素的长度,val是节点中的整数元素。
unsigned long quicklistCount(const quicklist *ql);
以上是常用的快表操作,还有其他的操作可以参考Redis源代码中的quicklist.h和quicklist.c文件。
《Redis从入门到精通【高阶篇】之底层数据结构简单动态字符串(SDS)详解》
《Redis从入门到精通【高阶篇】之底层数据结构压缩列表(ZipList)详解》
《Redis从入门到精通【进阶篇】之数据类型Stream详解和使用示例》