基于redis5.0
整数集合(intset)是集合键的底层实现之一: 当一个集合只包含整数值元素, 并且这个集合的元素数量不多时, Redis 就会使用整数集合作为集合键的底层实现
redis> SADD numbers 1 3 5 7 9
(integer) 5
redis> OBJECT ENCODING numbers
"intset"
整数集合(intset)是 Redis 用于保存整数值的集合抽象数据结构, 它可以保存类型为 int16_t
、 int32_t
或者 int64_t
的整数值, 并且保证集合中不会出现重复元素
// intset.h
typedef struct intset {
//决定contents数组中保存的类型
uint32_t encoding;
// 集合包含的元素数量
uint32_t length;
// 保存元素的数组
int8_t contents[];
} intset;
虽然 intset
结构将 contents
属性声明为 int8_t
类型的数组, 但实际上 contents
数组并不保存任何 int8_t
类型的值 —— contents
数组的真正类型取决于 encoding
属性的值:
encoding
属性的值为 INTSET_ENC_INT16
, 那么 contents 就是一个 int16_t
类型的数组encoding
属性的值为 INTSET_ENC_INT32
, 那么 contents 就是一个 int32_t
类型的数组encoding
属性的值为 INTSET_ENC_INT64
, 那么 contents 就是一个 int64_t
类型的数组每当我们要将一个新元素添加到整数集合里面, 并且新元素的类型比整数集合现有所有元素的类型都要长时, 整数集合需要先进行升级(upgrade), 然后才能将新元素添加到整数集合里面
假设现在有一个 INTSET_ENC_INT16
编码的整数集合, 集合中包含三个 int16_t
类型的元素, 如图 6-3 所示
每个元素都占用 16 位空间, 所以整数集合底层数组的大小为 3 * 16 = 48 位, 图 6-4 展示了整数集合的三个元素在这 48 位里的位置
假设我们要将类型为 int32_t
的整数值 65535
添加到整数集合里面, 因为 65535
的类型 int32_t
比整数集合当前所有元素的类型都要长, 所以在将 65535
添加到整数集合之前, 程序需要先对整数集合进行升级
升级首先要做的是, 根据新类型的长度, 以及集合元素的数量(包括要添加的新元素在内), 对底层数组进行空间重分配
程序将整数集合 encoding
属性的值从 INTSET_ENC_INT16
改为 INTSET_ENC_INT32
, 并将 length
属性的值从 3 改为 4 , 设置完成之后的整数集合如图 6-10 所示。
升级之后新元素的摆放位置
因为引发升级的新元素的长度总是比整数集合现有所有元素的长度都大, 所以这个新元素的值要么就大于所有现有元素, 要么就小于所有现有元素:
- 在新元素小于所有现有元素的情况下, 新元素会被放置在底层数组的最开头(索引 0 );
- 在新元素大于所有现有元素的情况下, 新元素会被放置在底层数组的最末尾(索引 length-1 )。
我们一般只使用 int16_t
类型的数组来保存 int16_t
类型的值, 只使用 int32_t
类型的数组来保存 int32_t
类型的值, 诸如此类。
但是, 因为整数集合可以通过自动升级底层数组来适应新元素, 所以我们可以随意地将 int16_t
、 int32_t
或者 int64_t
类型的整数添加到集合中, 而不必担心出现类型错误
整数集合现在的做法既可以让集合能同时保存三种不同类型的值, 又可以确保升级操作只会在有需要的时候进行, 这可以尽量节省内存。
比如说, 如果我们一直只向整数集合添加 int16_t
类型的值, 那么整数集合的底层实现就会一直是 int16_t
类型的数组, 只有在我们要将 int32_t
类型或者 int64_t
类型的值添加到集合时, 程序才会对数组进行升级
整数集合不支持降级操作, 一旦对数组进行了升级, 编码就会一直保持升级后的状态
intset
的API实现创建一个空的整数集合:
/* Create an empty intset. */
intset *intsetNew(void) {
intset *is = zmalloc(sizeof(intset));
is->encoding = intrev32ifbe(INTSET_ENC_INT16);
is->length = 0;
return is;
}
向整数集合中添加元素:
/* Insert an integer in the intset */
intset *intsetAdd(intset *is, int64_t value, uint8_t *success) {
uint8_t valenc = _intsetValueEncoding(value);
uint32_t pos;
if (success) *success = 1;
/* Upgrade encoding if necessary. If we need to upgrade, we know that
* this value should be either appended (if > 0) or prepended (if < 0),
* because it lies outside the range of existing values. */
if (valenc > intrev32ifbe(is->encoding)) {
/* This always succeeds, so we don't need to curry *success. */
return intsetUpgradeAndAdd(is,value);
} else {
/* Abort if the value is already present in the set.
* This call will populate "pos" with the right position to insert
* the value when it cannot be found. */
if (intsetSearch(is,value,&pos)) {
if (success) *success = 0;
return is;
}
is = intsetResize(is,intrev32ifbe(is->length)+1);
if (pos < intrev32ifbe(is->length)) intsetMoveTail(is,pos,pos+1);
}
_intsetSet(is,pos,value);
is->length = intrev32ifbe(intrev32ifbe(is->length)+1);
return is;
}
从整数集合删除一个元素:
/* Delete integer from intset */
intset *intsetRemove(intset *is, int64_t value, int *success) {
uint8_t valenc = _intsetValueEncoding(value);
uint32_t pos;
if (success) *success = 0;
if (valenc <= intrev32ifbe(is->encoding) && intsetSearch(is,value,&pos)) {
uint32_t len = intrev32ifbe(is->length);
/* We know we can delete */
if (success) *success = 1;
/* Overwrite value with tail and update length */
if (pos < (len-1)) intsetMoveTail(is,pos+1,pos);
is = intsetResize(is,len-1);
is->length = intrev32ifbe(len-1);
}
return is;
}