整数集合

intset(整数集合)是集合键的底层实现之一,当一个集合只包含整数,并且数量不多的时候,Redis就会使用整数集合作为集合键的底层实现

整数集合的实现

intset是Redis中用来保存整数值的集合抽象数据结构,可以保存int16_t,int32_t,int64_t的整数值,并且保证集合中不会出现重复的,从小到大有序排序

typedef struct intset{
  //编码方式
  uint32_t encoding;
  //集合包含的元素数量
  uint32_t length;
  //保存元素的数组
  int8_t contents[];
}intset;

contents数组的真正类型取决于encoding属性的值:

encoding:INTSET_ENC_INT16,那么contents就是一个int16_t类型的数组(-32768到32767)

encoding:INTSET_ENC_INT32,那么contents就是一个int32_t类型的数组(-2147483648到2147483647)

encoding:INTSET_ENC_INT64,那么contents就是一个int64_t类型的数组(-9223372036854775808到9223372036854775807)

包含int16_t类型整数值的整数集合

contents数组的大小等于sizeof(int16_t)*5=16*5=80位

升级

当我们要将一个新元素添加到整数集合中,并且新元素的类型比整数集合现有的所有元素类型都要长的时候,整数集合需要先进行升级,然后才能将新元素添加到整数集合中

升级步骤:

  1. 根据新元素的类型,扩展整数集合底层数组的空间大小,并为新元素分配空间

  2. 把底层数组现有的所有元素都转换为与新元素相同的类型,并将类型转换后的元素放到正确的位上,而且在防止元素的过程中,需要维持底层数组的有序性不变

  3. 将新元素添加到底层数组中

举例:


包含3个int16_t类型的整数

contents底层数组大小3*16=48,下面是3个元素在48位中的位置

0-15位 16到31位 32到47位
元素 1 2 3

将65535添加进去,这个是int32_t类型的,所以要对contents进行升级

对底层数组做空间重分配,32*4=128位

0-15位 16到31位 32到47位 48到127位
元素 1 2 3 新分配空间
0-15位 16到31位 32到47位 48到63位 64到95位 96到127位
元素 1 2 3 新分配空间 3 新分配空间
0-15位 16到31位 32到63位 64到95位 96到127位
元素 1 2 2 3 新分配空间
0-31位 32到63位 64到95位 96到127位
元素 1 2 3 新分配空间
0-31位 32到63位 64到95位 96到127位
元素 1 2 3 65535

升级的好处

  1. 提升整数集合的灵活性

c语言是静态类型语言,为了避免类型错误,通常不会将两种不同类型的值放到一个数据结构中,但是通过自动升级底层数组来适应新元素,可以随意将int16_t,int32_t,int64_t类型的整数添加到集合中,不必担心类型错误

  1. 尽可能的节约内存

如果直接使用int64_t作为底层数组的实现,当然可以同时保持所有了,但是如果存的都是int16_t,或者都是int32_t类型的值,就会浪费内存了,而升级只会让他在需要的时候进行升级,这样可以尽量节省内存

降级

intset不支持降级操作,一旦对数组做了升级,编码就会一直保持升级后的状态,即使将int64_t类型的数删除了,编码仍然是int64_t

整数集合API

函数 作用 时间复杂度
intsetNew 创建一个新的压缩列表 O(1)
intsetAdd 将给定元素添加到整数集合中 O(N)
intsetRemove 从整数集合中移除给定元素 O(N)
intsetFind 检查给定值是否存在于集合中 有序,可以通过二分查找O(logN)
intsetRandom 从整数集合中随机返回一个元素 O(1)
intsetGet 取出底层数组在给定索引上的元素 O(1)
intestLen 返回整数集合中包含元素的个数 O(1)
intsetBlobLen 返回整数集合占用的内存字节数 O(1)

你可能感兴趣的:(整数集合)