【学习笔记】Redis中有序集合zset的实现原理——跳表

面试的时候被问到了有序集合zset的实现原理,本以为是基于红黑树实现的,其实是基于跳表(skipList)实现的。本文主要讲解什么是跳表,它是怎么查找、插入和删除元素的,相比于红黑树它有哪些优劣。

本文参考了文章redis中的Zset原理。

1. 跳表

(1) 跳表是什么

跳表是一种多层的有序链表。先考虑一种特殊情况下的跳表,如下图所示。从底往上分别是第1~4层,第1层用链表有序地存放所有元素,然后从第 i i i 层每隔1个元素取一个元素形成第 i + 1 i+1 i+1 层的有序链表,并增加第 i + 1 i+1 i+1 层链表节点指向第 i i i 层对应节点的指针。这样的话,第 i + 1 i+1 i+1 层链表节点个数为第 i i i 层的一半。

在这里插入图片描述

在实际实现时,每一列并不是分成多个链表节点,而是如下图所示的样子,一个节点对应上图中的一列,在一个节点中设置多个指向其下方和右方节点的指针。这样只用增加指针而避免了节点值的重复存储。只是上图中这种表示方式更容易理解一点。

这里写图片描述

(2) 跳表的查询

在这里插入图片描述

还是看上面这个图,如果要搜索46,从高层往下依次搜索。

  • 第4层:从头节点搜索一次,找到55,46比55小,故从头节点的位置往下层搜索;
  • 第3层:从头节点搜搜一次,找到21,46比21大,继续往后搜索找到55,46比55小,故从21的位置往下层搜索;
  • 第2层:从21节点搜索一次,找到37,46比37大,继续往后搜索找到55,46比55小,故从37的位置往下层搜索;
  • 第1层:从37节点搜索一次,找到46,恰为要找的节点,且已经到最底层,搜索结束。

可以发现,搜索的平均时间复杂度为O(log n),这是由于每在上层搜索一次就平均缩小了一半的搜索范围。

(3) 跳表的插入

在插入元素时,先找到要插入元素的位置,然后进行插入。但是如果采用前面说的从第 i i i 层每隔1个元素取一个元素形成第 i + 1 i+1 i+1 层的有序链表的方式的话,就需要插入后进行调整,这样比较麻烦。所以在实际实现时,采用了一种随机确定要插入元素的高度的方法,即第1层一定会插入,所以节点高度最小值为1,节点高度为2的概率为0.5,高度为3的概率为0.25……这样就保证了第 i + 1 i+1 i+1 层链表节点个数约为第 i i i 层的一半。高度随机算法的代码如下:

int random_level()  
{
    level = 1;
    # 随机生成0或1,若为1则level++,反之结束循环
    while(random(0,1))  
    {
        level++;
    }
    return level;  
}

更具体地,类似于查询的过程,从最高层到最底层依次查询到新增节点要插入的位置,如果当前层的高度小于等于新增节点高度,则进行插入。整个插入的平均时间复杂度为O(log n)。

(4) 跳表的删除

与插入操作类似,不再赘述

2. 与红黑树的对比

相比于红黑树,跳表的优点有:

  • 查询复杂度两者相同,都为O(log n)
  • 插入和删除的时间复杂度两者相同,都为O(log n),但红黑树插入、删除后需要进行调整,操作较为复杂,而跳表只需要插入节点的相邻节点
  • 跳表更适合进行范围查询,只要找到范围的最小值,然后在第一层遍历即可
  • 跳表的整体实现要比红黑树简单

你可能感兴趣的:(后端开发,redis,链表,跳表,zset,有序集合)