目录
1.什么是跳表 - Skiplist
2.skiplist的效率如何保证?
3.Skiplist实现
(1)整体代码
(2)节点设计
(3) Skiplist成员变量 和 构造函数
(4)search函数,查找数据
(5)FindPrevNode函数
(6)add函数
(7)erase函数
(8)获取随机数函数
4.skiplist跟平衡搜索树和哈希表的对比
①上面说到,skiplist插入一个节点时随机出一个层数,听起来怎么这么随意,如何保证搜索时的效率呢?
③在Redis的skiplist实现中,这两个参数的取值为:
p = 1/4
maxLevel = 32
④根据前面randomLevel()的伪码,我们很容易看出,产生越高的节点层数,概率越低。定量的分析如下:
补充文章,帮助理解http://zhangtielei.com/posts/blog-redis-skiplist.html
#include
#include
#include
#include
#include
using namespace std;
namespace XM
{
struct SkiplistNode
{
int _val;
vector _nextV;
SkiplistNode(int val, int level)
:_val(val)
, _nextV(level, nullptr)
{}
};
class Skiplist
{
typedef SkiplistNode Node;
public:
Skiplist()
{
srand(time(0)); //C语言获取随机值
//头结点,刚开始给1层 ; 后序有效的最高层变了,层数会提高
_head = new Node(-1, 1);
}
bool search(int target)
{
Node* cur = _head;
int level = _head->_nextV.size() - 1; //这里表示最上层下标
//结束条件 - 画图
while (level >= 0)
{
// 目标值比下一个节点值要大,向右走
// 下一个节点是空(尾) / 目标值比下一个节点值要小,向下走
if (cur->_nextV[level] && cur->_nextV[level]->_val < target)
{
//向右走
cur = cur->_nextV[level];
}
else if (cur->_nextV[level] == nullptr || cur->_nextV[level]->_val > target)
{
//向下走
level--;
}
else
{
return true;
}
}
return false;
}
//添加新的Node 要找到每一层前面的Node
vector FindPrevNode(int num)
{
Node* cur = _head;
int level = _head->_nextV.size() - 1; //最高层的下标
// 初始化,前一个节点指针都为_head
vector prevV(level + 1, _head);
//和search有点像
while (level >= 0)
{
// 目标值比下一个节点值要大,向右走
// 下一个节点是空(尾) / 目标值比下一个节点值要小,向下走
if (cur->_nextV[level] && cur->_nextV[level]->_val < num)
{
//向右走,层没有变
cur = cur->_nextV[level];
}
else if (cur->_nextV[level] == nullptr || cur->_nextV[level]->_val >= num)
{
//向下走之前记录当前层Node
prevV[level] = cur;
//向下走
level--;
}
}
return prevV;
}
void add(int num)
{
//获取前一个Node的集合
vector prevV = FindPrevNode(num);
//构造新节点并初始化,随机获取层数
int n = RandomLevel();
Node* newNode = new Node(num, n);
// 如果n超过当前最大的层数,那就升高一下_head的层数
//为什么不一开始就把head升到最高?
//一开始升到最高,后序的查找有很多是无用的,如果要提高效率还需要一个变量记录当前最高层是什么
//所以我们不直接把head升到最高,且利用一个变量记录最高层,当新插入数据的层数 > 最高层时我们只需要增加层数即可
if (n > _head->_nextV.size())
{
_head->_nextV.resize(n, nullptr); //后面多开的空间填充nullptr,之前的空间值不变
prevV.resize(n, _head);
}
for (int i = 0; i < n; ++i)
{
newNode->_nextV[i] = prevV[i]->_nextV[i];
prevV[i]->_nextV[i] = newNode;
}
}
bool erase(int num)
{
vector prevV = FindPrevNode(num);
//val不在表中 或者 第一层的下一个不是val这两种情况
if (prevV[0]->_nextV[0] == nullptr || prevV[0]->_nextV[0]->_val != num)
{
return false;
}
else
{
Node* del = prevV[0]->_nextV[0];
//将del前后的每一层指针连接起来
for (size_t i = 0; i < del->_nextV.size(); ++i)
{
prevV[i]->_nextV[i] = del->_nextV[i];
}
delete del;
//如果删除的有最高层节点,把头结点层数降一下
int i = _head->_nextV.size() - 1;
while (i >= 0)
{
if (_head->_nextV[i] == nullptr)
{
--i;
}
else
{
break;
}
}
//重新调整_nextV的大小
_head->_nextV.resize(i + 1);
return true;
}
}
int RandomLevel_C() //C语言随机产生数字
{
size_t level = 1;
// rand() ->[0, RAND_MAX]之间
while (rand() <= RAND_MAX * _p && level < _maxLevel)
{
++level;
}
return level;
}
int RandomLevel() //C++11随机产生数字,是均匀分布的
{
//定义成静态的只会在第一次调用时跑一次,后面再次调用就不会跑了
static std::default_random_engine generator(std::chrono::system_clock::now().time_since_epoch().count());
static std::uniform_real_distribution distribution(0.0, 1.0);
size_t level = 1;
while (distribution(generator) <= _p && level < _maxLevel)
{
++level;
}
return level;
}
//打印出来那个结构
void Print()
{
Node* cur = _head;
while (cur)
{
printf("%-2d\n", cur->_val);
// 打印每个每个cur节点
for (auto e : cur->_nextV)
{
printf("%2s", "↓");
}
printf("\n");
cur = cur->_nextV[0];
}
}
private:
Node* _head;
size_t _maxLevel = 32;
double _p = 0.25;
};
//验证随机数是均匀分布的
void RandomTest()
{
//定义成静态的只会在第一次调用时跑一次,后面再次调用就不会跑了
static std::default_random_engine generator(std::chrono::system_clock::now().time_since_epoch().count());
static std::uniform_real_distribution distribution(0.0, 1.0);
size_t count = 0;
for (int i = 0; i < 1000; ++i)
{
if (distribution(generator) <= 0.25)
{
++count;
}
}
cout << count << endl;
}
}
struct SkiplistNode
{
int _val;
vector _nextV;
SkiplistNode(int val, int level)
:_val(val)
, _nextV(level, nullptr)
{}
};
public:
Skiplist()
{
srand(time(0)); //C语言获取随机值
//头结点,刚开始给1层 ; 后序有效的最高层变了,层数会提高
_head = new Node(-1, 1);
}
private:
Node* _head; //头结点
size_t _maxLevel = 32; //设置节点最高层
double _p = 0.25; //设置多增加一层的概率p
①查找数据示意图
②代码思路
③模拟实现
bool search(int target)
{
Node* cur = _head;
int level = _head->_nextV.size() - 1; //这里表示最上层下标
//结束条件 - 画图
while (level >= 0)
{
// 目标值比下一个节点值要大,向右走
// 下一个节点是空(尾) / 目标值比下一个节点值要小,向下走
if (cur->_nextV[level] && cur->_nextV[level]->_val < target)
{
//向右走
cur = cur->_nextV[level];
}
else if (cur->_nextV[level] == nullptr || cur->_nextV[level]->_val > target)
{
//向下走
level--;
}
else
{
return true;
}
}
return false;
}
①设计该函数的目的
②函数设计思路
③假设找 num = 19 ,过程如图示
④代码实现
//添加新的Node 要找到每一层前面的Node
vector FindPrevNode(int num)
{
Node* cur = _head;
int level = _head->_nextV.size() - 1; //最高层的下标
// 初始化,前一个节点指针都为_head
vector prevV(level + 1, _head);
//和search有点像
while (level >= 0)
{
// 目标值比下一个节点值要大,向右走
// 下一个节点是空(尾) / 目标值比下一个节点值要小,向下走
if (cur->_nextV[level] && cur->_nextV[level]->_val < num)
{
//向右走,层没有变
cur = cur->_nextV[level];
}
else if (cur->_nextV[level] == nullptr || cur->_nextV[level]->_val >= num)
{
//向下走之前记录当前层Node
prevV[level] = cur;
//向下走
level--;
}
}
return prevV;
}
①函数设计思路
②为什么不一开始就把_head层数升到最高?
③代码实现
void add(int num)
{
//获取前一个Node的集合
vector prevV = FindPrevNode(num);
//构造新节点并初始化,随机获取层数
int n = RandomLevel();
Node* newNode = new Node(num, n);
// 如果n超过当前最大的层数,那就升高一下_head的层数
//为什么不一开始就把head升到最高?
//一开始升到最高,后序的查找有很多是无用的,如果要提高效率还需要一个变量记录当前最高层是什么
//所以我们不直接把head升到最高,且利用一个变量记录最高层,当新插入数据的层数 > 最高层时我们只需要增加层数即可
if (n > _head->_nextV.size())
{
_head->_nextV.resize(n, nullptr); //后面多开的空间填充nullptr,之前的空间值不变
prevV.resize(n, _head);
}
for (int i = 0; i < n; ++i)
{
newNode->_nextV[i] = prevV[i]->_nextV[i];
prevV[i]->_nextV[i] = newNode;
}
}
①函数设计思路
②代码实现
bool erase(int num)
{
vector prevV = FindPrevNode(num);
//val不在表中 或者 第一层的下一个不是val这两种情况
if (prevV[0]->_nextV[0] == nullptr || prevV[0]->_nextV[0]->_val != num)
{
return false;
}
else
{
Node* del = prevV[0]->_nextV[0];
//将del前后的每一层指针连接起来
for (size_t i = 0; i < del->_nextV.size(); ++i)
{
prevV[i]->_nextV[i] = del->_nextV[i];
}
delete del;
//如果删除的有最高层节点,把头结点层数降一下
int i = _head->_nextV.size() - 1;
while (i >= 0)
{
if (_head->_nextV[i] == nullptr)
{
--i;
}
else
{
break;
}
}
//重新调整_nextV的大小
_head->_nextV.resize(i + 1);
return true;
}
}
①利用C语言提供的函数获取
②利用C++11 提供的函数
③代码实现
int RandomLevel_C() //C语言随机产生数字
{
size_t level = 1;
// rand() ->[0, RAND_MAX]之间
while (rand() <= RAND_MAX * _p && level < _maxLevel)
{
++level;
}
return level;
}
int RandomLevel() //C++11随机产生数字,是均匀分布的
{
//定义成静态的只会在第一次调用时跑一次,后面再次调用就不会跑了
static std::default_random_engine generator(std::chrono::system_clock::now().time_since_epoch().count());
static std::uniform_real_distribution distribution(0.0, 1.0);
size_t level = 1;
while (distribution(generator) <= _p && level < _maxLevel)
{
++level;
}
return level;
}
(1)skiplist相比平衡搜索树(AVL树和红黑树)对比,都可以做到遍历数据有序,时间复杂度也差不多。skiplist的优势是:
(2) skiplist相比哈希表而言,就没有那么大的优势了。相比而言
(3)skiplist优势如下:
(4)小结