跳表全称叫做跳跃表,简称跳表。跳表是一个随机化的数据结构,实质就是一种可以进行二分查找的有序链表。跳表在原有的有序链表上面增加了多级索引,通过索引来实现快速查找。跳表不仅能提高搜索性能,同时也可以提高插入和删除操作的性能。
Skip List(跳跃列表)这种随机的数据结构,可以看做是一个二叉树的变种,它在性能上与红黑树、AVL树很相近;但是Skip List(跳跃列表)的实现相比前两者要简单很多,目前Redis的zset实现采用了Skip List(跳跃列表)(其它还有LevelDB等也使用了跳跃列表)。
RBT红黑树与Skip List(跳跃列表)简单对比:
RBT红黑树
Skip List跳跃列表
这里贴出Skip List的论文,需要详细研究的请看论文,下文部分公式、代码、图片出自该论文。
_Skip Lists: A Probabilistic Alternative to Balanced Trees _
https://www.cl.cam.ac.uk/teaching/2005/Algorithms/skiplists.pdf
先通过一张动图来了解Skip List的插入节点元素的流程,此图来自维基百科。
首先分析的是执行插入操作时计算随机数的过程,这个过程会涉及层数的计算,所以十分重要。对于节点他有如下特性:
计算随机层数的伪代码:
论文中的示例
Java版本
public int randomLevel(){ int level = 1; // random()返回一个[0...1)的随机数 while (random() < p && level < MaxLevel){ level += 1; } return level; }
代码中包含两个变量P和MaxLevel,在Redis中这两个参数的值分别是:
p = 1/4 MaxLevel = 64
Skip List属于空间换时间的数据结构,这里的空间指的就是每个节点包含的指针数目,这一部分是额外的内内存开销,可以用来度量空间复杂度。random()是个随机数,因此产生越高的节点层数,概率越低(Redis标准源码中的晋升率数据1/4,相对来说Skip List的结构是比较扁平的,层高相对较低)。其定量分析如下:
得出节点的平均层数(节点包含的平均指针数目):
所以Redis中p=1/4计算的平均指针数目为1.33
以下推算来自论文内容
假设p=1/2,在以p=1/2生成的16个元素的跳过列表中,我们可能碰巧具有9个元素,1级3个元素,3个元素3级元素和1个元素14级(这不太可能,但可能会发生)。我们该怎么处理这种情况?如果我们使用标准算法并在第14级开始我们的搜索,我们将会做很多无用的工作。那么我们应该从哪里开始搜索?此时我们假设SkipList中有n个元素,第L层级元素个数的期望是1/p个;每个元素出现在L层的概率是p^(L-1), 那么第L层级元素个数的期望是 n * (p^L-1);得到1 / p =n * (p^L-1)
1 / p = n * (p^L-1) n = (1/p)^L L = log(1/p)^n
所以我们应该选择MaxLevel = log(1/p)^n
定义:MaxLevel = L(n) = log(1/p)^n
推算Skip List的时间复杂度,可以用逆向思维,从层数为i的节点x出发,返回起点的方式来回溯时间复杂度,节点x点存在两种情况:
设C(k) = 在无限列表中向上攀升k个level的搜索路径的预期成本(即长度)那么推演如下:
C(0)=0 C(k)=(1-p)×(情况b的查找长度) + p×(情况c的查找长度) C(k)=(1-p)(C(k)+1) + p(C(k-1)+1) C(k)=1/p+C(k-1) C(k)=k/p
上面推演的结果可知,爬升k个level的预期长度为k/p,爬升一个level的长度为1/p。
由于MaxLevel = L(n), C(k) = k / p,因此期望值为:(L(n) – 1) / p;将L(n) = log(1/p)^n 代入可得:(log(1/p)^n - 1) / p;将p = 1 / 2 代入可得:2 * log2^n - 2,即O(logn)的时间复杂度。
Skip List跳跃列表通常具有如下这些特性
假设初始Skip List跳跃列表中已经存在这些元素,他们分布的结构如下所示:
此时查询节点88,它的查询路线如下所示:
Skip List的初始结构与2.3中的初始结构一致,此时假设插入的新节点元素值为90,插入路线如下所示:
删除的流程就是查询到节点,然后删除,重新将删除节点左右两边的节点以链表的形式组合起来即可,这里不再画图
实现一个Skip List比较简单,主要分为两个步骤:
Node节点类主要包括如下重要属性:
package com.liziba.skiplist; /** * <p> * 跳表节点元素 * </p> * * @Author: Liziba * @Date: 2021/7/5 21:01 */ public class Node { /** 节点的分数值,根据分数值来排序 */ public Double score; /** 节点存储的真实数据 */ public String value; /** 当前节点的 前、后、下、上节点的引用 */ public Node prev, next, down, up; public Node(Double score) { this.score = score; prev = next = down = up = null; } public Node(Double score, String value) { this.score = score; this.value = value; } }
SkipList主要包括如下重要属性:
package com.liziba.skiplist; import java.util.Random; /** * <p> * 跳表实现 * </p> * * @Author: Liziba */ public class SkipList { /** 最上层头节点 */ public Node head; /** 最上层尾节点 */ public Node tail; /** 总层数 */ public int level; /** 元素个数 */ public int size; public Random random; public SkipList() { level = size = 0; head = new Node(null); tail = new Node(null); head.next = tail; tail.prev = head; } /** * 查询插入节点的前驱节点位置 * * @param score * @return */ public Node fidePervNode(Double score) { Node p = head; for(;;) { // 当前层(level)往后遍历,比较score,如果小于当前值,则往后遍历 while (p.next.value == null && p.prev.score <= score) p = p.next; // 遍历最右节点的下一层(level) if (p.down != null) p = p.down; else break; } return p; } /** * 插入节点,插入位置为fidePervNode(Double score)前面 * * @param score * @param value */ public void insert(Double score, String value) { // 当前节点的前置节点 Node preNode = fidePervNode(score); // 当前新插入的节点 Node curNode = new Node(score, value); // 分数和值均相等则直接返回 if (curNode.value != null && preNode.value != null && preNode.value.equals(curNode.value) && curNode.score.equals(preNode.score)) { return; } preNode.next = curNode; preNode.next.prev = curNode; curNode.next = preNode.next; curNode.prev = preNode; int curLevel = 0; while (random.nextDouble() < 1/2) { // 插入节点层数(level)大于等于层数(level),则新增一层(level) if (curLevel >= level) { Node newHead = new Node(null); Node newTail = new Node(null); newHead.next = newTail; newHead.down = head; newTail.prev = newHead; newTail.down = tail; head.up = newHead; tail.up = newTail; // 头尾节点指针修改为新的,确保head、tail指针一直是最上层的头尾节点 head = newHead; tail = newTail; ++level; } while (preNode.up == null) preNode = preNode.prev; preNode = preNode.up; Node copy = new Node(null); copy.prev = preNode; copy.next = preNode.next; preNode.next.prev = copy; preNode.next = copy; copy.down = curNode; curNode.up = copy; curNode = copy; ++curLevel; } ++size; } /** * 查询指定score的节点元素 * @param score * @return */ public Node search(double score) { Node p = head; for (;;) { while (p.next.score != null && p.next.score <= score) p = p.next; if (p.down != null) p = p.down; else // 遍历到最底层 if (p.score.equals(score)) return p; return null; } } /** * 升序输出Skip List中的元素 (默认升序存储,因此从列表head往tail遍历) */ public void dumpAllAsc() { Node p = head; while (p.down != null) { p = p.down; } while (p.next.score != null) { System.out.println(p.next.score + "-->" + p.next.value); p = p.next; } } /** * 降序输出Skip List中的元素 */ public void dumpAllDesc() { Node p = tail; while (p.down != null) { p = p.down; } while (p.prev.score != null) { System.out.println(p.prev.score + "-->" + p.prev.value); p = p.prev; } } /** * 删除Skip List中的节点元素 * @param score */ public void delete(Double score) { Node p = search(score); while (p != null) { p.prev.next = p.next; p.next.prev = p.prev; p = p.up; } } }