跳跃表的应用-redis

杜引强

2017-06-29

关注关注

为什么选择跳表

目前经常使用的平衡数据结构有：B树，红黑树，AVL树，SplayTree,Treep等。

想象一下，给你一张草稿纸，一只笔，一个编辑器，你能立即实现一颗红黑树，或者AVL树

出来吗？很难吧，这需要时间，要考虑很多细节，要参考一堆算法与数据结构之类的树，

还要参考网上的代码，相当麻烦。

用跳表吧，跳表是一种随机化的数据结构，目前开源软件Redis和LevelDB都有用到它，

它的效率和红黑树以及AVL树不相上下，但跳表的原理相当简单，只要你能熟练操作链表，

就能轻松实现一个SkipList。

有序表的搜索

考虑一个有序表：

clip_image001

从该有序表中搜索元素<23,43,59>，需要比较的次数分别为<2,4,6>，总共比较的次数

为2+4+6=12次。有没有优化的算法吗?链表是有序的，但不能使用二分查找。类似二叉

搜索树，我们把一些节点提取出来，作为索引。得到如下结构：

clip_image002

这里我们把<14,34,50,72>提取出来作为一级索引，这样搜索的时候就可以减少比较次数了。

我们还可以再从一级索引提取一些元素出来，作为二级索引，变成如下结构：

clip_image003

这里元素不多，体现不出优势，如果元素足够多，这种索引结构就能体现出优势来了。

这基本上就是跳表的核心思想，其实也是一种通过“空间来换取时间”的一个算法，通过在每个节点中增加了向前的指针，从而提升查找的效率。

跳表

下面的结构是就是跳表：

其中-1表示INT_MIN，链表的最小值，1表示INT_MAX，链表的最大值。

clip_image005

跳表具有如下性质：

(1)由很多层结构组成

(2)每一层都是一个有序的链表

(3)最底层(Level1)的链表包含所有元素

(4)如果一个元素出现在Leveli的链表中，则它在Leveli之下的链表也都会出现。

(5)每个节点包含两个指针，一个指向同一链表中的下一个元素，一个指向下面一层的元素。

跳表的搜索

clip_image007

例子：查找元素117

(1)比较21，比21大，往后面找

(2)比较37,比37大，比链表最大值小，从37的下面一层开始找

(3)比较71,比71大，比链表最大值小，从71的下面一层开始找

(4)比较85，比85大，从后面找

(5)比较117，等于117，找到了节点。

具体的搜索算法如下：

C代码clip_image009

3.find(x)

4.{

5.p=top;

6.while(1){

7.while(p->next->key<x)

8.p=p->next;

9.if(p->down==NULL)

10.returnp->next;

11.p=p->down;

12.}

13.}

跳表的插入

先确定该元素要占据的层数K（采用丢硬币的方式，这完全是随机的）

然后在Level1...LevelK各个层的链表都插入元素。

例子：插入119，K=2

clip_image011

如果K大于链表的层数，则要添加新的层。

例子：插入119，K=4

clip_image013

丢硬币决定K

插入元素的时候，元素所占有的层数完全是随机的，通过一下随机算法产生：

C代码clip_image009[1]

1.intrandom_level()

2.{

3.K=1;

5.while(random(0,1))

6.K++;

8.returnK;

9.}

相当与做一次丢硬币的实验，如果遇到正面，继续丢，遇到反面，则停止，

用实验中丢硬币的次数K作为元素占有的层数。显然随机变量K满足参数为p=1/2的几何分布，

K的期望值E[K]=1/p=2.就是说，各个元素的层数，期望值是2层。

跳表的高度。

n个元素的跳表，每个元素插入的时候都要做一次实验，用来决定元素占据的层数K，

跳表的高度等于这n次实验中产生的最大K，待续。。。

跳表的空间复杂度分析

根据上面的分析，每个元素的期望高度为2，一个大小为n的跳表，其节点数目的

期望值是2n。

跳表的删除

在各个层中找到包含x的节点，使用标准的deletefromlist方法删除该节点。

例子：删除71

clip_image015

链表 redis

杜引强

0 关注 0 粉丝 0 动态

关注关注

详解Redis数据结构之跳跃表

我们先不谈Redis，来看一下跳表。还要支持输入道具名称的精确查询和不输入名称的全量查询。拍卖行商品列表是线性的，最容易表达线性结构的是数组和链表。每个元素均关联一个double类型的score，Redis 根据score进行从小到大排序；这个是 Redi

koushr 2020-11-12

Java实现单链表、栈、队列三种数据结构

它里面的数据元素是以结点为单位，每个结点是由数据元素的数据和下一个结点的地址组成，在java集合框架里面 LinkedList、HashMap等等的底层都是用链表实现的。添加效率高：添加一个元素时，先找到插入位置的前一个，只需要将1，2个元素的连接断开，将

范范 2020-10-28

C语言有了\"链表\"还用\"数组\"干嘛?被问懵了......

本文主要跟大家分享一下数组和链表两种内存组织类型的异同，帮助大家正确理解好这两种数据结构并合理应用。在含有Cache的系统中，由于CPU的访问速度相对普通内存而言不在一个数量等级，为了不拖累CPU都会在其中间通过Cache来作为一个缓冲，可以大大提高CPU

zhaochen00 2020-10-13

十分钟带你理解C语言中的链表

首先，指针计算机中的所有内容都是数字。在C语言中创建变量时，编译器仅按地址处理它，但是在您的代码中，您可以通过两种方式访问它：按值和按地址。堆是由编译器与您的代码链接的启动代码分配的内存块。为简化起见，假设变量Times 结束于内存位置256。最后，跳过会

Mars的自语 2020-09-27

手写最简单的LRU算法

LRU最近最少使用，它的核心思想是“如果数据最近被访问过，那么将来被访问的几率也更高”。因此 LRU 算法会根据数据的历史访问记录来进行排序，如果空间不足，就会淘汰掉最近最少使用的数据。由于 LRU 算法会将最近使用的数据优先级上升，因此需要数据结构支持

steeven 2020-09-18

python/golang实现循环链表的示例代码

循环链表就是将单链表的末尾指向其头部，形成一个环。只是增加时，需要考虑空链表增加第一个节点的特殊情况；删除时需考虑删除节点是头/尾节点，和链表中只有一个节点的特殊情况。for i := 0; i < c.lenth; i++ {. if cur ==

kka 2020-09-14

python的链表基础知识点

python中的链表是一组数据项的集合，其中每个数据项都是一个节点的一部分，每个节点还包含指向下一个节点的链接。链表有两种类型：单链表和双链表。一个单独的列表元素叫做一个节点。这些节点不像数组一样都按顺序存储在内存当中，相反，你可以通过一个节点指向另外一个

qiangde 2020-09-13

PHP+Redis链表解决高并发下商品超卖问题(实现原理及步骤)

上一篇文章聊了一下使用Redis事务来解决高并发商品超卖问题，今天我们来聊一下使用Redis链表来解决高并发商品超卖问题。使用redis链表来做，因为pop操作是原子的，即使有很多用户同时到达，也是依次执行，推荐使用。trigger_error('Redi

聚沙成塔积水成渊 2020-08-16

LeetCode——合并K个排序链表

* Definition for singly-linked list.* int val;* ListNode *next;* };ListNode* mergeTwoLists(ListNode* l1, ListNode* l2) {

earthhouge 2020-08-15

拿到腾讯字节快手offer后，他的LeetCode刷题经验GitHub获1300星

今天，你刷LeetCode了吗？最近，GitHub上这样一套LeetCode笔记火了。一位Java研发工程师分享了一个名为「LeetCode题目分类与面试问题整理」，一时间获得1300星。这篇笔记的作者叫袁广鑫，面试三十多家互联网公司亲历整理，曾拿到字节、

aanndd 2020-08-12

图解！24张图彻底弄懂九大常见数据结构！原创 Amazing10 业余码农 5月24日

数据结构想必大家都不会陌生，对于一个成熟的程序员而言，熟悉和掌握数据结构和算法也是基本功之一。数据结构本身其实不过是数据按照特点关系进行存储或者组织的集合，特殊的结构在不同的应用场景中往往会带来不一样的处理效率。常用的数据结构可根据数据访问的特点分为线性结

范范 2020-07-30

Redis知识点

　　　　　　数据都在内存中，支持持久化，主要用作备份恢复除了支持简单的key-value模式，还支持多种数据结构的存储，比如　　　　　　list、set、hash、zset等。　　　　　　支持二进制数据及大型对象可以根据数据的特点替代RDBMS ，成

bluetears 2020-07-28

数据结构 & Java中的内存

顺序表，将元素顺序地存放在一块连续的存储区里，元素间的顺序关系由它们的存储顺序自然表示。链表，将元素存放在通过链接构造起来的一系列存储块中。ArrayList 的本质是对数组Object[ ] 的封装，将该数组作为它的一个属性。对 ArrayLis

mingyunxiaohai 2020-07-19

LRU算法list链表实现

LRU是Least Recently Used的缩写，即最近最少使用，是一种常用的页面置换算法，选择最近最久未使用的页面予以淘汰。该算法赋予每个页面一个访问字段，用来记录一个页面自上次被访问以来所经历的时间 t，当须淘汰一个页面时，选择现有页面中其 t 值

horizonheart 2020-07-19

MySQL 源码链表的实现

MySQL源码关于链表的实现在ut0lst.h文件中，其设计思路与常规略有不同，基本思想是指针嵌于对象之内，如下图所示。在这种实现方式下，构造一个链表需要同时指定对象类型和对象内指针节点的地址。我们对比一下C++11标准库中list的实现，发现其就是一个模

liushall 2020-07-18

MySQL索引原理

　　1.B+树的叶子节点包含了所有的数据；　　2.叶子节点可以直接访问其他叶子节点，不需要回到根节点；　　操作系统中，默认的是每一页是4KB；而InnoDB存储引擎，默认每一页是16KB；　　UserRecord（行记录）区域，保存的是真正的数据，会包含多

bluetears 2020-07-05

昨天，我彻底搞懂了Netty内存分配策略！

Netty 作为一款高性能的 RPC 框架必然涉及到频繁的内存分配销毁操作。基于此，在堆外内存使用方面，Netty 自己实现了一套创建、回收堆外内存池的相关功能。这些划分在 Netty 中的实现接口分别如下。另外 Netty 并不是直接对外暴露这些 AP

fengshantao 2020-07-02

Redis系列（六）：数据结构List双向链表LPUSH、LPOP、RPUSH、RPOP、LLEN命令

将所有指定的值插入到存于 key 的列表的头部。如果 key 不存在，那么在进行 push 操作前会创建一个空列表。如果 key 对应的值不是一个 list 的话，那么会返回一个错误。可以使用一个命令把多个元素 push 进入列表，只需在命令末尾加上多个指

liuweixiao0 2020-06-27

C语言数据结构-线性链表LinkList

for(LNode *p = L -> next; p !

waitwolf 2020-06-27

数据结构_链表及邻接表

e[idx] = b, ne[idx] = h[a], h[a] = idx++;

roseying 2020-06-25

安科网