• 数据结构之跳表


    写在前面

    跳表,链表版本的二分查找,具备高效的数据插入,查找,删除,范围查询等优点。是一种高效的数据结构。本文一起来看下。

    1:什么是跳表

    我们知道数组具备随机访问的特性,因此使用其可以很方便的实现二分查找算法,但是链表是不支持随机访问的,但是如果我们对链表增加索引,让其支持随机访问(这里的随机是一定程度上的随机,也可以说是假随机),那么这种经过了一定改造之后的链表,我们就可以称之为跳表。接下来看下这个索引是怎么加的,又是如何实现高效的查找的,假设我们有一个链表,如下:

    在这里插入图片描述

    此时如果是我们要查找16,则需要查找10个节点,为1->3->4->5->7->8->9->10->13->16,这个时候我们想一下,如果是此时的数据结构是数组,使用二分是怎么查找的呢?肯定是arr[6]=9,这样我们就跳过了{0,5}的元素,避免对其进行无效的遍历,那么链表如何实现这个arr[6]=9的效果呢?,如果是在第一个元素有一个指向位置6的引用,即我们在原始链表的基础上再抽象出一层索引,如下图:

    在这里插入图片描述

    那么此时查找16的步骤就是1->4->7->9->13->13(通过down访问)->16,这样子就只需要访问7个节点,因为这里我们数据少,所以效果还不是很明显,试想一下,假设在1和4之间有1001个节点,4和7之间有1001个节点,则原始访问的节点数就是2010,此时相比于增加了索引后访问的节点数16是不是就少多了。当然实际上当数据量比较多时,我们就需要增加多层索引,比如像下面这样增加3层索引:

    在这里插入图片描述

    可以看到了,上面这种在链表的基础上增加了索引的数据结构,就是跳表。

    1.1:查询的时间复杂度

    O(logn)。

    1.2:空间复杂度

    O(n),这样看起来是空间消耗会增加一倍,但是实际上,索引节点中并非存储所有的数据,比如原始节点存储的是(userid,username,age),在索引中存储的可能仅仅是(userid),所以实际的空间消耗肯定是远远小于原始空间的一倍的,另外在实际的工组中,这种空间换时间的方案也是我们采取最多的,因为空间一般都是非常充足的。

    1.3:程序实现

    源码

    程序实现可以参考下图:

    在这里插入图片描述

    其中最左侧的一列对应的就是程序中的dongshi.daddy.skiplist.SkipList#insertSkipListNode[] updates = new SkipListNode[MAX_LEVEL];,是核心,用来发起查找的过程。

    写在后面

  • 相关阅读:
    【计划书】软件项目计划书(Word原件直接套用)
    怎么测试服务器访问速度
    基于Pytorch的图卷积网络GCN实例应用及详解3.0
    Flink 实时数仓(一)【实时数仓&离线数仓对比】
    基于主动视觉机制的深度学习--一个综合池化框架
    Apache Maven 3.6.0的下载安装和环境配置(详细图解+不限速下载链接)
    云原生应用平台的核心模块有哪些
    Windows下搜索文件内容的关键字用什么命令
    Mysql整理-主从复制
    九、性能测试之网络测试
  • 原文地址:https://blog.csdn.net/wang0907/article/details/127107229