0

0

java代码如何实现跳表及查找插入操作 java代码跳表结构的应用实现方法​

蓮花仙者

蓮花仙者

发布时间:2025-08-12 23:21:01

|

266人浏览过

|

来源于php中文网

原创

跳表相比其他数据结构的优势在于实现简单、并发性能好、平均时间复杂度稳定为o(log n);应用场景包括redis的sorted set、leveldb索引、concurrentskiplistmap等并发有序数据结构;1. 选择p=0.5作为概率因子可平衡查找效率与空间开销;2. max_level通常设为32或64,以应对海量数据并防止层数失控;删除操作与查找插入的共同点是从最高层开始定位目标节点并记录每层的前驱节点(更新路径),不同点在于删除需遍历所有层级断开指针并调整跳表实际高度,为确保正确性,必须从0层确认目标存在,并在删除后逐层更新指向前驱的指针,同时检查头节点高层是否为空以降低level值,从而维持结构一致性。

java代码如何实现跳表及查找插入操作 java代码跳表结构的应用实现方法​

跳表(Skip List)在Java中实现,主要是通过构建多层级的有序链表结构来达到高效的查找和插入。它提供了一种概率性的平衡机制,让数据操作在平均情况下能达到对数时间复杂度O(log N),而其实现复杂度远低于红黑树或AVL树这类自平衡二叉搜索树。核心在于每个节点都有一个随机生成的层级,并维护指向更高层级节点的指针,从而形成“跳跃”查找的路径。

// 解决方案:跳表的Java实现及查找插入操作

import java.util.Random;

/**
 * 跳表节点
 */
class SkipListNode> {
    T value;
    // forward[i] 指向当前节点在第 i 层的下一个节点
    SkipListNode[] forward;

    @SuppressWarnings("unchecked")
    public SkipListNode(T value, int level) {
        this.value = value;
        this.forward = new SkipListNode[level + 1]; // level是从0开始的
    }
}

/**
 * 跳表实现
 */
class SkipList> {
    private static final double P = 0.5; // 概率因子,通常取0.5或0.25
    private static final int MAX_LEVEL = 32; // 最大层数,可以根据数据量调整

    private SkipListNode head; // 头节点
    private int level; // 当前跳表的最高层级
    private Random random;

    @SuppressWarnings("unchecked")
    public SkipList() {
        this.head = new SkipListNode<>(null, MAX_LEVEL); // 头节点的值为null,层数设为最大
        this.level = 0;
        this.random = new Random();
    }

    /**
     * 随机生成新节点的层级
     * 抛硬币,直到出现反面,每出现一次正面层级加1
     */
    private int randomLevel() {
        int lvl = 0;
        while (random.nextDouble() < P && lvl < MAX_LEVEL) {
            lvl++;
        }
        return lvl;
    }

    /**
     * 插入操作
     */
    @SuppressWarnings("unchecked")
    public void insert(T value) {
        SkipListNode[] update = new SkipListNode[MAX_LEVEL + 1];
        SkipListNode current = head;

        // 从最高层开始,找到每一层插入位置的前一个节点
        for (int i = level; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value.compareTo(value) < 0) {
                current = current.forward[i];
            }
            update[i] = current; // 记录下这一层需要更新的节点
        }

        // 如果值已经存在,通常选择不插入或更新,这里选择不插入
        if (current.forward[0] != null && current.forward[0].value.compareTo(value) == 0) {
            // System.out.println("Value " + value + " already exists.");
            return;
        }

        // 生成新节点的随机层级
        int newLevel = randomLevel();

        // 如果新层级超过当前跳表的最高层级,需要更新头节点指向
        if (newLevel > level) {
            for (int i = level + 1; i <= newLevel; i++) {
                update[i] = head; // 新增的层级,头节点就是前一个节点
            }
            level = newLevel; // 更新跳表的最高层级
        }

        // 创建新节点
        SkipListNode newNode = new SkipListNode<>(value, newLevel);

        // 调整指针,将新节点插入到每一层
        for (int i = 0; i <= newLevel; i++) {
            newNode.forward[i] = update[i].forward[i];
            update[i].forward[i] = newNode;
        }
        // System.out.println("Inserted: " + value + " at level " + newLevel);
    }

    /**
     * 查找操作
     */
    public SkipListNode search(T value) {
        SkipListNode current = head;

        // 从最高层开始向下查找
        for (int i = level; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value.compareTo(value) < 0) {
                current = current.forward[i];
            }
        }

        // 到达0层,检查下一个节点是否是目标值
        current = current.forward[0];

        if (current != null && current.value.compareTo(value) == 0) {
            // System.out.println("Found: " + value);
            return current;
        } else {
            // System.out.println("Not Found: " + value);
            return null;
        }
    }

    /**
     * 删除操作(为完整性提供,但重点在查找插入)
     */
    @SuppressWarnings("unchecked")
    public void delete(T value) {
        SkipListNode[] update = new SkipListNode[MAX_LEVEL + 1];
        SkipListNode current = head;

        // 查找待删除节点,并记录每一层的前一个节点
        for (int i = level; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value.compareTo(value) < 0) {
                current = current.forward[i];
            }
            update[i] = current;
        }

        current = current.forward[0];

        // 如果找到了目标值
        if (current != null && current.value.compareTo(value) == 0) {
            // 调整指针,跳过待删除节点
            for (int i = 0; i <= level; i++) {
                if (update[i].forward[i] != current) {
                    // 如果这一层的update[i]的下一个节点不是current,说明current不在这一层,跳过
                    continue;
                }
                update[i].forward[i] = current.forward[i];
            }

            // 检查并降低跳表的最高层级
            while (level > 0 && head.forward[level] == null) {
                level--;
            }
            // System.out.println("Deleted: " + value);
        } else {
            // System.out.println("Value " + value + " not found for deletion.");
        }
    }

    // 辅助方法:打印跳表(可选)
    public void printList() {
        System.out.println("SkipList (Current Level: " + level + "):");
        for (int i = level; i >= 0; i--) {
            System.out.print("Level " + i + ": ");
            SkipListNode node = head.forward[i];
            while (node != null) {
                System.out.print(node.value + " -> ");
                node = node.forward[i];
            }
            System.out.println("NULL");
        }
        System.out.println("---");
    }
}

跳表相比其他数据结构有何优势?它的应用场景有哪些?

说实话,跳表这种数据结构,初次接触时可能觉得有点“奇葩”,全靠随机性来保证性能,这跟那些严谨的平衡树(比如红黑树、AVL树)形成了鲜明对比。但正是这种“放飞自我”的随机性,赋予了它一些独特的优势。

首先,实现起来相对简单。相较于红黑树复杂的旋转和颜色调整规则,跳表的插入和删除操作逻辑直观得多。你只需要找到要插入或删除的位置,然后调整几个指针,再处理一下新节点的层级生成,就完事了。这大大降低了开发和维护的复杂度,对于一个追求效率同时又不想陷入算法细节泥潭的开发者来说,这简直是福音。

立即学习Java免费学习笔记(深入)”;

其次,并发性能表现优秀。这是一个非常重要的点。在多线程环境下,对平衡树进行并发操作往往需要复杂的锁机制,因为任何一次插入或删除都可能导致大范围的结构调整。而跳表呢?它的结构是多层级的,不同层级上的操作相对独立,这使得在实现并发版本时,可以采用更细粒度的锁,甚至可以做到部分无锁化(lock-free)。Java标准库中的

ConcurrentSkipListMap
ConcurrentSkipListSet
就是最好的证明,它们在并发场景下能提供非常高的吞吐量。

再者,性能稳定。虽然是基于随机性,但数学上可以证明,跳表的平均查找、插入、删除时间复杂度都是O(log N)。最坏情况确实可能退化到O(N),但这种概率极低,几乎可以忽略不计。这意味着在大多数实际应用中,跳表都能提供与平衡树媲美的性能,而且它的常数因子有时会更小一些。

至于它的应用场景,那可就多了:

  • 数据库索引:Redis的Sorted Set(有序集合)底层就是用跳表实现的。它需要快速地按分数范围查询、添加、删除元素,跳表简直是为它量身定做的。LevelDB也用到了跳表来管理其内存中的数据结构。
  • 并发数据结构:刚才提到了Java的
    ConcurrentSkipListMap
    ConcurrentSkipListSet
    。如果你需要在多线程环境下维护一个有序的集合或映射,并且对并发性能有较高要求,那么它们就是你的首选。
  • 网络路由:在一些高性能的网络设备中,路由表需要快速查找IP地址,跳表可以作为一个备选方案,提供高效的查找能力。
  • 实时系统:对于需要稳定平均性能,且对最坏情况的发生概率不敏感的实时系统,跳表也是一个不错的选择,因为它避免了平衡树那种可能导致瞬时性能抖动的复杂重平衡操作。

总的来说,跳表是一种优雅且实用的数据结构,它在简化实现复杂度的同时,依然能提供优秀的平均性能,尤其是在并发场景下,其优势更是明显。

Revid AI
Revid AI

AI短视频生成平台

下载

实现跳表时,如何选择合适的随机化参数(P值和最大层数)?

在跳表的实现中,

P
值(概率因子)和
MAX_LEVEL
(最大层数)是两个至关重要的随机化参数,它们直接影响着跳表的性能和空间效率。选择它们,其实就是在性能和资源消耗之间找到一个平衡点。

先说

P
值吧。这玩意儿决定了节点被提升到更高层级的概率。最常见的选择是
0.5
(即1/2)或
0.25
(1/4)。

  • P = 0.5:这意味着每个节点有50%的概率被提升到下一层。这样一来,每一层大约会是下一层节点数的一半。这种设置会使得跳表的层数相对较少,结构更“矮胖”,从而在查找时需要跳跃的层数更少,平均查找路径短。这是最常用也最推荐的P值,因为它在实践中被证明能提供很好的性能平衡。
  • P = 0.25:如果选择0.25,那么节点被提升的概率就更低了。结果是跳表会变得更“高瘦”,层数可能更多,但每层上的节点会更稀疏。这可能会减少一些指针的存储开销(因为更少的节点被提升),但查找时可能需要更多的比较次数。

我个人觉得,对于大多数通用场景,

P = 0.5
几乎是“万金油”的选择,它在理论和实践中都表现出了良好的性能。除非你有非常特殊的内存限制或者对查找次数有极致的要求,否则没必要去折腾这个值。

再来说说

MAX_LEVEL
,也就是跳表允许达到的最大层数。这个参数的选择,主要是为了防止在极端随机情况下,某个节点被提升到非常高的层,导致内存浪费,同时也是为了限制跳表的高度。

  • 理论依据:一个包含
    N
    个元素的跳表,其期望高度大约是
    log_P(N)
    。如果
    P=0.5
    ,那么期望高度就是
    log_2(N)
    。所以,
    MAX_LEVEL
    应该根据你预计存储的最大元素数量
    N
    来估算。
  • 实际选择:一个经验法则或者说常见的做法,是把
    MAX_LEVEL
    设为一个相对较大的常数,比如
    32
    64
    • MAX_LEVEL = 32
      :对于
      N
      达到
      2^32
      (大约40亿)的元素,
      log_2(2^32) = 32
      ,所以32层足够应对绝大多数情况了。
    • MAX_LEVEL = 64
      :如果你预计的数据量会非常庞大,甚至超过40亿,或者你希望对最坏情况有更强的鲁棒性,那么64层也是一个合理的选择。
  • 过大过小
    • MAX_LEVEL
      过小:如果你的数据量很大,但
      MAX_LEVEL
      设得太小,跳表可能会变得太“扁平”,导致查找效率下降,甚至退化到接近链表的O(N)复杂度。
    • MAX_LEVEL
      过大:虽然会浪费一点点头节点
      head
      的指针数组空间(因为很多层可能永远不会被用到),但对整体性能影响不大,而且能确保在极端随机情况下跳表的高度不会失控。所以,宁愿设大一点,也不要设小。

总结一下,对于P值,

0.5
是黄金标准。对于
MAX_LEVEL
32
64
通常是安全且高效的选择,足以应对绝大多数应用场景。在实际开发中,你通常不需要为了这两个参数去进行复杂的调优,采用这些推荐值通常就能获得满意的性能。

跳表的删除操作与查找插入有何异同?如何确保删除的正确性?

跳表的删除操作,从思路上看,跟查找和插入确实有着异曲同工之妙,但也有其独有的复杂性,尤其是要确保删除的正确性,需要考虑得更周全些。

异同点:

  • 共同之处:找到“更新路径” 无论是查找、插入还是删除,第一步都是类似的:从跳表的最高层开始,沿着链表向前遍历,直到找到目标值或者确定目标值不存在。在这个过程中,我们需要记录下每一层中,最后一个小于目标值的节点。我喜欢称之为“更新路径”

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

825

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

724

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

728

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

395

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

445

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16861

2023.08.03

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.3万人学习

Kotlin 教程
Kotlin 教程

共23课时 | 2.1万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号