作者:小傅哥
博客:https://bugstack.cn
沉淀、分享、成长,让自己和他人都能有所收获!😄
讲道理5年开发,没用过数据结构,你只是在做CRUD!
很多时候大部分程序员👨💻头疼于,查询慢、效率低、一堆的关联SQL,主要原因是在程序设计上没有做出很好的数据结构。当然也还有一部分是由于老业务代码,或者没有用到一些大数据服务等。
数据结构、算法、设计模式,是每一个程序员成长过程中的内功心法修炼,而你的新技能用的再绚、多线程使的再6、加锁玩的再牛🐂,也只能说明你这个人身体好,但身体好是不能抗住子弹的。只有身体+心法都好,都能纵横捭阖。
这一章节是结合HashMap
的延展,在Jdk1.8中HashMap是使用桶数组+链表和红黑树
实现,所以顺着上一章节的核心原理和API功能讲解后,本来这一章节想直接进入到红黑树,但如果想把红黑树学明白,就需要了解他的来龙去脉,也就是它的前身2-3树
🌲。
谢飞机,考你几个简单的知识点🦀
🤥飞机,回去等消息吧!
日常的学习和一部分伙伴的面试中,竟然会听👂到的是;从HashMap中文红黑树、从数据库索引为B+Tree,但问2-3树的情况就不是很多了。
从最根本的原因来看,使用树结构就是为了提升整体的效率;插入、删除、查找(索引),尤其是索引操作。因为相比于链表,一个平衡树的索引时间复杂度是O(logn),而数组的索引时间复杂度是O(n)。
从以下的图上可以对比,两者的索引耗时情况;
在树的数据结构中,最先有点是二叉查找树,也就是英文缩写BST树。在使用数据插入的过程中,理想情况下它是一个平衡的二叉树,但实际上可能会出现二叉树都一边倒,让二叉树像列表一样的数据结构。从而树形结构的时间复杂度也从O(logn)
升级到O(n)
,如下图;
综上呢,如果我们希望在插入数据后又保持树的特点,O(logn)的索引性能,那么就需要在插入时进行节点的调整
2-3树是什么结构,它怎么解决平衡问题的。带着问题我们继续🤔。
2-3树是一种非常巧妙的结构,在保持树结构的基础上,它允许在一个节点中可以有两个元素,等元素数量等于3个时候再进行调整。通过这种方式呢,来保证整个二叉搜索树的平衡性。
这样说可能还没有感觉,来看下图;
2-3树已经可以解决平衡问题那么,数据是怎么存放和调整的呢,接下来我们开始分析。
2-3树,读法;二三树,特性如下;
序号 | 描述 | 示意图 |
---|---|---|
1 | 2-,1个数据节点2个树杈 | |
2 | 3-,2个数据节点3个树杈 | |
3 | 三叉与两叉的不同点在于,除了两边的节点,中间件还有一个节点。这个节点是介于2、4之间的值。 | |
4 | 当随着插入数据,会出现临时的一个节点中,有三个元素。这时会被调整成一个二叉树。 |
综上我们可以总结出,2-3树的一些性质;
接下来我们就模拟在二叉搜索树中退化成链表的数据,插入到2-3树的变化过程,数据包括;1、2、3、4、5、6、7
,插入过程图如下;
以上,就是整个数据在插入过程中,2-3树的演化过程,接下来我们具体讲解每一步的变化;
3、4、5
共用1个节点,当一个节点上有三个数据时候,则需要进行调整。5 6
共用。此时是一个临时存放,需要调整。初步调整后,抽出6节点,向上存放,变为2 4 6
共用一个节点,这是一个临时状态,还需要继续调整。2、4、6
,则继续需要把中间节点上移,1、3
和5、7
则分别成二叉落到节点2
、节点6
上。🇬🇷希腊字母:α(阿尔法)、 β(贝塔)、γ(伽马)、δ(德尔塔)、ε(伊普西隆)、ζ(截塔)、η(艾塔)、θ(西塔)、ι(约塔)
有了上面数据插入的学习,在看数据删除其实就是一个逆向的过程,在删除的主要包括这样两种情况;
承接上面👆的例子,我们把数据再从7、6、5、4、3、2、1
顺序删除,观察2-3树的结构变化,如下;
5、6
合并,但此时破坏了2-3树的平衡性,需要缩短树高进行调整。2、4
合并,节点1、3
分别插入左侧和中间。再看一个稍微复杂点2-3树删除:
上面👆这张图,就一个稍微复杂点的2-3平衡树,树的删除过程主要包括;
3、5
合并,指向节点2,保持树平衡。8、9
合并。15
上移,恢复成3-叉树。🤔如果有时候不好理解删除,可以试想下,这个要删除的节点,在插入的时候是一个什么效果。
相比于插入和删除,索引的过程还是比较简单的,不需要调整数据结果。基本原则就是;
🔍第一层寻找:
🔍第二层寻找:
🔍第三次寻找: