• 为什么索引要用B+树来实现呢,而不是B树


    首先,常规的数据库存储引擎,一般都是采用 B 树或者 B+树来实现索引的存储。

    B树

    因为 B 树是一种多路平衡树,用这种存储结构来存储大量数据,它的整个高度会相比二叉树来说,会矮很多。 而对于数据库来说,所有的数据必然都是存储在磁盘上的,而磁盘 IO 的效率实际上是 很低的,特别是在随机磁盘 IO 的情况下效率更低。 所以树的高度能够决定磁盘 IO 的次数,磁盘 IO 次数越少,对于性能的提升就越大,这 也是为什么采用 B 树作为索引存储结构的原因。 ​​​​

    B+树 

    但是在 Mysql 的 InnoDB 存储引擎里面,它用了一种增强的 B 树结构,也就是 B+树来作为索引和数据的存储结构。相比较于 B 树结构,B+树做了几个方面的优化。
    • B+树的所有数据都存储在叶子节点,非叶子节点只存储索引。
    • 叶子节点中的数据使用双向链表的方式进行关联。

    总结

    使用 B+树来实现索引的原因,我认为有几个方面:
    • B+树非叶子节点不存储数据,所以每一层能够存储的索引数量会增加,意味着 B+树在层高相同的情况下存储的数据量要比 B 树要多,使得磁盘 IO 次数更少。
    • 在 Mysql 里面,范围查询是一个比较常用的操作,而 B+树的所有存储在叶子节点的数据使用了双向链表来关联,所以在查询的时候只需查两个节点进行遍历就行,而 B 树需要获取所有节点,所以 B+树在范围查询上效率更高。
    • 在数据检索方面,由于所有的数据都存储在叶子节点,所以 B+树的 IO 次数会更加稳定一些。
    • 因为叶子节点存储所有数据,所以 B+树的全局扫描能力更强一些,因为它只需要扫描叶子节点。但是 B 树需要遍历整个树。
    另外,基于 B+树这样一种结构,如果采用自增的整型数据作为主键,还能更好的避免
    增加数据的时候,带来叶子节点分裂导致的大量运算的问题, 总的来说,我认为技术方案的选型,更多的是去解决当前场景下的特定问题,并不一定 是说 B+树就是最好的选择,就像 MongoDB 里面采用 B 树结构,本质上来说,其实是 关系型数据库和非关系型数据库的差异。
  • 相关阅读:
    Git代码上传
    YARP:探索反向代理的新境界
    web前端面试-10大经典题(HTML基础)
    17.(开发工具篇Gitlab)如何在Gitlab配置ssh key
    jar包的各种启动方式总结
    放大器的输入、输出电压范围的理解
    LeetCode--151
    vue+mapbox通过地图图层属性进行区划颜色填充(工作笔记,不能直接复制使用,需要自行调整部分代码)
    Java8 时间处理
    Mybatis杂谈
  • 原文地址:https://blog.csdn.net/qq_63431773/article/details/133960147