为什么mysql索引选择b+树作为底层存储结构？

发布时间：2023-05-22 18:00

这篇文章解决一个问题

mysql 底层为什么是用b+树作为存储结构？为什么不是二叉树，红黑树，b树？

我们先构造一个应用场景，我们有1kw的数据需要存储在一张表里面，那么我们怎么设计能让查询速度尽可能的快

我们实验的可视化的数据结构皆从以下网站获取，地址：https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

ok，我们先来看下二叉树怎么存储这1kw数据，假设我有一张表，这张表里只有一个字段，他是递增的，看看用二叉树是什么情形

于是，我们看到，在这种情况下二叉树直接退化成了一个链表，我们如果要找到5这个记录，需要查找5次，n条数据就要查找n次，复杂度O(n), 不满足我们的需求

我们再来看看红黑树

我们看到红黑树有一个自平衡的特性，以牺牲插入性能解决了退化成链表的问题，但随着记录树的增加，树的高度会不断增加，那么，我们想找到第1kw个数据，依然要查找很多次，对应到mysql上每次读取一个树的节点都需要进行一次io，那么还有没有更好的办法呢？

ok，接下来看看b树

可以明显看到的区别是，每一个节点上存储了多个数据，其实逻辑很简单嘛，想保证高度固定，那就横向上想办法，这样的话我们查找16这条记录，其实只需要经过3次io就可以了

那b+树和b树又有什么区别呢？引用网上的一张图说明一下

具体到mysql上就是

于是，我们就明白了，为什么mysql要用b+树作为底层数据结构，1kw的数据，索引应用合理，可能3次或者4次io就可以定位到记录了。