索引(index)是一种有序的数据结构,用来帮助MySQL高效获取数据。
优势 | 劣势 |
---|---|
提高数据检索的效率,降低数据库IO | 索引列也是要占用空间的。 |
通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。 | 索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE时,效率降低。 |
MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的索引结构,主要包含以下几种:
索引结构 | 描述 | InnoDB | MyISAM | Memory |
---|---|---|---|---|
B+Tree索引 | 最常见的索引类型,大部分引擎都支持 B+ 树索引 | 支持 | 支持 | 支持 |
Hash索引 | 底层数据结构是用哈希表实现的, 只有精确匹配索引列的查询才有效, 不支持范围查询 | 不支持 | 不支持 | 支持 |
R-tree(空间索 | 空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少 | 不支持 | 支持 | 不支持 |
Full-text(全文 | 是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucene,Solr,ES | 5.6版本之后支持 | 支持 | 不支持 |
如果选择二叉树作为索引结构,会存在以下缺点:
顺序插入时,会形成一个链表,单节点下最多2个子节点,查询性能大大降低。
大数据量情况下,层级较深,检索速度慢。
由于红黑树也是一颗二叉树,所以也会存在一个缺点:
所以,在MySQL的索引结构中,并没有选择二叉树或者红黑树,而选择的是B+Tree
B树是一种多叉路(单节点下可有多子节点)平衡查找树,相对于二叉树,B树每个节点可以有多个分支,即多叉。
以一颗最大度数(max-degree,指的是一个节点的子节点个数)为5(5阶)的b-tree为例,那这个B树每个节点最多存储4个key,5个指针:
演变B树分裂过程:https://www.cs.usfca.edu/~galles/visualization/BTree.html
特点:
5阶的B树,每一个节点最多存储4个key,对应5个指针。
一旦节点存储的key数量到达5,就会裂变,中间元素向上分裂。
在B树中,非叶子节点和叶子节点都会存放数据
B+Tree是B-Tree的变种,我们以一颗最大度数(max-degree)为4(4阶)的b+tree为例,来看其结构示意图:
B+Tree 与 B-Tree相比,主要有以下三点区别:
上述结构是标准的B+Tree的数据结构,再来看看MySQL中优化之后的B+Tree。