第五讲 深入理解索引-下
回表的定义:我们根据非主键索引k去查询数据时,通过找到k索引下符合要求的数据data;如果data只是一个主键ID,那么我们还要根据这个ID去主键索引中寻找对应的元组信息(即完整的数据)。那么从k索引找到主键ID ,并根据主键索引去获取元组信息的过程就叫做回表。
@如何避免回表呢?
我们可以看到,上诉查询中,一条数据会经过两个索引的查找才能获取想要的数据,这样一来在过程上就显得比较复杂了。我们可以对索引进行优化:覆盖索引
@何为覆盖索引?
根据查询语句的目标,我们并非时刻都想获取整个元组的数据,因而我们可以在索引内存入要查询的数据,查询到之后直接返回即可,这个改动就是覆盖索引。
覆盖索引可以减少树的搜索次数,提升查询性能,故而可以作为一个性能优化手段。【不过新建一个索引是有代价的,尤其是维护索引的相关事务上】
B+树的索引结构,支持最左前缀索引;即索引项是按照索引定义里面出现的字段顺序排序的,你可以根据联合索引的最左若干字段或者字符串索引的最左子串进行加速检索。
@联合索引如何安排字段顺序?
调整顺序如果发现某一个字段在前可以减少需要维护的索引数量,那么这个字段安排顺序就需要优先考虑了。
@如果各字段顺序都能减少索引维护该怎么选择?
比如联合索引(a,b)以及索引a、索引b,不管怎么调换(a,b)的字段顺序,都能减少一个需要维护的索引。此时可以从空间资源的角度去考虑,把占用空间教大的索引对应字段放在联合索引的前面。【比如a字段需要20bit,b字段需要20bit,那么就确定顺序为(a,b)】
@索引下推
最左前缀原则可以帮助我们快速查找,那么如果查询条件不满足最左前缀的格式呢?
一个例子:select * from user where name like ‘张%’ and age=10 and ismale=1;
mysql5.6前:获取索引基于最左前缀的所有结果并全部回表比对(即找到所有张%数据并回表)
mysql5.6引入索引下推优化:对索引包含的字段和查询条件比较,过滤无用数据,对剩余的再进行回表查询(即找到“张%”匹配的数据再对age字段进行比较,二次筛选)
上面贴两张丁老师的图:搭配起来就好理解了,引入索引优化后在首次索引时便尽可能地对数据进行筛选了,减少了回表的次数!
关于丁老师的思考问题,大家有兴趣的可以去看一下!