目录
sql
中禁止使用select *
今天我来聊聊索引的相关问题,因为索引是大家都比较关心的公共话题,确实有很多坑。
不知道你在实际工作中,有没有遇到过下面的这两种情况:
创建一张user表,表中包含:id、code、age、name和height字段
CREATE TABLE `user` ( `id` int NOT NULL AUTO_INCREMENT, `code` varchar(20) COLLATE utf8mb4_bin DEFAULT NULL, `age` int DEFAULT '0', `name` varchar(30) COLLATE utf8mb4_bin DEFAULT NULL, `height` int DEFAULT '0', `address` varchar(30) COLLATE utf8mb4_bin DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_code_age_name` (`code`,`age`,`name`), KEY `idx_height` (`height`) ) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin
此外,还创建了三个索引:
idx_height:普通索引
INSERT INTO `user` (id, CODE, age, NAME, height,address) VALUES (1, '101', 21, '周星驰', 175,'香港'); INSERT INTO `user` (id, CODE, age, NAME, height,address) VALUES (2, '102', 18, '周杰伦', 173,'台湾'); INSERT INTO `user` (id, CODE, age, NAME, height,address) VALUES (3, '103', 23, '苏三', 174,'成都');
为了防止以后出现不必要的误会,在这里有必要查一下当前数据库的版本。
select version(); 查出当前的mysql版本号为:8.0.21
在mysql
中,如果你想查看某条sql语句是否使用了索引,或者已建好的索引是否失效,可以通过explain
关键字,查看该sql语句的执行计划,来判断索引使用情况。
例如:
explain select * from user where id=1;
执行结果:图片从图中可以看出,由于id字段是主键,该sql语句用到了主键索引
之前我已经给code、age和name
这3个字段建好联合索引:idx_code_age_name
。
该索引字段的顺序是:
如果在使用联合索引时,没注意最左前缀原则,很有可能导致索引失效
explain select * from user where code='101'; explain select * from user where code='101' and age=21 explain select * from user where code='101' and age=21 and name='周星驰';
上面三种情况,sql都能正常走索引,但还有一种比较特殊的场景
explain select * from user where code = '101' and name='周星驰';
查询条件原本的顺序是:code、age、name
,但这里只有code
和name
中间断层了,掉了age
字段,这种情况也能走code字段上的索引
这4条sql中都有code
字段,它是索引字段中的第一个字段,也就是最左边的字段。只要有这个字段在,该sql已经就能走索引。
这就是我们所说的 最左匹配原则
前面我已经介绍过,建立了联合索引后,在查询条件中有哪些情况索引是有效的。
接下来,我们重点看看哪些情况下索引会失效
explain select * from user where age=21; explain select * from user where name='周星驰'; explain select * from user where age=21 and name='周星驰'
从图中看出这3种情况下索引确实失效了。
说明以上3种情况不满足最左匹配原则,说白了是因为查询条件中,没有包含给定字段最左边的索引字段,即字段code
sql
中禁止使用select *
explain select * from user where name='苏三';
执行结果:
在该sql中用了select *
,从执行结果看,走了全表扫描,没有用到任何索引,查询效率是非常低的。
如果查询的时候,只查我们真正需要的列,而不查所有列,结果会怎么样?
explain select code,name from user where name='苏三';
执行结果:
从图中执行结果不难看出,该sql
语句这次走了全索引扫描,比全表扫描效率更高。
其实这里用到了:覆盖索引
如果select
语句中的查询列
,都是索引列
,那么这些列被称为覆盖索引
。这种情况下,查询的相关字段都能走索引,索引查询效率相对来说更高一些。
而使用select *
查询所有列的数据,大概率会查询非索引列的数据,非索引列不会走索引,查询效率非常低。
介绍本章节内容前,先跟大家一起回顾一下,根据id
查询数据的sql
语句:
explain select * from user where id=1;
执行结果:
从图中可以看出,由于id
字段是主键,该sql
语句用到了主键索引。
但如果id列上面有计算,比如:
explain select * from user where id+1=2;
执行结果:
从上图中的执行结果,能够非常清楚的看出,该id字段的主键索引,在有计算的情况下失效了。
有时候我们在某条sql
语句的查询条件中,需要使用函数,比如:截取某个字段的长度。
假如现在有个需求:想查出所有身高是17
开头的人,如果sql
语句写成这样:
explain select * from user where height=17;
该sql语句确实用到了普通索引:
但该sql
语句肯定是有问题的,因为它只能查出身高正好等于17的,但对于174这种情况,它没办法查出来。
为了满足上面的要求,我们需要把sql语句稍稍改造了一下:
explain select * from user where SUBSTR(height,1,2)=17;
这时需要用到SUBSTR
函数,用它截取了height
字段的前面两位字符,从第一个字符开始。
执行结果:
在使用该函数之后,该sql
语句竟然走了全表扫描,索引失效了。
在sql
语句中因为字段类型
不同,而导致索引失效的问题,很容易遇到,可能是我们日常工作中最容易忽略的问题。
注意观察一下user
表中的code
字段,它是varchar
字符类型的。
在sql
语句中查询数据时,查询条件我们可以写成这样:
explain select * from user where code="101";
执行结果:
从上图中看到,该code
字段走了索引。
温馨提醒一下,查询字符字段时,用双引号“
和单引号'
都可以。
MySQL中单双引号分析
但如果你在写sql时,不小心把引号弄掉了,把sql语句变成了:
explain select * from user where code=101;
执行结果:
你会发现,该sql
语句竟然变成了全表扫描。因为少写了引号,这种小小的失误,竟然让code
字段上的索引失效了。
为什么索引会失效呢?
因为code
字段的类型是varchar
,而传参的类型是int
,两种类型不同。
此外,还有一个有趣的现象,如果int
类型的height
字段,在查询时加了引号条件,却还可以走索引:
explain select * from user where height='175';
执行结果:
从图中看出该sql
语句确实走了索引。int
类型的参数,不管在查询时加没加引号,都能走索引。
mysql
发现如果是int类型
字段作为查询条件时,它会自动将该字段的传参进行隐式转换
,把字符串转换成int类型
。
mysql
会把上面列子中的字符串175
,转换成数字175
,所以仍然能走索引。
接下来,看一个更有趣的sql语句:
select 1 + '1';
结果是2。
mysql
自动把字符串1
,转换成了int类型的1
,然后变成了:1+1=2
但如果你确实想拼接字符串该怎么办?可以使用concat
关键字。
具体拼接sql如下:
select concat(1,'1');
接下来,关键问题来了:为什么字符串类型的字段,传入了int
类型的参数时索引会失效呢?
根据mysql
官网上解释,字符串'1'、' 1 '、'1a'
都能转换成int类型的1
,也就是说可能会出现多个字符串,对应一个int
类型参数的情况。那么,mysql怎么知道该把int类型的1转换成哪种字符串,用哪个索引快速查值?
感兴趣的小伙伴可以再看看官方文档:https://dev.mysql.com/doc/refman/8.0/en/type-conversion.html
模糊查询,在我们日常的工作中,使用频率还是比较高的。
比如现在有个需求:想查询姓李的同学有哪些?
使用like
语句可以很快的实现:
select * from user where name like '李%';
但如果like
用的不好,就可能会出现性能问题,因为有时候它的索引会失效。
目前like查询主要有三种情况:
like '%a' like 'a%' like '%a%'
假如现在有个需求:想查出所有code
是10
开头的用户。sql语句如下:
explain select * from user where code like '10%';
执行结果:
图中看出这种%
在10右边
时走了索引。
而如果把需求改了:想出现出所有code是1结尾的用户。
查询sql语句改为:
explain select * from user where code like '%1';
执行结果:
从图中看出这种%
在1左边时,code
字段上索引失效了,该sql变成了全表扫描
。
此外,如果出现以下sql:
explain select * from user where code like '%1%';
该sql语句的索引也会失效。
下面用一句话总结一下规律:当like语句中的%,出现在查询条件的左边时,索引会失效
。
为什么会出现这种现象呢?
其实很好理解,索引就像字典中的目录。一般目录是按字母或者拼音从小到大,从左到右排序,是有顺序的。
我们在查目录时,通常会先从左边第一个字母进行匹对,如果相同,再匹对左边第二个字母,如果再相同匹对其他的字母,以此类推。通过这种方式我们能快速锁定一个具体的目录,或者缩小目录的范围。
上面的内容都是常规需求,接下来,来点不一样的。
假如我们现在有这样一个需求:过滤出表中某两列值相同的记录。比如user
表中id
字段和height
字段,查询出这两个字段中值相同的记录。
这个需求很简单,sql可以这样写:
explain select * from user where id=height
执行结果:
为什么会出现索引失效这种结果
id
字段本身是有主键索引的,同时height
字段也建了普通索引的,并且两个字段都是int
类型,类型是一样的。
但如果把两个单独建了索引的列,用来做列对比时索引会失效
我们平时在写查询sql
时,使用or
关键字的场景非常多,但如果你稍不注意,就可能让已有的索引失效。
某天你遇到这样一个需求:想查一下id=1或者height=175
的用户。
explain select * from user where id=1 or height='175';
执行结果:
没错,这次确实走了索引,因为刚好id
和height
字段都建了索引。
假如需求改了:除了前面的查询条件之后,还想加一个address='成都'
。
explain select * from user where id=1 or height='175' or address='成都';
执行结果:
结果悲剧了,之前的索引都失效了。
因为你最后加的address
字段没有加索引,从而导致其他字段的索引都失效了。
注意
:如果使用了or
关键字,那么它前面和后面的字段都要加索引,不然所有的索引都会失效,这是一个大坑。
在我们日常工作中用得也比较多的,还有范围查询,常见的有:
今天重点聊聊前面四种。
假如我们想查出height
在某些范围之内的用户,这时sql
语句可以这样写:
explain select * from user where height in (173,174,175,176);
执行结果:
从图中可以看出,sql
语句中用in
关键字是走了索引的。
有时候使用in
关键字时性能不好,这时就能用exists
关键字优化sql
了,该关键字能达到in
关键字相同的效果:
explain select * from user t1 where exists (select 1 from user t2 where t2.height=173 and t1.id=t2.id)
执行结果:
从图中可以看出,用exists
关键字同样走了索引。
上面演示的两个例子是正向的范围,即在某些范围之内。
那么反向的范围,即不在某些范围之内,能走索引不?
explain select * from user where height not in (173,174,175,176);
执行结果:
索引失效了。
看如果现在需求改了:想查一下id
不等于1、2、3的用户有哪些,这时sql语句可以改成这样:
explain select * from user where id not in (173,174,175,176);
执行结果:
可能会惊奇的发现,主键字段中使用not in
关键字查询数据范围,任然可以走索引。而普通索引字段使用了not in
关键字查询数据范围,索引会失效。
除此之外,如果sql
语句中使用not exists
时,索引也会失效。具体sql语句如下:
explain select * from user t1 where not exists (select 1 from user t2 where t2.height=173 and t1.id=t2.id)
执行结果:
从图中看出sql
语句中使用not exists
关键后,t1
表走了全表扫描,并没有走索引。
在sql
语句中,对查询结果进行排序是非常常见的需求,一般情况下我们用关键字:order by
就能搞定。
但order by
挺难用的,它跟where
或者limit
关键字有很多千丝万缕的联系,一不小心就会出问题。
一起看看order by
的哪些情况可以走索引。
我之前说过,在code、age和name这3个字段上,已经建了联合索引:idx_code_age_name
order by
还能配合where
一起遵循最左匹配原则。
explain select * from user where code='101' order by age;
执行结果:
code
是联合索引的第一个字段,在where
中使用了,而age
是联合索引的第二个字段,在order by
中接着使用。
假如中间断层了,sql语句变成这样,执行结果会是什么呢?
explain select * from user where code='101' order by name;
执行结果:
虽说name
是联合索引的第三个字段,但根据最左匹配原则,该sql
语句依然能走索引,因为最左边的第一个字段code
,在where
中使用了。只不过order by
的时候,排序效率比较低,需要走一次filesort
排序罢了。
如果某个联合索引字段,在where
和order by
中都有,结果会怎么样?
explain select * from user where code='101' order by code, name;
执行结果:
code
字段在where
和order by
中都有,对于这种情况,从图中的结果看出,还是能走了索引的。
前面介绍的都是正面的用法,是为了让大家更容易接受下面反面的用法。
好了,接下来,重点聊聊order by的哪些情况下不走索引?
。
如果order by
语句中没有加where
关键字,该sql语句将不会走索引。
explain select * from user order by code, name;
执行结果:
从图中看出索引真的失效了。
只是用limit
也不走索引
order by
后面的条件,也要遵循联合索引的最左匹配原则。具体有以下sql:
explain select * from user order by code limit 100; explain select * from user order by code,age limit 100; explain select * from user order by code,age,name limit 100;
执行结果:
从图中看出这3条sql都不能正常走索引