数据库索引

本文主要是介绍数据库索引，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

文章目录

- 1. 基础概念
- 2. 避免索引失效
- 3. 聚簇索引与辅助索引
- 4. 覆盖索引
- 5. 最左前缀原则
- 6. 冗余索引

1. 基础概念

索引概念：

它是帮助mysql高效获取数据的数据结构；
索引以某种方式指向数据，通过索引可以快速获取数据；
没有索引时，查找，只能遍历，O(N)的时间复杂度 （避免全表扫描）；
建立了索引，查找速度就显著提高，一般是B+树索引，且索引像目录，可提高查询效率；
通过索引对数据进行排序，降低排序成本；

索引劣势：

索引本身是一张表，保存了主键与索引字段，并指向实体类的记录，所以其也要存储空间，一般放到磁盘
插入数据时也要更新索引，从而影响写入数据的效率

索引结构：

不同的存储引擎，它的索引是不一样的
BTREE索引是最常见的，也是InnoDB引擎所支持的索引

hash索引缺点：

hash不能够进行范围查找；
hash键值对的形式使得其键只能用一个，导致只能主键查询，不能用其它字段建立索引查询；
hash冲突(不论邻接法还是开链法)都有一定线性时间的查找，不一定比B+树索引快；

对于B树和B+树的相关内容见：B树、B+树详解。

索引分类：

单值索引：（单列索引）按照单列，一个表可以有多个；
唯一索引：索引值必须唯一，允许有空值；
复合索引：多个列一起构成索引；

索引语法：

可以在创建表时创建，也可以之后创建
mysql中主键有默认的索引 PRIMARY
索引类型默认是BTREE
可以create，也可以alter

索引的设计原则：

对于查询频次高，且数据量比较大的表
针对经常在where子句中出现的字段
尽量使用唯一索引，区分度高，索引效率高
并不是多多益善，在insert，update和delete也要维护
使用短字段的索引，节省空间
针对复合（联合）索引，创建一个组合索引，其所有子集（从左边连续），都有索引（最左前缀）；

索引是越多越好吗:

数据量小的表不需要索引，建立会增加额外的开销
数据变更需要维护索引，因此需要更多的维护成本
索引本身需要空间

2. 避免索引失效

①全值匹配，对索引中所有列都指定具体值(该情况下，索引生效，执行效率高)；
②最左前缀法则，如果索引了多列，要遵守最左前缀法则。即查询从索引的最左前列开始(从最左前列开始，不管其相对位置)，且不跳过索引中的列(若是跳过，查询时从跳过处截断)；
③范围查询右边的列，不能够使用索引，即范围查询右边的查询条件失效；
④不要在索引列上进行运算操作，索引将失效；
⑤字符串不加单引号，造成索引失效；
⑥尽量使用覆盖索引(只访问索引的查询(索引列完全包含查询列))，减少select *；
explain中的Extra字段含义：
（1）using index：使用覆盖索引的时候出现；
（2）using where：在查找使用索引的情况下，需要回表去查询所需数据；
（3）using index condition：查找使用了索引，但是需要回表查询数据；
（4）using index; using where：查找使用了索引，但是需要的数据都在索引中能找到，所以不需要回表查询数据；
⑦用 or分隔开的条件，如果 or 前的条件中的列有索引，而后边的列中没有索引，那么涉及的索引都不会被用到；
⑧以%开头的like模糊查询，索引失效，如果仅仅是尾部模糊匹配，索引不会失效。如果是头部模糊匹配，索引失效。解决办法是使用覆盖索引来搭配前部模糊查询条件；
⑨如果Mysql评估使用索引比全表慢，则不使用索引；
（1）is NULL，is NOT NULL有时索引失效，原因是索引内的数据的成分；
⑩in 走索引，not in 索引失效；
⑾单列索引和复合索引，尽量使用复合索引(相当于创建了索引列个数的索引)而非单列索引(此时数据库会选择一个最优的索引，辨识度最高的来使用，并不会使用全部索引)；

3. 聚簇索引与辅助索引

聚簇索引的叶子节点包含全部的数据信息，即除了该索引字段的话也有剩余其他所有字段的数据；
辅助索引中叶子节点可能只有指向行数据的指针，or 主键；
在InnoDb和MyISAm中，是不一样的，可以看下面图；
；
左边的需要两次查询，这是一个回表；
对于InnoDB，其必有聚簇索引；
；

4. 覆盖索引

只需要在一棵索引树上就能获取SQL所需的所有列数据，无需回表，速度更快。
就是索引本身就已经包含了所要查询的列。
则此时就不用进行回表，直接返回就好
哈希索引、空间索引等索引都把存储索引列的值，所以mysql只能使用B-TREE来做覆盖索引
这里Extra，如果using index，就是覆盖索引(见上文)
- using where 回表查询
- using index 覆盖索引
- using index condition 部分条件不能索引, 所以先用能索引的先走一遍, 然后再使用不能用索引的条件
- 如果type是ALL，则是全表查询
主键是不需要加入聚集索引的，因为它本身就在索引的data中
这也引出一个问题，非聚集索引不一定回表（如果是覆盖索引，或者是主键）
MySQL 的覆盖索引与回表 - 知乎 (zhihu.com)这个写的不错, 忘记了看这个
什么时候发生覆盖索引
- 比如where 非主键字段, select 主键, 非主键字段, 此时, 本身非主键字段就在索引树上, 其次非聚集索引叶子存储的是主键, 所以一颗索引树就覆盖了查询的结果
- 比如where 非主键字段命中了联合索引的左边, 那么select 联合索引中的字段, 就会发生覆盖索引
什么时候需要用覆盖索引
- 全表count查询, 建立count(字段), 该字段的索引, 可以直接通过索引得到结果, 不然要回表
- select 多个字段, 可以考虑建立联合索引来覆盖

5. 最左前缀原则

对于联合索引，如果查询的时候查询条件精确匹配索引的左边连续一列或几列，则此列就可以被用到。

这里需要注意的是，查询的时候如果两个条件都用上了，但是顺序不同，那么现在的查询引擎会自动优化为匹配联合索引的顺序，这样是能够命中索引的。

如果遇到范围查询时，就停止匹配了

最左匹配的成因：mysql按照联合索引的顺序，以第一个字段排序，然后再这个基础上再按第二个字段排序，所以对于第二个字段，实际它是局部有序，整体无序的，所以不能跳过第一个字段，直接从第二个字段开始进行，所以最左匹配原则

举个例子：

如User表的name和city加联合索引就是(name,city)
select * from user where name=xx and city=xx ; //可以命中索引
select * from user where name=xx ; // 可以命中索引
select * from user where city=xx ; // 无法命中索引     

6. 冗余索引

如（name,city ）和（name ）这两个索引就是冗余索引，能够命中后者的查询肯定是能够命中前者的

这篇关于数据库索引的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

Java教程

数据库索引

文章目录

1. 基础概念

2. 避免索引失效

3. 聚簇索引与辅助索引

4. 覆盖索引

5. 最左前缀原则

6. 冗余索引

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯