索引是一种数据结构,是存储引擎用于快速找到记录的一种数据结构
例如:查找查字典,字典的前面方便根据拼音或偏旁部首部分就是索引的功能
在Mysql中,索引是在存储引擎层面而不是服务器层实现的,所以,并没有统一的索引标准,不同存储引擎的索引的工作方式并不一样,也不是所有的存储引擎都支持所有类型的索引
当人们谈论索引的时候,如果没有特别指明类型,多半说的是B-Tree索引
B-Tree是术语,底层的存储引擎也可能使用不同的存储结构,例如,NDB集群存储引擎内部实际上使用了T-Tree结构存储这种索引,即使其名字是BTREE;InnoDB则使用的是B+Tree
B-Tree索引能够加快访问数据的速度,因为存储引擎不再需要进行权标扫描来获取需要的数据,取而代之的是从索引的根节点开始进行搜索。节点的槽中存放了指向子节点的指针,存储引擎根据这些指针向下层查找
全值匹配指的是和索引中的所有列进行匹配
只使用索引的第一列
只匹配某一列的值的开头部分
查找索引范围内的值
第一列全匹配,第二列范围匹配
如果不是按照索引的最左列开始查找,则无法使用索引
不能跳过索引中的列
如果查询中的某个列使用的范围查询,则右边所有列无法使用索引优化查找
基于哈希表实现,只有精确匹配索引所有列的查询才有效,对于每一行数据,存储引擎都会对所有的索引列计算一个哈希码,哈希码是一个较小的值,并且不同键值的行计算出来的哈希码也不一样。哈希索引将所有的哈希码存储在索引中,同时在哈希表中保存指向每个数据行的指针
Mysql中,只要Memory引擎显式支持哈希索引
哈希索引只包含哈希值和行指针,而不存储字段值,所以不能使用索引中的值来避免读取行。不过,访问内存中的行为的速度很快,所以大部分情况下这一点对性能的影响并不明显
哈希索引数据并不是按照索引值顺序存储的,所以也就无法用于排序
哈希索引也不支持部分索引列匹配查找,因为哈希索引始终是使用索引列的全部内容来计算哈希值的
哈希索引只支持等值比较查询
访问哈希索引的数据非常快,除非有很多哈希冲突(不同的索引列值确有相同的哈希值)。当出现哈希冲突的时候,存储引擎必须遍历链表中所有的行指针,逐行进行比较,直到找到所有符合条件的行
如果哈希冲突很多的话,一些所有维护操作的代价也会很高
MyISAM表支持空间索引,可以用作地理数据存储,无须前缀查询,空间索引会从所有维度来索引数据,查询有效地使用任意维度来组合查询。
全文索引是一种特殊类型的索引,它查找的是文本中的关键词,而不是直接比较索引中的值。全文搜索和其他几类索引的匹配方式完全不一样。它有许多需要注意的细节,如停用词、词干、和复数、布尔搜索等
索引打打减少了服务器需要扫描的数据量
索引可以帮助服务器避免排序和临时表
索引可以将随机I/O变为顺序I/O