一、关系数据库管理系统(RDBMS)的构成:
1.程序实例:存储管理、缓存机制、SQL解析、日志管理、权限划分、容灾机制、索引管理、锁管理
2.存储(文件系统)
二、索引模块
1.为什么要使用索引?
数据较多时避免全表扫描,使用索引可以快速查询数据
2.什么信息可以成为索引?
主键、唯一键以及普通键等
3.索引的数据结构
(1)生成索引,建立二叉查找树进行二分查找
(2)生成索引,建立BTree结构进行查找
B-Tree特征:
1)根节点至少包括两个孩子
2)树中每个节点最多含有m个孩子(m>=2)
3)除根节点外,其它节点至少有ceil(m/2)个孩子
4)所有叶子节点都位于同一层
(3)生成索引,建立B+Tree结构进行查找
1)非叶子节点的子树指针与关键字个数相等
2)非叶子节点的子树指针p[i],指向关键字值[k[i],k[k+1])的子树
3)非叶子节点仅用来索引,数据都保存在叶子节点中
4)所有叶子节点均有一个链指针指向下一个叶子节点
(4)生成索引,建立Hash结构进行查找
优点:查询效率高
缺点:(1)仅仅能满足“=”,“IN”,不能使用范围查询(2)无法被用来避免数据的排序操作(3)不能利用部分索引键查询(4)不能避免表扫描(5)遇到Hash值相等的情况后性能并不一定能=就会比BTree索引高
(4)可以考虑BitMap(位图)索引,现在不适合主流,不适合高并发
4.为什么B+Tree更适合做存储索引
(1)B+树的磁盘读写代价更低
(2)B+树的查询效率更加稳点
(3)B+树更有利于对数据库的扫描(子节点被连接起来后,适合范围查找)