数据库模式
①三级模式-两级映射
物理数据库在计算机中的表现形式为文件
内模式管的是如何存储数据
概念模式是表的级别,把数据分为多个表,根据业务和应用划分
外模式对应数据库中的视图,更加灵活控制数据。
②数据库设计
③ER模型:
集成的方法:逐步集成,用累加的方式一次集成两个ER图;多个局部E-R图一次性集成。
集成产生的冲突和解决方法
属性冲突:包括属性域冲突和属性取值冲突。
命名冲突:包括同名异义和异名同义
结构冲突:包括同一对象在不同应用中具有不同的抽象,及同一个实体在不同的局部E-R图中包含的属性个数和属性排列次序不完全相同。
✳E-R模型转实体关系:一个实体型转换为一个关系模式 分为 1:1 联系 1:n联系,最少转成两个关系模式 m:n 联系,至少转成三个关系模式
多对多时联系转成单独的关系模式,一对多时联系和1转为关系模式
✳三个以上实体间的一个多元联系
④关系代数与元组演算
关系代数分为:并,交,差,笛卡尔积,投影,选择,联接
联接操作只保留一个结果。
⑤规范化理论-函数依赖
部分函数依赖:主键是两个函数的组合键
传递函数依赖:A确定B,B确定C,则可以A确定C。
规范化理论的价值和用途:解决数据冗余,更新异常,删除异常,插入异常。
⑥键
超键:在关系中能唯一标识元组的属性或属性集称为关键模式的超键。
候选键:唯一标识元组,不存在冗余属性,可以有多个
主键:只有一个,唯一标识元组
外键:别的关系的主键。常用来做表关联。
求候选键的方法:图示法
将依赖关系用有向图表示,找出入读为0的属性,以该点为起点遍历所有有向图,若能正常便利所有节点,则该属性集为关系模式的候选键。
⭐范式
第一范式:“第一范式的数据表必须是二维数据表”,第一范式是指数据库的每一列都是不可分割的基本数据项,强调列的原子性。在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。
第二范式:第二范式建立在第一范式的基础上,即满足第二范式一定满足第一范式,第二范式要求数据表每一个实例或者行必须被唯一标识。除满足第一范式外还有两个条件,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
第三范式:若某一范式是第二范式,且每一个非主属性都不传递依赖于该范式的候选键,则称为第三范式,即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。
BC范式:消除主属性对候选键的传递依赖
⑦模式分解
保持函数依赖分解:分解之后保持原来所有的函数依赖,冗余不需要保持。
无损分解:将一个关系模式分解为若干个分解模式后,通过运算可以还原原来的关系模式。
判断是否为无损分解的方法:
表格法:
首行为分解前的关系模式属性,首列为分解后的关系模式,分解后的关系模式在表中存在则标为a,不存在标为b,若能根据相同属性判断其他属性,则标为a,若有一行全部标为a,则为无损分解。
并发控制
数据库完整性约束
分布式数据库
数据仓库与数据挖掘