若在一张表中,在属性(或属性组)X的值确定的情况下,必定能确定属性Y的值
,那么就可以说Y函数依赖于X,写作 X → Y。类似于函数关系 y = f(x)
,在x的值确定的情况下,y的值一定是确定的。
我们学校,姓名相同的,学号不同,所以可以说 :姓名依赖于学号
系名 → 系主任
学号 → 系主任
学号 → 姓名
(学号,课名)→ 分数 注:因为同一个的学号对应的分数不确定,同一个课名对应的分数也不确定
(学号,课名) P→ 姓名
假如 Z 函数依赖于 Y,且 Y 函数依赖于 X 『Y 不包含于 X,且 X 不函数依赖于 Y』
,那么我们就称 Z 传递函数依赖于 X
设 K 为某表中的一个属性或属性组,若除 K 之外的所有属性都完全
函数依赖于 K,那么我们称 K 为候选码,简称为码
。
在实际中我们通常可以理解为:假如当 K 确定的情况下,该表除 K 之外的所有属性的值也就随之确定,那么 K 就是码
。一张表中可以有超过一个码。
(实际应用中为了方便,通常选择其中的一个码作为主码)
例如:
(学号、课名)这个属性组就是码
包含在任何一个码中的属性称为主属性。
不包含在任何一个码中的属性成为非主属性。
根据2NF的定义,判断的依据实际上就是看数据表中是否存在非主属性对于码的部分函数依赖
第一步:找出数据表中所有的码。
第二步:根据第一步所得到的码,找出所有的主属性。
第三步:数据表中,除去所有的主属性,剩下的就都是非主属性了。
第四步:查看是否存在非主属性对码的部分函数依赖。
有一个诀窍,就是假如A是码,那么所有包含了A的属性组,如(A,B)、(A,C)、(A,B,C)等等,都不是码了(因为作为码的要求里有一个“完全函数依赖”)