如果我们要设计关系型数据库的表模式,则很有可能会出现冗余,为了避免这种情况,我们需要一些规则,这些规则称为依赖。
函数依赖简单地说就是属性集A推导出属性集B,比如
给定这些规则之后,如果某个关系能够满足给定的函数依赖,则称关系R满足函数依赖F;
在下面我们会介绍一系列的范式以及分解算法;
函数依赖的分解合并规则
与
是等价的(可以互相转化的),第一个式子替换第二个式子称为合并规则,第二个式子替换第一个式子称为分解规则;
平凡函数依赖:如果A-->B,A是B的超集,则称此函数依赖为平凡的。
平凡依赖规则:如果A-->B,则可以将其变为A-->(B-A∩B),这样可以消除冗余;
(1)如果存在某个属性集,能够蕴含全部的属性;
(2)这个属性集的任意真子集都不能蕴含全部属性;
则称这个属性集为键;
举例:name,age --->name,course, 根据平凡依赖规则,可以简化为 name,age -->course.
如果一个关系的模式没有设计好,则会出现异常。异常的类型为:
(1)冗余:一个属性的值多次出现,比如:
(2)更新异常:上图的关系就存在更新异常,因为如果需要更新database这门课为database concept,则需要将左边的database全部更新为database concept;
(3)删除异常:上图的关系存在删除异常,因为将Avi、Hank、Sudarshan老师删除,则会出现database这门课消失了,但实际上数据库这门课永远不会消失,而只是老师辞职了。
属性闭包算法
闭包的应用
1.给定函数依赖集F1,是否可以推断出函数依赖f:A-->B?
只需要求出{A}+是否包含B,如果包含,则说明F1能够推断出f,否则不能;
举例:
2.判断某个属性集是否为键?
如果要证明属性集是超键,则只需要计算此属性集的闭包,看闭包中是否包含全部的属性;
但是如果需要证明属性集是候选键,则第一步需要证明是超键,第二步需要证明从属性集中任意去掉一个属性,此属性集就不是超键;
3.给出一些术语.
给定一个函数依赖集A;
A的基本集:和A等价的函数依赖集;
A的最小化基本集:满足(1)函数依赖的右边只有单个属性(2)删除任意一个函数依赖都不将是基本集(3)从函数依赖的左边删除任意一个属性,则不将是基本集;
4.投影函数依赖
给定一个关系和满足的函数依赖F,求对部分属性投影后,哪些函数依赖满足。
比如:原本属性为A,B,C的关系,投影到A,B后,还有哪些函数依赖成立?简单地说就是:
(1)首先计算单属性的闭包,比如{A}的闭包为{B,C},如果我们的投影为{A,B},则需要包含A-->B,而不包含A-->C;(如果存在某个属性集能够蕴含所有属性,则我们就不需要再求此属性集的闭包)
(2)接着计算双属性,三属性,四属性.....;
(3)在求出的基本集中最小化;
--如果投影后的某个函数依赖能够通过投影后的其他函数依赖推出,则删除;
比如:{A-->C,A-->B,B-->C},删除A-->C,因为此函数依赖能够通过其他函数依赖推导;
--如果某个函数依赖A-->B,删除A中某个属性后仍然在投影的函数依赖中成立,则删除;
比如:投影后的函数依赖为{AC-->B,A-->B},则把{AC-->B}删除,因为如果删除C即A-->B 能够从投影的函数依赖中推出;
举例:
5.判断无损分解
如果R1∩R2是R1或R2的超码,则R上的分解(R1,R2)是无损分解。
下面我们会说到BCNF分解和3NF分解,而分解也是有评判标准的:
(1)消除异常;
(2)无损连接:分解后再连接是否和原来的关系一致;
用chase检验法则;
(3)保持依赖:FD的投影在分解后的关系上成立,但是连接后的关系不满足原始FD;
BCNF满足(1)和(2),3NF满足(1)(2)(3)
Chase检验法则
判断分解后再自然连接是否还是原始的关系;
思想:自然连接后的每个元组都属于原始关系;
如果将关系投影到Si后再进行自然连接,就会得到一个所有分量都不带下标的元组,这个元组不在R中,则连接为无损的;
举例:
保持依赖
思想:FD投影在分解的关系中成立,但是自然连接后不能满足原始的FD
举例:
BCNF
当关系满足如果R中非平凡的函数依赖的左边都是超键,则此关系R属于BCNF;
性质:任何一个二元关系都满足BCNF
证明:如果函数依赖集中存在A-->B,则我们可以说A-->AB,因此A一定是超键;
BCNF分解
注:BCNF分解是无损分解
while(找到违反BCNF的函数依赖){
找出违反BCNF的函数依赖A-->B,先计算A的闭包,且用A的闭包(除去A)替换B,并将其分解为{A+}和{AU(R-(A+)}; //比如A-->B ,而{A}+={A,B,C},则用A-->BC替换A-->B;
求出分解后的关系满足的投影FD集合;
再看分解后的关系的FD集合是否满足BCNF,如果不满足,则继续分解。
}
举例:
3NF
注:3NF是能够无损连接且保持依赖;
放松了BCNF的要求,多出的一个条件为:如果A-->B,则B-A为候选键的一部分(即使在不同的候选键中),则满足3NF;
这里我们对上句中的红色标注部分进行解释,看一个例子:
比如:存在函数依赖A-->BC,{AB}{AC}分别为候选键,而BC-A={BC},B属于候选键{AB},C属于候选键{AC},但是A-->BC仍然满足3NF;
主属性:一个属性属于某个候选键;
比如:{AC}为候选键,则A为主属性,C也为主属性;
3NF分解算法
举例:
1NF
每个属性都保持原子性;
2NF
满足1NF,且每一个非主属性都完全函数依赖于R的主码;
引入多值依赖的原因
从上图中可以知道,此关系的候选键为(name,street,city,title,year),因此不存在任何非平凡的函数依赖,因此遵守BCNF,但是我们可以很容易看出,(street、city)和(title、year)是独立的;放在一个关系中是冗余的;
因此多值依赖的产生就是源于此;我们可以将上图的关系根据4NF分解算法分解关系;
多值依赖(MVD)定义
A1A2....An-->-->B1B2....Bm,则说明
(1)给定A1A2...An的值,B1B2...Bm属性独立于(U-A-B)属性;
(2)给定R中的两个元组a、b,他们的A属性相同,则必然存在第三个元组c,使得c[A]=a[A]=b[A],c[B]=a[B],c[U-A-B]=b[U-A-B];
多值依赖性质
(0)多值依赖其实就是FD的升级,即如果A-->B成立,则A-->-->B也成立;
(1)平凡MVD:如果B是A的子集,则A-->-->B成立;
(2)附加平凡MVD:如果关系R(A,B),则A-->-->B成立;
(3)传递MVD:如果A-->-->B,B-->-->C,则A-->-->C成立;
(4)MVD不满足分解规则:
(5)如果A-->-->B,则A-->-->(R-A-B)成立;
应用于MVD,而不是一般的FD;条件和BCNF差不多;
定义:如果存在非平凡的A-->-->B,且A一定是超键,则为4NF;
4NF分解算法
1.找违反4NF的MVD;
2.按照A-->-->B 分解为{AB} {R-A-B};
3.计算投影FD;
4.继续找违反的MVD,分解.....;
总结: