关系模式由五部分组成,是一个五元组:R(U, D, DOM, F)
R是符号化的元组语义
U为一组属性
D为属性组U中的属性所来自的域
DOM为属性到域的映射
F为属性组U上的一组数据依赖
D、DOM与模式设计关系不大,只用到三元组:R
二维表每个分量必须是不可分开的数据项,满足了这个条件的关系模式就属于:第一范式(1NF)
数据依赖
1.是一个关系内部属性与属性之间的一种约束关系
2.通过属性间值的相等与否体现出来的数据间相互联系
3.是现实世界属性间相互联系的抽象
4.是数据内在的性质
5.是语义的体现。
主要类型:
◼函数依赖(简记为FD)
◼多值依赖(简记为MVD)
某些模式的函数依赖可能存在某些不好的性质,比如:
(1)数据冗余
有些数据重复出现,这会浪费大量的存储空间
(2)更新异常
由于数据亢余,系统需要很大代价维护数据库完整性,否则将会面临数据不一致的风险
(3)插入异常
由于某些数据初始值缺失等,无法执行插入功能
(4)删除异常
可能连带删除有用的其他信息
==定义:==设R(U)是一个属性集U上的关系模式,X和Y是U的子集。
若对于R(U)的任意一个可能的关系r,r 中不可能存在: 两个元组在X上的属性值相等,而在Y上的属性值不等, 则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。
一些术语以及记号
X→Y,但Y⊈X则称X→Y是非平凡的函数依赖。
X→Y,但Y⊆X 则称X→Y是平凡的函数依赖。
若X→Y,则X称为这个函数依赖的决定因素
若X→Y,Y→X,则记作X←→Y。
若Y不函数依赖于X,则记作 x ↛ y x \not\rightarrow y x→y。
完全函数依赖与部分函数依赖
在R(U)中,如果X→Y,并且对于X的任何一个真子集X’, 都有 X’ ↛ Y \not\rightarrow Y →Y, 则称Y对X完全函数依赖,记作 X → F Y X\overset F\rightarrow Y X→FY
Y。若X→Y,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作 X → P Y X\overset P\rightarrow Y X→PY
传递函数依赖
在R(U)中,如果X→Y(Y⊈X),Y ↛ \nrightarrow ↛X,Y→Z,Z⊈Y, 则称Z对X传递函数依赖。记为: X → 传 递 Y X \overset {传递}\rightarrow Y X→传递Y
(如果Y→X, 即X←→Y,则Z直接依赖于X,而不是传递函数依赖。)
设K为R中的属性或属性组合。
若 K → F U K \overset F \rightarrow U K→FU则K称为R的一个候选码。
如果U部分函数依赖于K,即 K → P U K \overset P \rightarrow U K→PU,则K称为超码 。
候选码是最小的超码,即K的任意真子集都不是候选码。
若关系模式R有多个候选码,则选定其中的一个做为主码。
包含在任何一个候选码中的属性 ,称为主属性
不包含在任何码中的属性称为非主属性
整个属性组是码,称为全码
关系模式 R中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码
范式是满足一定要求的关系模式的集合。满足最低要求的称为第一范式,以此类推
1.第一范式(1NF)
2.第二范式(2NF)
3.第三范式(3NF)
4.BC范式(BCNF)
5.第四范式(4NF)
6.第五范式(5NF)
之间的关系为
图像表示
一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化。
定义:若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于任何一个候选码,则R∈2NF
设关系模式R∈1NF,若R中不存在这样的码X、属性组Y及非主属性Z (Y⊇ Z), 使得X→Y,Y→Z成立,Y ↛ X不成立,
则称R ∈ 3NF。
通常认为BCNF是修正的第三范式,有时也称为扩充的第三范式。
定义 设关系模式R∈1NF,若X →Y且Y ⊆ X时X必含有码,则R∈BCNF。
换言之,在关系模式R中,如果每一个决定属性集都包含候选码,则R∈BCNF。
一个满足BCNF的关系模式有:
所有非主属性对每一个码都是完全函数依赖
所有主属性对每一个不包含它的码也是完全函数依赖
没有任何属性完全函数依赖于非码的任何一组属性。
定义 设R(U)是属性集U上的一个关系模式。X,Y,Z是U的子集,并且Z=U-X-Y。关系模式R(U)中多值依赖X→→Y成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值,有一组Y的值,这组值仅仅决定于x值而与z值无关。
平凡多值依赖和非平凡的多值依赖
若X→→Y,而Z=Ф,则称X→→Y为平凡的多值依赖。
否则称X→→Y为非平凡的多值依赖。
定义关系模式R∈1NF,如果对于R的每个非平凡多值依赖X→→Y(Y ⊈ X),X都含有码,则R∈4NF。
如果一个关系模式是4NF, 则必为BCNF。
闭包(记作X+ )就是由一个属性直接或间接推导出的所有属性的集合。
例如:
f={a->b,b->c,a->d,e->f};
由a可直接得到b和d,间接得到c,
则a的闭包就是{a,b,c,d}
对于给定的关系R(A1,A2,…An)和函数依赖集F,可将其属性分为4类:
L类 仅出现在函数依赖左部的属性。
R 类仅出现在函数依赖右部的属性。
N 类 在函数依赖左右两边均未出现的属性。
LR类 在函数依赖左右两边均出现的属性。
推论
1.对于给定的关系模式R及其函数依赖集F,若X(X∈R)是L类属性,则X必为R的任一候选码的成员。
2.若X(X∈R)是L类和N类组成的属性集,且X+包含了R的全部属性;则X是R的唯一候选码。
不能说规范化程度越高的关系模式就越好。必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式。