数据库原理及应用(补充)

一、关系数据理论

1.关系模式的形式化定义

        R(U, D, DOM, F)

R:关系名,是符号化的元组语义

U:该关系的属性集合

D:属性组U中属性所来自的域

DOM:属性向域的映象集合

F:属性间数据的依赖关系集合


2.关系模式的简化表示

      R

将关系模式简化为一个三元组,影响数据库模式设计的主要是U和F.

当且仅当U上的一个关系r满足F时,r称为关系模式R(U, F)的一个关系。


3.如何解决关系模式中存在的问题?

规范化理论:找出关系模式中不合适的数据依赖,消除它们,可以在不同程度上解决插入异常、删除异常、更新异常和数据冗余问题。


二、函数依赖

1.函数依赖

*定义:设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r, r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等则称“X函数确定Y”或“Y函数依赖于X”,记作X →Y。

    X称为这个函数依赖的决定属性组,也称为决定因素(Determinant)。

例: S(Sno, Sname, Ssex, Sage, Sdept)

F= {Sno-→Sname, Sno →Ssex, Sno →Sage,Sno →Sdept}

      若Y不函数依赖于X,则记为X→Y,箭头上加一斜杠。


*注意事项

(1)函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。

      ■如Sname→Sno函数依赖只有在“学生不允许有重名”的条件下成立。

(2)数据库设计者可以对现实世界作强制的规定。

      ■例如设计者可以强行规定不允许学生有重名,因而使函数依赖

      Sname→Sno, Sname→Ssex,Sname→Sage, Sname→Sdept成立。

(3)函数依赖是指关系模式R在任何时刻的关系实例均要满足的约束条件。

      ■不是指某个或某些关系实例r满足的约束条件,而是指R的所有关系实例r均要满足的约束条件。


2.平凡函数依赖与非平凡函数依赖

(1) X→Y,Y不包含于X,则称X→Y是非平凡的函数依赖。

(2) X→Y,但Y包含于X,则称X→Y是平凡的函数依赖。

例:在关系SC(Sno, Cno, Grade)中,

非平凡函数依赖: (Sno, Cno)→Grade

平凡函数依赖:

(Sno, Cno) →Sno    (Sno, Cno)→Cno

对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明,我们总是讨论非平凡函数依赖。


3.完全函数依赖与部分函数依赖

(1)在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X',都有X'→Y,则称Y完全函数依赖于X,记作X→Y,箭头上加F(Full)。

(2)若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作X→Y,箭头上加P(Part)。

在关系STUDENT(Sno ,Sdept,Mname,Cno,Grade)中,

(Sno, Cno)→(F) Grade是完全函数依赖

(Sno, Cno)→ (P)Sdept是部分函数依赖,因为Sno→ Sdept


Student关系图


4.传递函数依赖

(1)定义:在R (U)中,如果X→Y, (Y 不包含于X) ,  Y不依赖于X,Y→Z, 则称Z对X传递函数依赖(transitive functional dependency)。记为:X→(传递)Z

注意:如果Y→X,即X←→Y,则Z直接依赖于X。

例:在关系STUDENT (Sno ,Sdept, Mname,Cno,Grade)中,

Sno→Sdept, Sdept→Mname, Sno→(传递)Mname

Student关系图


三、码

1. 设K为关系模式R中的属性或属性组合。若K→(F)U,则K称为R的一个候选码(Candidate Key)。

■如果U部分函数依赖于K,即K →(P) U,则K称为超码(Surpkey)

■候选码是最小的超码,即K的任意一个真子集都不是候选码

[例] S(Sno, Sdept, Sage)

Sno→ (Sno, Sdept, Sage) ,Sno是码

(Sno, Sdept)、(Sno, Sage)、(Sno, Sdept, Sage)是超码

SC(Sno, Cno, Grade)中,(Sno, Cno)是码

2. 若关系模式R有多个候选码,则选定其中的一个做为主码(Primary key)。

[例] S(Sno, Sname, Sdept, Sage),假设学生无重名

Sno、Sname是候选码,选择Sno为主码。

3. 主属性与非主属性

■包含在任何一个候选码中 的属性,称为主属性( Prime attribute )

■不包含在任何码中的属性称为非主属性( Nonprime attribute)或非码属性 ( Non-key attribute )

[例] S(Sno, Sdept, Sage), Sno是码,Sno是主属性,Sdept, Sage是非主属性。

SC(Sno, Cno, Grade)中,(Sno, Cno)是码,Sno, Cno是主属性,Grade是非主属性

4.  全码:整个属性组是码,称为全码(All-key)

[例]关系模式R(P,w,A)  P:演奏者  W:作品  A:听众

      语义:一个演奏者可以演奏多个作品,某作品可被多个演奏者演奏,听众可以欣赏不同演奏者的不同作品

      R (P, W, A)码为(P, W, A),即全码,All-Key。

关系模式R, U中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码(Foreign key)也称外码。

SC (Sno, Cno, Grade) 中,Sno不是码,但Sno是关系模式

S (Sno, Sdept, Sage) 的码,则Sno是关系模式SC的外部码。

主码与外部码起提供了表示关系间联系的手段


四、范式

1.范式:是符合某一种级别的关系模式的集合。

(1)关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式。

(2)范式的种类:

第一范式(1NF)、第二范式(1NF)、第三范式(1NF)、BC范式、第四范式(1NF)、第五方式(1NF)。

(3)各范式之间的联系

各范式之间的关系

某一关系模式R为第n范式,可简记为:R∈nNF

一个低一级范式的关系模式,通过模式分解可转化为若干个高一级范式的关系模式的集合,这种过程叫做规范化。


2.第一范式 ( 1NF )

(1)定义:如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。

第一范式是对关系模式的最起码的要求,不满足第一范式的数据库模式不能称为关系数据模式。

(2)满足第一范式的关系模式并不一定是一个好的关系模式,比如:

关系模式S-L-C(Sno,Cno,Sdept,Sloc,Grade),其属性依次为学生学号,学生课程号,学生所属系,学生住处,学生成绩。假设每个系的学生住在同一个楼。

那么有以下关系:

S-L-C(Sno,Cno,Sdept,Sloc,Grade)

存在问题:插入异常,删除异常,数据冗余度大,修改复杂等。为了解决这些问题,需要将其转化为第二范式


3.第二范式(2NF)

(1)定义:关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。

(2)举例:上述S-L-C(Sno,Cno,Sdept,Sloc,Grade)∈1NF,不属于2NF。

转化为第二范式:

由于关系模式SLC中,Sdept、Sloc部分函数依赖于码,SLC的码为(Sno,Cno)。

采用投影分解法,把SLC分解成两个关系模式,消除这些部分函数依赖。

LSC由1NF转化为2NF(函数依赖图)

关系模式SC的码为(Sno,Cno),关系模式S-L的码为Sno。

转化后,非主属性对码都是完全函数依赖,且都是2NF。


4.第三范式(3NF)

(1)定义:关系模式R∈1NF,若R中【不存在】这样的码X,属性组Y及非主属性Z ( Z不包含于Y) ,使得X→Y,Y→Z,Z→X,成立,则R∈3NF。

(2)上述例子,关系模式S-L中,不存在部分函数依赖,但是存在传递函数,所以S-L(Sno,Sdept,Sloc)∈2NF,不属于第三范式。

关系模式S-L函数依赖图

将其转化为第三范式,可得:

关系模式S-D(Sno,Sdept),关系模式D-L(Sloc)


在分解后的关系模式中,既没有非主属性对码的部分函数依赖,也没有非主属性对码的传递函数依赖,进一步解决了存在的插入,删除,更新异常,数据冗余度大等问题。

你可能感兴趣的:(数据库原理及应用(补充))