第一范式、第二范式、第三范式、BC范式

范式的目标

应用数据库范式可以带来许多好处,但是最重要的好处归结为三点:

1.减少数据冗余(这是最主要的好处,其他好处都是由此而附带的)

2.消除异常(插入异常,更新异常,删除异常)

3.让数据组织的更加和谐…

DEMO

让我们先从一个未经范式化的表看起,表如下:

第一范式、第二范式、第三范式、BC范式_第1张图片

先对表做一个简单说明,employeeId是员工id,departmentName是部门名称,job代表岗位,jobDescription是岗位说明,skill是员工技能,departmentDescription是部门说明,address是员工住址

第一范式(1NF)

如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。

简单的说,第一范式就是每一个属性都不可再分。不符合第一范式则不能称为关系数据库。对于上表,不难看出Address是可以再分的,比如”北京市XX路XX小区XX号”,显然不符合第一范式,对其应用第一范式则需要将此属性分解到另一个表,如下:

第一范式、第二范式、第三范式、BC范式_第2张图片

其次,每笔记录都要能利用一个惟一的主键来加以识别

第一范式、第二范式、第三范式、BC范式_第3张图片

这里出现了重复组,同样不满足第一范式,因为缺乏唯一标识码,可改为

这里写图片描述

第二范式(2NF)

若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF

简单的说,是表中的属性必须完全依赖于全部主键,而不是部分主键.所以只有一个主键的表如果符合第一范式,那一定是第二范式。这样做的目的是进一步减少插入异常和更新异常。

在上表中,departmentDescription是由主键DepartmentName所决定,但却不是由主键EmployeeID决定,所以departmentDescription只依赖于两个主键中的一个,故要departmentDescription对主键是部分依赖,对其应用第二范式如下表:

第一范式、第二范式、第三范式、BC范式_第4张图片

第三范式(3NF)

关系模式 R<UF> 中若不存在这样的码X、属性组Y及非主属性Z(Z  Y), 使得X→Y,Y→Z,成立,则称 R<UF>3NF

简单的说,第三范式是为了消除数据库中关键字之间的依赖关系,在上面经过第二范式化的表中,可以看出jobDescription(岗位职责)是由job(岗位)所决定,则jobDescription依赖于job,可以看出这不符合第三范式,对表进行第三范式后的关系图为:

第一范式、第二范式、第三范式、BC范式_第5张图片

上表中,已经不存在数据库属性互相依赖的问题,所以符合第三范式。

BC范式(BCNF)

设关系模式 R<UF>1NF ,如果对于R的每个函数依赖X→Y,若Y不属于X,则X必含有候选码,那么R∈BCNF。

简单的说,bc范式是在第三范式的基础上的一种特殊情况,既每个表中只有一个候选键(在一个数据库中每行的值都不相同,则可称为候选键),在上面第三范式的noNf表中可以看出,每一个员工的email都是唯一的(难道两个人用同一个email??)则,此表不符合bc范式,对其进行bc范式化后的关系图为:

第一范式、第二范式、第三范式、BC范式_第6张图片

你可能感兴趣的:(数据库,计算机学科学习笔记)