第一范式、第二范式和第三范式

数据库的范式

概念:设计数据库是,需要遵循的一些规范,要遵循后边的范式要求,必须遵循前边的所有范式要求

设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈梯次规范,越高的范式数据库冗余越小

目前关系型数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BC范式、第四范式(4NF)、第五范式(5NF)。

 

分类:

第一范式:每一列都是不可分割的原子数据项

第二范式:在第一范式基础上,非码属性必须完全依赖于候选码(在第一范式基础上消除非主属性对主码的部分依赖)

几个概念:

  1. 函数依赖:A-->B,如果通过A属性(属性组)的值,可以确定唯一B属性的值。则B依赖于A

例如:学号-->姓名      (学号,课程名称) --> 分数

  1. 完全函数依赖:A->B  如果A是一个属性组,则B属性值得确定需要依赖于A属性组中的所有的属性值。

例如:(学号,课程名称) --> 分数

  1. 部分函数依赖:A --> B,如果A是一个属性组,则B属性值得确定只需要依赖于A属性组中某一些值即可。

例如:(学号,课程名称) --> 姓名

  1. 传递函数依赖:A --> B,B --> C ,如果A属性(属性组)的值,可以唯一确定B属性的值,在通过B属性(属性组)的值可以唯一确定C属性的值,则称C传递函数依赖于A

例如:学号 --> 系别,系别-->系主任

  1. 码:如果在一张表中,一个属性或属性组,被其他所有属性完全依赖,则称这个属性(属性组)为该表的码。

例如:该表中码为:(学号,课程名称)

主属性:码属性组中的所有属性

非主属性:除码属性组的属性

第三范式:在第二范式基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)

 

 

 

学号

姓名

课程名称

分数

系名

系主任

10010

张无忌

经济系

张三丰

高等数学

95

10010

张无忌

经济系

张三丰

英语

93

10010

张无忌

经济系

张三丰

计算机基础

97

10011

令狐冲

法律系

任我行

线性代数

88

10011

令狐冲

法律系

任我行

刑法

87

10012

杨过

艺术系

小龙女

家庭法

88

10012

杨过

艺术系

小龙女

唱歌

99

表一

不满足第一范式

 

学号

姓名

系名

系主任

课程名称

分数

10010

张无忌

经济系

张三丰

高等数学

95

10010

张无忌

经济系

张三丰

英语

93

10010

张无忌

经济系

张三丰

计算机基础

97

10011

令狐冲

法律系

任我行

线性代数

88

10011

令狐冲

法律系

任我行

刑法

87

10012

杨过

艺术系

小龙女

家庭法

88

10012

杨过

艺术系

小龙女

唱歌

99

表二

第一范式

存在的问题:

  1. 数据有大量冗余(重复)
  2. 数据添加存在问题,添加新开设的系和系主任时,数据不合法
  3. 数据存在问题:张无忌同学毕业了,删除数据,会将系的数据一起删除

 

 

 

选课表

学号

课程名称

分数

10010

高等数学

95

10010

英语

93

10011

计算机基础

97

10011

线性代数

88

10012

刑法

87

 10012

高等数学

88

 

 

学生表

学号

姓名

系名

系主任

10010

张无忌

经济系

张三丰

10011

令狐冲

法律系

任我行

10012

杨过

艺术系

小龙女

 

第二范式

 

存在问题:

1、数据添加存在问题,添加新开设的系和系主任时,数据不合法

2、数据存在问题:张无忌同学毕业了,删除数据,会将系的数据一起删除

 

 

 

 

 

 

选课表

学号

课程名称

分数

10010

高等数学

95

10010

英语

93

10011

计算机基础

97

10011

线性代数

88

10012

刑法

87

 10012

高等数学

88

 

 

 

 

 

 

学生表

学号

姓名

10010

张无忌

10011

令狐冲

10012

杨过

 

 

系名

系主任

经济系

张三丰

法律系

任我行

艺术系

小龙女

 

 

第三范式

存在的所有问题都被解决了

你可能感兴趣的:(数据库,范式)