数据表的范式

范式是数据表设计的基本原则。

  1. 目前关系型数据库一共有六种范式,从低到高分别是:1NF(第一范式)、2NF(第二范式)、3NF(第三范式)、BCNF(巴斯-科德范式)、4NF(第四范式)和5NF(第五范式,也称完美范式)。
  • 数据库的范式设计越高级,冗余度就越低。
  • 高阶的范式一定符合低阶范式的要求。

一般来讲,数据表的设计应该满足3NF。但也并非绝对,所以有时还需要破坏范式规则,也就是反规范化。

  1. 范式的定义会使用到主键和候选键(因为主键和候选键可以唯一标识元组),数据库中的键(Key)由一个或者多个属性组成。我总结了下数据表中常用的几种键和属性的定义:
    超键:能唯一标识元组的属性集叫做超键。
    候选键:如果超键不包括多余的属性,那么这个超键就是候选键。
    主键:用户可以从候选键中选择一个作为主键。
    外键:如果数据表 R1 中的某属性集不是 R1 的主键,而是另一个数据表 R2 的主键,那么这个属性集就是数据表 R1 的外键。
    主属性:包含在任一候选键中的属性称为主属性。
    非主属性:与主属性相对,指的是不包含在任何一个候选键中的属性。

我们以 NBA 的球员表(player)和球队表(team)为例。这里我可以把球员表定义为包含球员编号、姓名、身份证号、年龄和球队编号;球队表包含球队编号、主教练和球队所在地。
对于球员表来说,超键就是包括球员编号或者身份证号的任意组合,比如(球员编号)(球员编号,姓名)(身份证号,年龄)等。
候选键就是最小的超键,对于球员表来说,候选键就是(球员编号)或者(身份证号)。
主键是我们自己选定,也就是从候选键中选择一个,比如(球员编号)。
外键就是球员表中的球队编号。
在 player 表中,主属性是(球员编号)(身份证号),其他的属性(姓名)(年龄)(球队编号)都是非主属性。

  1. 1NF 指的是数据库表中的任何属性都是原子性的,不可再分。这很好理解,我们在设计某个字段的时候,对于字段 X 来说,就不能把字段 X 拆分成字段 X-1 和字段 X-2。事实上,任何的 DBMS 都会满足第一范式的要求,不会将字段进行拆分。
    2NF 指的数据表里的非主属性都要和这个数据表的候选键有完全依赖关系。所谓完全依赖不同于部分依赖,也就是不能仅依赖候选键的一部分属性,而必须依赖全部属性。
    3NF 在满足 2NF 的同时,对任何非主属性都不传递依赖于候选键。也就是说不能存在非主属性 A 依赖于非主属性 B,非主属性 B 依赖于候选键的情况。

总结为一句话,那就是

  • 1NF是不可分性(山无棱,天地合,乃敢与君绝);
  • 2NF是完全依赖性(玲珑骰子安红豆,入骨相思知不知);
  • 3NF是直接性(问世间,情为何物,直教人生死相许?)。

你可能感兴趣的:(MySQL)