白话数据库范式

前言

静下心来写一篇介绍1NF、2NF、3NF与BCNF范式的文章。

整体关系

白话数据库范式_第1张图片

他们的约束如上图,也就是说:

  • 满足1NF的约束一定满足2NF。
  • 满足2NF的约束一定满足3NF。
  • 满足3NF的约束一定满足BCNF范式。

从1NF说起

1NF是最宽松的范式,只要属性不可分割就满足1NF。什么是属性?属性就是表中的字段。也就是说,只要存在于数据库里表都满足1NF。那么什么样的表不满足1NF?比如这样一个关于客户信用卡交易的表:


因为我们不知道具体的用户、具体的信用卡信息、具体的交易信息,所以无法存入数据,为了满足1NF我们需要对其细化,如下:


白话数据库范式_第2张图片

我们细化了表属性,同时存入了一些数据。那么你发现有什么问题了吗?

细思极恐,你会发现这样一些问题:

  1. 数据冗余:
    想一下,比如我们的用户Alan,如果有上百条他的交易信息,那么他的用户ID、用户姓名、办卡日期信息会造成大量冗余。

2.插入操作异常:
如果我们有一名新会员Joe办了卡,但是没有交易信息,那么在这个表里,我们应该怎么插入这条信息?答案是不能插。

3.更新操作复杂:
如果我们的用户姓名更改了,比如Alan名字改成了Joe,那么我们每条信息都必须要更改,是否有点愚蠢?

4.删除操作异常:
如果Alan这个用户卡注销了,我们必须把所有关于Alan的信息删除点,这很愚蠢。并且如果我们想把他的交易信息保留下来,是不能做到的。

所以,人们为了解决这些问题,对表有了更加严谨的约束。

2NF

2NF做了什么?他的改进是:

在1NF的基础上,消除了非主属性对于码的部分函数依赖。

这里有几个概念需要复习一下:

  • 函数依赖
  • 非主属性。

复习分根线

函数依赖

这是在范式中很重要的概念,也很好理解。简单,

知道A就能推出B,就称B对于A函数依赖,记做A→B。

比如本例中:


白话数据库范式_第3张图片

(用户ID)→(用户姓名)
即知道了用户ID 就知道了用户姓名,所以,用户姓名 对于 用户ID 函数依赖。

那么函数依赖有哪些类型呢?它有三种类型:

  • 完全函数依赖
  • 部分函数依赖
  • 传递函数依赖。

完全函数依赖

在一张表中,若X→Y,且对于X的任何一个真子集X',X'→Y都不成立,那么称Y对于X完全依赖。

比如(用户ID) → (用户姓名),用户姓名对于用户ID就是完全函数依赖。

部分函数依赖

假如X→Y,但是Y不完全依赖于X,那么就称Y部分依赖于X。

比如本例的(用户ID,交易ID)→(交易日期,金额)就是部分函数依赖。因为(交易ID)→(交易日期,金额),所以(交易日期,金额)部分依赖于(用户ID)。

传递函数依赖

假如Z依赖于Y,Y依赖于X,那么就称Z传递依赖于X。

设 K 为某表中的一个属性或属性组,若除 K 之外的所有属性都完全函数依赖于 K(注意是完全),那么我们称 K 为候选码,简称为码。

比如本例中(用户ID,信用卡ID,交易ID)能推出所有属性,那么(用户ID,信用卡ID,交易ID)就是码。码就不细说了,不然篇幅较长。

非主属性

不是码的属性。

比如本例中 用户ID信用卡ID交易ID是主属性,用户姓名、办卡日期、交易日期、金额是非主属性。


回到主线

终于可以接着讲2NF了,再读这句话,我们有了不一样的理解:

在1NF的基础上,消除了非主属性对于码的部分函数依赖。

白话数据库范式_第4张图片

我们列出所有的函数依赖:

  1. (用户ID,信用卡ID,交易ID)→(用户姓名,交易日期,金额)
  2. (用户ID)→(用户姓名)
  3. (交易ID)→(交易日期,金额)

发现存在(用户ID)→(用户姓名),(交易ID)→(交易日期,金额)的部分依赖,所以我们对表进行分解,如下:


白话数据库范式_第5张图片

分解后R1、R2、R3均不存在部分函数依赖,符合2NF。

3NF

例子举得不好,后面来补坑。。。

你可能感兴趣的:(白话数据库范式)