表设计的三种范式

【数据库设计篇】用最通俗易懂的 描述语言 解释 数据库三大范式
2011年06月30日 星期四 0:42

本文颠覆数据库设计中对数据库范式“难理解”“难接受”“难运用”的看法,将用最通俗易懂的语言描述高深的技术问题,请看过本文的同志们发表下评论,如仍有意见和建议请直言不误:

数据规范化的主要目的是消除冗余,那什么叫冗余呢?比如一个1MB文件,在1000个目录里需要引用这个文件,如果拷贝1000次,就需要1000MB的空间存放这个文件及其复制品,这就造成了空间的浪费。但如果在引用的地方建立快捷方式,则避免了冗余,而且至少存在两个好处

1. 只需1MB磁盘空间存储这个文件;

2. 更新一个文件,就能同步更新所有引用这个文件的内容;

就好比:手机说话不开扬声器前提下,只有一个人能看到,但广播,则一群人能听到,这相比将一件事告诉10个人,说上10遍要轻松多。

以上解释的文字有点多,只是先做个铺垫,便于以下精炼通俗语言的理解!!!!

【依赖】 --- 解释:比如b依赖a,即如果a没有了,b就没有存在的意义。

【主键或候选键】 -- 作用是确定表数据的唯一性。具体概念这里不做细讲。

 

第一范式 无重复的列  --!!!!! 注意是列不是行 !!!!!

情况1: 不能有重复的属性列

关系 table(col_1,col_2,col_2)      -- 存在两列重复,造成数据冗余,可以删除一列,注意,有时列名不一定一样,但内容完全一样,也是冗余,不满足第一范式。

情况2:同一个属性里不能有多个值,必须是单值;

这个很好解释,即为什么表要设计成多个字段,而不是仅设计成1个字段,把所有内容都写进去?!自己领悟吧 :)

第二范式 完全依赖于主键(消除非主属性对主码的部分函数依赖)

关系table(col_1,col_2,col_3)  如果主键是(col_1,col_2) ,col_3仅依赖于col_2,属部分依赖,则不满足第二范式

--注意:只有出现复合候选码时才可能存在部分函数依赖。 

第三范式 不依赖其他非主属性(消除传递依赖)

关系table(col_1,col_2,col_3,col_4)  如果主键是(col_1,col_2),col_3依赖(col_1,col_2) 则满足第二范式,但如果col_4依赖于col_3,则不满足第三范式。 

到此应该彻底明白了吧,以下这句话只写给看到这里的同志们看:

如果有难以理解和消化的数据库概念,可以给我留言,我将根据具体情况在下一篇章进行通俗解释。


==================================================================

数据库设计的三大范式

 

为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

在实际开发中最为常见的设计范式有三个:

1.第一范式

第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足了第一范式。

第一范式的合理遵循需要根据系统的实际需求来定。比如某些数据库系统中需要用到“地址”这个属性,本来直接将“地址”属性设计成一个数据库表的字段就行。但是如果系统经常会访问“地址”属性中的“城市”部分,那么就非要将“地址”这个属性重新拆分为省份、城市、详细地址等多个部分进行存储,这样在对地址中某一部分操作的时候将非常方便。这样设计才算满足了数据库的第一范式,如下表所示。

 

用户信息表

编号

姓名

性别

年龄

联系电话

省份

城市

详细地址

1

张红欣

26

0378-23459876

河南

开封

朝阳区新华路23号

2

李四平

32

0751-65432584

广州

广东

白云区天明路148号

3

刘志国

21

0371-87659852

河南

郑州

二七区大学路198号

4

郭小明

27

0371-62556789

河南

郑州

新郑市薛店北街218号

上表所示的用户信息遵循了第一范式的要求,这样在对用户使用城市进行分类的时候就非常方便,也提高了数据库的性能。

 

2.第二范式

第二范式在第一范式的基础之上更进一层。第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。

比如要设计一个订单信息表,因为订单中可能会有多种商品,所以要将订单编号和商品编号作为数据库表的联合主键,如下表所示。

 

 订单信息表

订单编号

商品编号

商品名称

数量

单位

商品价格

001

1

挖掘机

1

1200000¥

002

2

冲击钻

8

230¥

003

3

铲车

2

980000¥

这样就产生一个问题:这个表中是以订单编号和商品编号作为联合主键。这样在该表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这里违反了第二范式的设计原则。

而如果把这个订单信息表进行拆分,把商品信息分离到另一个表中,就非常完美了。如下面这两个所示。

 

 订单信息表

订单编号

商品编号

数量

001

1

1

002

2

8

003

3

2

 

商品信息表

商品编号

商品名称

单位

商品价格

1

挖掘机

1200000¥

2

冲击钻

230¥

3

铲车

980000¥

这样设计,在很大程度上减小了数据库的冗余。如果要获取订单的商品信息,使用商品编号到商品信息表中查询即可。

 

3.第三范式

第三范式在第二范式的基础上更进一层。第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。

比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。

 

订单信息表

订单编号

订单项目

负责人

业务员

订单数量

客户编号

001

挖掘机

刘明

李东明

1台

1

002

冲击钻

李刚

霍新峰

8个

2

003

铲车

郭新一

艾美丽

2辆

1

 

客户信息表

客户编号

客户名称

所属公司

联系方式

1

李聪

五一建设

13253661015

2

刘新明

个体经营

13285746958

这样在查询订单信息的时候,就可以使用客户编号来引用客户信息表中的记录,也不必在订单信息表中多次输入客户信息的内容,减小了数据冗余。

你可能感兴趣的:(职场,表设计,休闲,三种范式)