面试高频 -五问 三大范式

预祝大家圣诞节快乐!看完文章记得点赞哦 ( ̄▽ ̄)


面试官:你这简历上写着熟悉数据库设计,那你知道数据库一共有几种范式吗?

目前关系数据库有六种范式:

  • 第一范式(1NF)
  • 第二范式(2NF)
  • 第三范式(3NF,又称巴斯-科德范式(BCNF))
  • 第四范式 (4NF)
  • 第五范式(5NF,又称完美范式)

最常接触到的是前三个范式

面试官:不错,还知道第五第六范式,那你能说下范式具体是用来干嘛的吗?

我们在设计关系数据库时,要遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小,简单来说就是规范数据库的设计

面试官:嗯,那你来具体说下前三大范式分别是什么?带上例子解释 一下

第一范式(1NF)

是对属性的 原子性 的要求,要求属性具有原子性,不可再分解;

如这个user表就不符合第一范式,因为region列不具有原子性,能拆分成省份、市和具体地址

正确做法


第二范式(2NF)

2NF是对记录的 唯一性 ,要求记录有惟一标识,即实体的惟一性,即不存在部分依赖;

这个表明显说明了两个事务:学生信息, 课程信息;

由于非主键字段必须依赖主键,这里学分依赖课程号,名字依赖与学号,所以不符合二范式。

这么做可能会存在问题:

  • 数据冗余:,每条记录都含有相同信息;
  • 删除异常:删除所有学生成绩,就把课程信息全删除了;
  • 插入异常:学生未选课,无法记录进数据库;
  • 更新异常:调整课程学分,所有行都调整。

正确做法:

  • 学生:Student(学号, 姓名);
  • 课程:Course(课程号, 学分);
  • 选课关系:StudentCourse(学号, 课程号, 成绩)。

第三范式(3NF,又称巴斯-科德范式(BCNF))

3NF是对字段的 冗余性 ,要求任何字段不能由其他字段派生出来,它要求字段没有冗余,即不存在传递依赖;

因为存在依赖传递: (学号) → (姓名)→(所在学校) → (学校电话) 。

可能会存在问题:

  • 数据冗余:有重复值;

  • 更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况 。

正确做法:

  • 学生:(学号, 姓名, 年龄, 所在学院);

  • 学院:(学院, 电话)。

面试官:回答的不错,那你平时设计的时候都遵守三大范式吗?不遵守的话什么时候会去突破范式?

没有规矩不成方圆,一般下我会只遵守第三范式(3NF)。

没有冗余的数据库设计可以做到三大范式都遵守。但是,没有冗余的数据库未必是最好的数据库,有时为了提高运行效率,就必须降低范式标准,适当保留冗余数据。

具体做法是:在概念数据模型设计时遵守第三范式,降低范式标准的工作放到物理数据模型设计时考虑。

降低范式就是增加字段,允许冗余,达到以空间换时间的目的。

面试官:好,那你最后再说下,遵守范式化设计和不遵守范式化设计,也就是反范式化设计的优缺点?

范式化设计的优点在于:

  • 可以尽量的减少数据冗余,数据表更新快体积小
  • 范式化的更新操作比反范式化更快
  • 范式化的表通常比反范式化更小

缺点在于:

  • 对于查询需要对多个表进行关联(导致性能降低)
  • 更难进行索引优化

反范式化优点在于:

  • 可以减少表的关联
  • 可以更好的进行索引优化

缺点:

存在数据冗余及数据维护的异常 对数据的修改需要更多的成本

你可能感兴趣的:(面试高频 -五问 三大范式)