数据库知识点总结

数据库也是计算机类笔试面试中不可避免会遇到的考点,尤其是银行和部分传统软件类公司。这里根据整理的资料,对数据库的相关知识也做个总结吧。希望学过数据库但长时间不用的同学根据这些知识能够回忆和重拾,没学过的同学能掌握一些数据库的基础知识。

第一节

一、相关概念

1. Data:数据,是数据库中存储的基本对象,是描述事物的符号记录。
2. Database:数据库,是长期储存在计算机内、有组织的、可共享的大量数据的集合。
3. DBMS:数据库管理系统,是位于用户与操作系统之间的一层数据管理软件,用于科学地组织、存储和管理数据、高效地获取和维护数据。
4. DBS:数据库系统,指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统、应用系统、数据库管理员(DBA)构成。
5. 数据模型:是用来抽象、表示和处理现实世界中的数据和信息的工具,是对现实世界的模拟,是数据库系统的核心和基础;其组成元素有数据结构、数据操作和完整性约束。
6. 概念模型:也称信息模型,是按用户的观点来对数据和信息建模,主要用于数据库设计。
7. 逻辑模型:是按计算机系统的观点对数据建模,用于DBMS实现。
8. 物理模型:是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。
9. 实体和属性:客观存在并可相互区别的事物称为实体。实体所具有的某一特性称为属性。
10.E-R图:即实体-关系图,用于描述现实世界的事物及其相互关系,是数据库概念模型设计的主要工具。
11.关系模式:从用户观点看,关系模式是由一组关系组成,每个关系的数据结构是一张规范化的二维表。
12.型/值:型是对某一类数据的结构和属性的说明;值是型的一个具体赋值,是型的实例。
13.数据库模式:是对数据库中全体数据的逻辑结构(数据项的名字、类型、取值范围等)和特征(数据之间的联系以及数据有关的安全性、完整性要求)的描述。
14.数据库的三级系统结构:外模式、模式和内模式。
15.数据库内模式:又称为存储模式,是对数据库物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式。
16.数据库外模式:又称为子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图。通常是模式的子集。一个数据库可有多个外模式。
17.数据库的二级映像:外模式/模式映像、模式/内模式映像。

 

二、重点知识点

1. 数据库系统由数据库、数据库管理系统、应用系统数据库管理员构成。

2. 数据模型的组成要素是:数据结构、数据操作、完整性约束条件

3. 实体型之间的联系分为一对一、一对多多对多三种类型。

4. 常见的数据模型包括:关系、层次、网状、面向对象、对象关系映射等几种。

5. 关系模型的完整性约束包括:实体完整性、参照完整性和用户定义完整性

6. 阐述数据库三级模式、二级映象的含义及作用。
数据库三级模式反映的是数据的三个抽象层次: 模式是对数据库中全体数据的逻辑结构和特征的描述。内模式又称为存储模式,是对数据库物理结构和存储方式的描述。外模式又称为子模式或用户模式,是对特定数据库用户相关的局部数据的逻辑结构和特征的描述

 

数据库三级模式通过二级映象在 DBMS 内部实现这三个抽象层次的联系和转换。外模式面向应用程序, 通过外模式/模式映象与逻辑模式建立联系, 实现数据的逻辑独立性。 模式/内模式映象建立模式与内模式之间的一对一映射, 实现数据的物理独立性。

 

第二节

一、相关概念

 

1. 主键: 能够唯一地标识一个元组的属性或属性组称为关系的键或候选键。 若一个关系有多个候选则可选其一作为主(Primary key)。

2. :如果一个关系的一个或一组属性引用(参照)了另一个关系的,则称这个或这组属性为外码或外键(Foreign key)。

3. 关系数据库: 依照关系模型建立的数据库称为关系数据库。 它是在某个应用领域的所有关系的集合。

4. 关系模式: 简单地说,关系模式就是对关系的型的定义, 包括关系的属性构成、各属性的数据类型、 属性间的依赖、 元组语义及完整性约束等。 关系是关系模式在某一时刻的状态或内容, 关系模型是型, 关系是值, 关系模型是静态的、 稳定的, 而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。

5. . 实体完整性:用于标识实体的唯一性。它要求基本关系必须要有一个能够标识元组唯一性的主键,主键不能为空,也不可取重复值

6. 参照完整性: 用于维护实体之间的引用关系。 它要求一个关系的外键要么为空, 要么取与被参照关系对应的主键值,即外键值必须是主键中已存在的值

7. 用户定义的完整性:就是针对某一具体应用的数据必须满足的语义约束。包括非空、 唯一和布尔条件约束三种情况。

二、重要知识点

 

1. 关系数据库语言分为关系代数关系演算结构化查询语言三大类。

2. 关系的 5 种基本操作是选择、投影、并、差、笛卡尔积。

3.关系模式是对关系的描述,五元组形式化表示为:R(U,D,DOM,F),其中

R —— 关系名

U —— 组成该关系的属性名集合

D —— 属性组 U 中属性所来自的域

DOM —— 属性向域的映象集合

F —— 属性间的数据依赖关系集合

4.笛卡尔乘积,选择和投影运算如下

数据库知识点总结_第1张图片

第三节

一、相关概念

 

1. SQL:结构化查询语言的简称, 是关系数据库的标准语言。SQL 是一种通用的、 功能极强的关系数据库语言, 是对关系数据存取的标准接口, 也是不同数据库系统之间互操作的基础。集数据查询、数据操作、数据定义、和数据控制功能于一体。

2. 数据定义:数据定义功能包括模式定义、表定义、视图和索引的定义。

3. 嵌套查询:指将一个查询块嵌套在另一个查询块的 WHERE 子句或 HAVING 短语的条件中的查询。

二、重要知识点

1. SQL 数据定义语句的操作对象有:模式、表、视图和索引。
2. SQL 数据定义语句的命令动词是:CREATE、DROP 和 ALTER。
3. RDBMS 中索引一般采用 B+树或 HASH 来实现。
4. 索引可以分为唯一索引、非唯一索引和聚簇索引三种类型。

数据库知识点总结_第2张图片

 

6. SQL 创建表语句的一般格式为

CREATE TABLE 表名
(列名1 数据类型1 列级完整性约束条件1 列级完整性约束条件2...,
 列名2  数据类型2 列级完整性约束条件3...,
 ...

 表级完整性约束条件);

其中数据类型可以是数据库系统支持的各种数据类型,包括长度和精度。

列级完整性约束为针对单个列(本列)的完整性约束, 包括 PRIMARY KEY、 REFERENCES表名(列)UNIQUENOT NULL 等。

表级完整性约束可以是基于表中多列的约束,包括 PRIMARY KEY ( 列名列表FOREIGN KEY REFERENCES 表名(列名等。


7. SQL 创建索引语句的一般格式为

 

CREATE [索引类型] INDEX 索引名称
ON 表名(列名)
WITH FILLFACTOR = 填充因子值0~100
GO

/*实例*/
USE 库名
GO
IF EXISTS (SELECT * FROM SYSINDEXES WHERE NAME='IX_TEST_TNAME')--检测是否已经存在IX_TEST_TNAME索引
DROP INDEX TEST.IX_TEST_TNAME--如果存在则删除


--创建索引
CREATE NONCLUSTERED INDEX IX_TEST_TNAME --创建一个非聚集索引
ON TEST(TNAME)  --为TEST表的TNAME字段创建索引
WITH FILLFACTOR = 30 --填充因子为30%
GO

SELECT * 

FROM TEST(INDEX = IX_TEST_TNAME) 

WHERE TNAME = 'A' --指定按‘IX_TEST_TNAME’索引查询



总结:
      1.什么是索引:数据库中的索引是某个表中一列或多列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。
  2.分类:
     唯一索引(UNIQUE):不允许两行具有相同的索引值(创建了唯一约束,系统将自动创建唯一索引)
     主键索引:主键索引要求主键中的每个值是唯一的,(创建主键自动创建主键索引)
     聚集索引(CLUSTERED):表中各行的物理顺序与键值的逻辑(索引)顺序相同,表中只能包含一个聚集索引,主键列默认为聚集索引
     非聚集索引(NONCLUSTERED):表中各行的物理顺序与键值的逻辑(索引)顺序不匹配,表中可以有249个非聚集索引
    3.创建索引的标准:用于频繁搜索的列;用于对数据进行排序的列
注意:如果表中仅有几行,或列中只包含几个不同的值,不推荐创建索引,因为SQL Server 在小型表中用索引搜索数据所花的时间比逐行搜索更长。


8. SQL 查询语句的一般格式为

SELECT [ALLDISTINCT] 算术表达式列表

FROM 表名或视图名列表>

[ WHERE 条件表达式 1]

[ GROUP BY 属性列表 1 [ HAVING 2 > ] ]

[ ORDER BY 属性列表 2 [ ASCDESC ] ] 

其中

ALLDISTINCT: 缺省为 ALL, 即列出所有查询结果记录, 包括重复记录。 DISTINCT则对重复记录只列出一条。

算术表达式列表:一个或多个逗号分隔的算术表达式,表达式由常量(包括数字和字符串)、列名、函数和算术运算符构成。每个表达式后还可跟别名。也可用 *代表查询表中的所有列。

表名或视图名列表: 一个或多个逗号分隔的表或视图名。 表或视图名后可跟别名。

条件表达式 1:包含关系或逻辑运算符的表达式,代表查询条件。

条件表达式 2:包含关系或逻辑运算符的表达式,代表分组条件。

属性列表 1:一个或逗号分隔的多个列名。

属性列表 2: 一个或逗号分隔的多个列名, 每个列名后可跟 ASC 或 DESC, 表示升/降序,缺省为升序。


关于SQL语句的知识这里先作如上简略介绍,具体写法下次将专门拿出一篇来叙述。


第四节

一、相关概念和知识

 

1.触发器是用户定义在基本表上的一类由事件驱动的特殊过程。由服务器自动激活, 能执行更为复杂的检查和操作,具有更精细和更强大的数据控制能力。使用 CREATE TRIGGER 命令建立触发器。

2.计算机系统存在技术安全、管理安全和政策法律三类安全性问题。

3. TCSEC/TDI 标准由安全策略、责任、保证和文档四个方面内容构成。

 

4. 常用存取控制方法包括自主存取控制(DAC)和强制存取控制(MAC)两种。

5. 自主存取控制(DAC)的 SQL 语句包括 GRANT 和 REVOKE 两个。 用户权限由数据对象和操作类型两部分构成。

数据库知识点总结_第3张图片

6. 常见SQL 自主权限控制命令和例子。
1) 把对 Student 和 Course 表的全部权限授予所有用户。
GRANT ALL PRIVILIGES ON TABLE Student,Course TO PUBLIC ;
2) 把对 Student 表的查询权和姓名修改权授予用户 U4。
GRANT SELECT,UPDATE(Sname) ON TABLE Student TO U4 ;
3) 把对 SC 表的插入权限授予 U5 用户,并允许他传播该权限。
GRANT INSERT ON TABLE SC TO U5 WITH GRANT OPTION ;
4) 把用户 U5 对 SC 表的 INSERT 权限收回,同时收回被他传播出去的授权。
REVOKE INSERT ON TABLE SC FROM U5 CASCADE ;
5) 创建一个角色 R1,并使其对 Student 表具有数据查询和更新权限。
CREATE ROLE R1;
GRANT SELECT,UPDATE ON TABLE Student TO R1;
6) 对修改 Student 表结构的操作进行审计。
AUDIT ALTER ON Student ;


 

SQL语句中常用关键词及其解释如下:

1)SELECT

将资料从数据库中的表格内选出,两个关键字:从 (FROM) 数据库中的表格内选出 (SELECT)。语法为
SELECT "栏位名" FROM "表格名"。

2)DISTINCT

在上述 SELECT 关键词后加上一个 DISTINCT 就可以去除选择出来的栏位中的重复,从而完成求得这个表格/栏位内有哪些不同的值的功能。语法为
SELECT DISTINCT "栏位名" FROM "表格名"。

3)WHERE

这个关键词可以帮助我们选择性地抓资料,而不是全取出来。语法为
SELECT "栏位名" FROM "表格名" WHERE "条件" 

4)AND OR

上例中的 WHERE 指令可以被用来由表格中有条件地选取资料。这个条件可能是简单的 (像上一页的例子),也可能是复杂的。复杂条件是由二或多个简单条件透过 AND 或是 OR 的连接而成。语法为:
SELECT "栏位名" FROM "表格名" WHERE "简单条件" {[AND|OR] "简单条件"}+

5)IN

在 SQL 中,在两个情况下会用到 IN 这个指令;这一页将介绍其中之一:与 WHERE 有关的那一个情况。在这个用法下,我们事先已知道至少一个我们需要的值,而我们将这些知道的值都放入 IN 这个子句。语法为:
SELECT "栏位名" FROM "表格名" WHERE "栏位名" IN ('值一', '值二', ...) 

6)BETWEEN

IN 这个指令可以让我们依照一或数个不连续 (discrete)的值的限制之内抓出资料库中的值,而 BETWEEN 则是让我们可以运用一个范围 (range) 内抓出资料库中的值,语法为:
SELECT "栏位名" FROM "表格名" WHERE "栏位名" BETWEEN '值一' AND '值二' 

7)LIKE

LIKE 是另一个在 WHERE 子句中会用到的指令。基本上, LIKE 能让我们依据一个模式(pattern) 来找出我们要的资料。语法为:
SELECT "栏位名" FROM "表格名" WHERE "栏位名" LIKE {模式} 

8)ORDER BY

我们经常需要能够将抓出的资料做一个有系统的显示。这可能是由小往大 (ascending) 或是由大往小(descending)。在这种情况下,我们就可以运用 ORDER BY 这个指令来达到我们的目的。语法为:
SELECT "栏位名" FROM "表格名 [WHERE "条件"] ORDER BY "栏位名" [ASC, DESC] 

9)函数

函数允许我们能够对这些数字的型态存在的行或者列做运算,包括 AVG (平均)、COUNT (计数)、MAX (最大值)、MIN (最小值)、SUM (总合)。语法为:
SELECT "函数名"("栏位名") FROM "表格名" 

10)COUNT

这个关键词能够帮我我们统计有多少笔资料被选出来,语法为:
SELECT COUNT("栏位名") FROM "表格名"

11)GROUP BY

GROUP BY 语句用于结合合计函数,根据一个或多个列对结果集进行分组。语法为:
SELECT "栏位1", SUM("栏位2") FROM "表格名" GROUP BY "栏位1" 

12)HAVING

该关键词可以帮助我们对函数产生的值来设定条件。语法为:
SELECT "栏位1", SUM("栏位2") FROM "表格名" GROUP BY "栏位1" HAVING (函数条件) 

13)ALIAS

我们可以通过ALIAS为列名称和表名称指定别名,语法为:
SELECT "表格别名"."栏位1" "栏位别名" FROM "表格名" "表格别名" 

下面为一个例子,通过它我们应该能很好地掌握以上关键词的使用方法。


Student(S#,Sname,Sage,Ssex) 学生表
Course(C#,Cname,T#) 课程表
SC(S#,C#,score) 成绩表
Teacher(T#,Tname) 教师表


问题:
1、查询“001”课程比“002”课程成绩高的所有学生的学号;
select a.S#
from (select s#,score from SC where C#=’001′) a,
(select s#,score from SC where C#=’002′) b
where a.score>b.score and a.s#=b.s#;

2、查询平均成绩大于60分的同学的学号和平均成绩;
select S#,avg(score)
from sc
group by S# having avg(score) >60;

3、查询所有同学的学号、姓名、选课数、总成绩;
select Student.S#,Student.Sname,count(SC.C#),sum(score)
from Student left Outer join SC on Student.S#=SC.S#
group by Student.S#,Sname

4、查询姓“李”的老师的个数;
select count(distinct(Tname))
from Teacher
where Tname like ‘李%’;

5、查询没学过“叶平”老师课的同学的学号、姓名;
select Student.S#,Student.Sname
from Student
where S# not in (select distinct( SC.S#) from SC,Course,Teacher where SC.C#=Course.C# and Teacher.T#=Course.T# and Teacher.Tname=’叶平’);

6、查询学过“001”并且也学过编号“002”课程的同学的学号、姓名;
select Student.S#,Student.Sname
from Student,SC

where Student.S#=SC.S# and SC.C#=’001′and exists( Select * from SC as SC_2 where SC_2.S#=SC.S# and SC_2.C#=’002′);


7、查询学过“叶平”老师所教的所有课的同学的学号、姓名;
select S#,Sname
from Student
where S# in
(select S#
from SC ,Course ,Teacher
where SC.C#=Course.C# and Teacher.T#=Course.T# and Teacher.Tname=’叶平’ group by S# having count(SC.C#)=(select count(C#) from Course,Teacher where Teacher.T#=Course.T# and Tname=’叶平’));

8、查询所有课程成绩小于60分的同学的学号、姓名;
select S#,Sname
from Student
where S# not in (select Student.S# from Student,SC where S.S#=SC.S# and score>60);

9、查询没有学全所有课的同学的学号、姓名;
select Student.S#,Student.Sname
from Student,SC
where Student.S#=SC.S#
group by Student.S#,Student.Sname having count(C#) <(select count(C#) from Course);

10、查询至少有一门课与学号为“1001”的同学所学相同的同学的学号和姓名;
select S#,Sname
from Student,SC
where Student.S#=SC.S# and C# in (select C# from SC where S#='1001');

11、删除学习“叶平”老师课的SC表记录;
Delect SC
from course ,Teacher
where Course.C#=SC.C# and Course.T#= Teacher.T# and Tname='叶平';

12、查询各科成绩最高和最低的分:以如下形式显示:课程ID,最高分,最低分
SELECT L.C# 课程ID,L.score 最高分,R.score 最低分
FROM SC L ,SC R
WHERE L.C# = R.C#
and
L.score = (SELECT MAX(IL.score)
FROM SC IL,Student IM
WHERE IL.C# = L.C# and IM.S#=IL.S#
GROUP BY IL.C#)
and
R.Score = (SELECT MIN(IR.score)
FROM SC IR
WHERE IR.C# = R.C#
GROUP BY IR.C# );

13、查询学生平均成绩及其名次
SELECT 1+(SELECT COUNT( distinct 平均成绩)
FROM (SELECT S#,AVG(score) 平均成绩
FROM SC
GROUP BY S# ) T1
WHERE 平均成绩 > T2.平均成绩) 名次, S# 学生学号,平均成绩
FROM (SELECT S#,AVG(score) 平均成绩 FROM SC GROUP BY S# ) T2
ORDER BY 平均成绩 desc;

14、查询各科成绩前三名的记录:(不考虑成绩并列情况)
SELECT t1.S# as 学生ID,t1.C# as 课程ID,Score as 分数
FROM SC t1
WHERE score IN (SELECT TOP 3 score
FROM SC
WHERE t1.C#= C#
ORDER BY score DESC)
ORDER BY t1.C#;

15、查询每门功成绩最好的前两名
SELECT t1.S# as 学生ID,t1.C# as 课程ID,Score as 分数
FROM SC t1
WHERE score IN (SELECT TOP 2 score
FROM SC
WHERE t1.C#= C#
ORDER BY score DESC )
ORDER BY t1.C#;

一、相关概念和知识点

1. 数据依赖:反映一个关系内部属性与属性之间的约束关系,是现实世界属性间相互联系的抽象,属于数据内在的性质和语义的体现。
2. 规范化理论:是用来设计良好的关系模式的基本理论。它通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。
3. 函数依赖:简单地说,对于关系模式的两个属性子集X和Y,若X的任一取值能唯一确定Y的值,则称Y函数依赖于X,记作XY。
4. 非平凡函数依赖:对于关系模式的两个属性子集X和Y,如果X→Y,但Y!⊆X,则称X→Y为非平凡函数依赖;如果X→Y,但Y⊆X,则称X→Y为非平凡函数依赖。
5. 完全函数依赖:对于关系模式的两个属性子集X和Y,如果X→Y,并且对于X的任何一个真子集X',都没有X'→Y,则称Y对X完全函数依赖。
6. 范式:指符合某一种级别的关系模式的集合。在设计关系数据库时,根据满足依赖关系要求的不同定义为不同的范式。
7. 规范化:指将一个低一级范式的关系模式,通过模式分解转换为若干个高一级范式的关系模式的集合的过程。
8. 1NF:若关系模式的所有属性都是不可分的基本数据项,则该关系模式属于1NF。
9. 2NF:1NF关系模式如果同时满足每一个非主属性完全函数依赖于码,则该关系模式属于2NF。
10. 3NF:若关系模式的每一个非主属性既不部分依赖于码也不传递依赖于码,则该关系模式属于3NF。
11. BCNF:若一个关系模式的每一个决定因素都包含码,则该关系模式属于BCNF。
12. 数据库设计:是指对于一个给定的应用环境,构造优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求。
13. 数据库设计的6个基本步骤:需求分析,概念结构设计,逻辑结构设计,物理结构设计,数据库实施,数据库运行和维护
14. 概念结构设计:指将需求分析得到的用户需求抽象为信息结构即概念模型的过程。也就是通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。
15. 逻辑结构设计:将概念结构模型(基本E-R图)转换为某个DBMS产品所支持的数据模型相符合的逻辑结构,并对其进行优化。
16. 物理结构设计:指为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程。包括设计数据库的存储结构与存取方法。
17. 抽象:指对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。

18. 数据库设计必须遵循结构设计和行为设计相结合的原则。

19. 数据字典主要包括数据项、数据结构、数据流、数据存储和处理过程五个部分。
20. 三种常用抽象方法是分类、聚集和概括
21. 局部 E-R 图之间的冲突主要表现在属性冲突、命名冲突和结构冲突三个方面。

22. 数据库常用的存取方法包括索引方法、聚簇方法和 HASH 方法三种。
23. 确定数据存放位置和存储结构需要考虑的因素主要有: 存取时间、 存储空间利用率和维护代价等。

二、细说数据库三范式

2.1 第一范式(1NF)无重复的列

第一范式(1NF)中数据库表的每一列都是不可分割的基本数据项
同一列中不能有多个值
即实体中的某个属性不能有多个值或者不能有重复的属性。
简而言之,第一范式就是无重复的列。

在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。

2.2 第二范式(2NF)属性完全依赖于主键[消除部分子函数依赖]

满足第二范式(2NF)必须先满足第一范式(1NF)。

第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。

为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。 
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。简而言之,第二范式就是属性完全依赖于主键。
2.3 第三范式(3NF)属性不依赖于其它非主属性[消除传递依赖]

满足第三范式(3NF)必须先满足第二范式(2NF)。

简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。

例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。

2.4 具体实例剖析

下面列举一个学校的学生系统的实例,以示几个范式的应用。

在设计数据库表结构之前,我们先确定一下要设计的内容包括那些。学号、学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话等信息。为了简单我们暂时只考虑这些字段信息。我们对于这些信息,说关心的问题有如下几个方面。

1)学生有那些基本信息 
2)学生选了那些课,成绩是什么 
3)每个课的学分是多少 
4)学生属于那个系,系的基本信息是什么。

首先第一范式(1NF):数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。在当前的任何关系数据库管理系统(DBMS)中,不允许你把数据库表的一列再分成二列或多列,因此做出的都是符合第一范式的数据库。

我们再考虑第二范式,把所有这些信息放到一个表中(学号,学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话)下面存在如下的依赖关系。 
1)(学号)→ (姓名, 年龄,性别,系别,系办地址、系办电话) 
2) (课程名称) → (学分) 
3)(学号,课程)→ (学科成绩)

根据依赖关系我们可以把选课关系表SelectCourse改为如下三个表:

学生:Student(学号,姓名, 年龄,性别,系别,系办地址、系办电话); 
课程:Course(课程名称, 学分); 
选课关系:SelectCourse(学号, 课程名称, 成绩)。

事实上,对照第二范式的要求,这就是满足第二范式的数据库表,若不满足第二范式,会产生如下问题 
数据冗余: 同一门课程由n个学生选修,"学分"就重复n-1次;同一个学生选修了m门课程,姓名和年龄就重复了m-1次。

更新异常: 1)若调整了某门课程的学分,数据表中所有行的"学分"值都要更新,否则会出现同一门课程学分不同的情况。 
2)假设要开设一门新的课程,暂时还没有人选修。这样,由于还没有"学号"关键字,课程名称和学分也无法记录入数据库。

删除异常 : 假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除。但是,与此同时,课程名称和学分信息也被删除了。很显然,这也会导致插入异常。

我们再考虑如何将其改成满足第三范式的数据库表,接着看上面的学生表Student(学号,姓名, 年龄,性别,系别,系办地址、系办电话),关键字为单一关键字"学号",因为存在如下决定关系:

(学号)→ (姓名, 年龄,性别,系别,系办地址、系办电话) 
但是还存在下面的决定关系 
(学号) → (所在学院)→(学院地点, 学院电话) 
即存在非关键字段"学院地点"、"学院电话"对关键字段"学号"的传递函数依赖。 
它也会存在数据冗余、更新异常、插入异常和删除异常的情况(这里就不具体分析了,参照第二范式中的分析)。根据第三范式把学生关系表分为如下两个表就可以满足第三范式了:

学生:(学号, 姓名, 年龄, 性别,系别); 
系别:(系别, 系办地址、系办电话)。


   照例,在对数据库基本知识(尤其是SQL语句和范式)的归纳总结之后,来一份小测试题。题目的难度大致和大学数据库原理与应用课程期末考试相当,大家看看,通过题目再次熟悉熟悉知识。

关系数据库规范化是为解决关系数据库中( A )问题而引入的。

A. 插入异常、删除异常和数据冗余 B. 提高查询速度

C. 减少数据操作的复杂性 D. 保证数据的安全性和完整性

在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中,数据独立性最高的是 A 阶段。

A.数据库系统 B.文件系统 C.人工管理 D.数据项管理


数据库(DB)、数据库系统(DBS)和数据库管理系统(DBMS)三者之间的关系是( C )。

A.DBMS包括DB和DBS B.DB包括DBS和DBMS

C.DBS包括DB和DBMS D.DBS就是DB,也就是DBMS


数据库管理系统能实现对数据库中数据表、索引等对象的定义、修改、删除,这类语言称为( A )。

A.数据定义语言(DDL) B.数据操纵语言(DML)

C.数据查询语言(DQL) D.数据控制语言(DCL)


同一个关系模型的任意两个元组值( A )。

A. 不能全同 B. 可全同 C. 必须全同 D. 以上都不是


概念模型是( B )

A、用于信息世界的建模,与具体的 DBMS 有关

B、用于信息世界的建模,与具体的 DBMS 无关

C、用于现实的建模,与具体的 DBMS 有关

D、用于现实的建模,与具体的 DBMS 无关


物理数据独立性是指( D )。

A. 模式改变,外模式和应用程序不变 B. 模式改变,内模式不变

C. 内模式改变,模式不变 D. 内模式改变,外模式和应用程序不变


SQL语言是( C )语言。

A.层次数据库 B.网络数据库 C.关系数据库 D.非数据库


自然连接是构成新关系的有效方法。一般情况下,当对关系R和S使用自然连接时,要求R和S含有一个或多个共有的( D )。

A. 元组 B. 行 C. 记录 D. 属性


关系运算中花费时间可能最长的运算是( C )。

A. 投影 B. 选择 C. 笛卡尔积 D. 除


文件系统与数据库系统的最大区别是( C )。

A. 数据共享 B. 数据独立 C. 数据结构化 D. 数据冗余


用于事务回滚的SQL语句是( D )

A、CREATE TABLE B、COMMIT

C、GRANT和REVOKE D、ROLLBACK


( C )用来记录对数据库中数据进行的每一次更新操作。

A.数据库文件 B.缓冲区 C.日志文件 D.后援副本


并发操作会带来哪些数据不一致性( D )。

A.丢失修改、不可重复读、读脏数据、死锁

B.不可重复读、读脏数据、死锁

C.丢失修改、读脏数据、死锁

D.丢失修改、不可重复读、读脏数据


为提高效率,关系数据库系统必须进行( B )处理。

A、定义视图 B、查询优化

C、建立索引 D、数据规范化到最高范式


对数据库物理存储方式的描述称为( B )

A.外模式 B.内模式

C.概念模式 D.逻辑模式


在数据库三级模式间引入二级映象的主要作用是(  A  )

A.提高数据与程序的独立性 B.提高数据与程序的安全性

C.保持数据与程序的一致性 D.提高数据与程序的可移植性


视图是一个“虚表”,视图的构造基于( C )

A.基本表 B.视图

C.基本表或视图 D.数据字典


关系代数中的π运算符对应SELECT语句中的以下哪个子句?(  A )

A.SELECT B.FROM

C.WHERE D.GROUP BY


将E-R模型转换成关系模型,属于数据库的( C )。

A. 需求分析 B. 概念设计

C. 逻辑设计 D. 物理设计


事务日志的用途是( C )

A. 事务处理 B. 完整性约束

C. 数据恢复 D. 安全性控制

如果事务T已在数据R上加了X锁,则其他事务在数据R上( D )

A. 只可加X锁 B. 只可加S锁

C. 可加S锁或X锁 D. 不能加任何锁


说明视图与基本表的区别和联系

视图是从一个或几个基本表导出的表,它与基本表不同,它是一个虚表,数据库中只存放视图的定义,而不存放视图对应的数据,这些数据存放在原来的基本表中,当基本表中的数据发生变化,从视图中查询出的数据也就随之改变。视图一经定义就可以像基本表一样被查询、删除,也可以在一个视图之上再定义新的视图,但是对视图的更新操作有限制。


简述事务的特性

事务具有四个特性,即ACID特性:

(1)原子性:事务中包括的所有操作要么都做,要么都不做。

(2)一致性:事务必须使数据库从一个一致性状态变到另一个一致性状态。

(3)隔离性:一个事务内部的操作及使用的数据对并发的其他事务是隔离的。

(4)持续性:事务一旦提交,对数据库的改变是永久的。


试述关系模型的参照完整性规则

参照完整性规则:

若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:取空值(F的每个属性值均为空值)或者等于S中某个元组的主键值。


现有关系数据库如下:

学生(学号,姓名,性别,专业)

课程(课程号,课程名,学分)

学习(学号,课程号,分数)

下述有5个小问题,请分别用关系代数表达式和SQL语句来实现其要求。

1. 检索所有选修了课程号为“C112”的课程的学生的学号和分数;

数据库知识点总结_第4张图片

2. 检索“英语”专业学生所学课程的信息,包括学号、姓名、课程名和分数;

数据库知识点总结_第5张图片

3. 检索“数据库原理”课程成绩高于90分的所有学生的学号、姓名、专业和分数;

数据库知识点总结_第6张图片

4. 检索没学课程号为“C135”课程的学生信息,包括学号,姓名和专业;

数据库知识点总结_第7张图片

5. 检索至少学过课程号为“C135”和“C219”的课程的学生的信息,包括学号、姓名和专业。

数据库知识点总结_第8张图片


设有一教学管理数据库,其属性为:学号(S#),课程号(C#),成绩(G),任课教师(TN),教师所在的系(D)。这些数据有下列语义:

1.一个学生所修的每门课程都有一个成绩;

2.每门课程只有一位任课教师,但每位教师可以有多门课程;

3.教师中没有重名,每个教师只属于一个系。

(1).试根据上述语义确定函数依赖集。

(2).如果用上面所有属性组成一个关系模式,那么该关系模式为何模式?并举例说明在进行增、删操作时的异常现象。

(3).将其分解为具有依赖保持的3NF。

解:

(1).F={(S#,C#)→G,C#→TN,TN→D}

(2).关系模式为1NF。

∵该关系模式的候选关键字为(S#,C#)

则非主属性有G、TN和G。

又∵F中有C#→TN

∴存在非主属性TN对候选关键字(S#,C#)的部分依赖

即:(S#,C#)—--→TN。

异常现象:

§ 若新增设一门课程而暂时还没有学生选修时,则因缺少关键字S#值而不能进行插入操作。

§ 若某个教师调离学校要删除其有关信息时,会将不该删除的课程(C#)信息删除。

(3). ∵F=F′={(S#,C#)→G,C#→TN,TN→D}

∴ρ={R1,R2,R3}

其中:R1=(S#,C#,G)

R2=(C#,TN)

R3=(TN,D)

你可能感兴趣的:(数据库,知识点)