计算机三级知识点整理,边刷题边总结,考试之前复习用,文章括号内容是根据自己的记忆习惯编写的助记词,作者是数据库小白!!!
5个基本活动
:项目规划、需求分析、系统设计、实现与部署、运行与维护
3条设计主线
:数据组织与存储、数据访问与处理、应用程序
3个设计步骤
:概念设计、逻辑设计、物理设计
系统规划和定义
的内容:任务陈述
(背景)、确定任务目标
(就是目标)、确定系统范围和边界
(路)、确定用户视图
(最终图画)。
数据库应用系统的
需求分析
:数据
需求分析、功能
需求分析(数据处理
需求分析、业务规则
需求分析)、性能
需求分析(数据操作响应时间或数据访问响应时间、系统吞吐量、允许并发访问的最大用户数、每秒TPS代价值)、其他
需求分析(存储
需求分析、安全性
需求分析、备份和恢复
需求分析)。
DBAS的
性能指标
有:
①数据操作响应时间
(或数据访问响应时间):从提交请求到返回结果的时间;
②系统吞吐量
:指系统在单位时间内所完成的事务或查询的数量,单位为TPS;
③允许并发访问
的最大用户数:在保证响应时间的前提下,系统最多允许多少用户同时访问数据库;
④每TPS代价值
,用于衡量系统性价(性能价格)比
的指标。
数据库
概念设计的目标
:定义和描述应用领域涉及的数据范围
;获取应用领域或问题域的信息模型
;描述清楚数据的属性特征
;描述清楚数据之间的关系
;定义和描述数据的约束
;说明数据的安全性
要求;支持用户的各种数据处理需求
;保证信息模型方便地转换成数据的逻辑结构(数据库模式)
,同时也便于用户理解
。
概念数据模型
:主要用来描述世界的概念化结构,它使数据库设计人员在设计的初始阶段摆脱计算机系统及DBMS的具体技术问题,集中精力分析数据以及数据之间的联系
等,与具体的数据库管理系统无关
,所以没有
描述数据的完整性约束
条件。
数据库应用系统
逻辑设计阶段
工作内容分为三部分:数据库逻辑结构
设计、数据库事务概要
设计、应用程序概要
设计。
物理设计阶段
的主要活动
有:确定存储结构
、存取路径
的选择和调整、确定数据存放位置
和确定存储分配
。
数据库
物理设计阶段
的目标
:设计一个存储空间
占用少、数据访问率高
和维护代价低
的数据库物理模式。
物理模式评估
:对数据库物理设计结果从时间
、空间
和维护
等方面进行评估,从多种可行方案中选择合理的数据库物理结构。
数据库实施阶段
包括:建立数据库结构
、数据加载
、事务和应用程序的编码及测试
、系统集成
、测试与试运行
、系统部署
。(红酒杯)
数据库的三级模式
:外模式、模式和內模式,模式的三个级别层次反映了模式的三个不同环境以及它们的不同要求。其中内模
式处于最低层
,它反映了数据在计算机物理结构
中的实际存储形式
。模式
处于中层
,它反映了设计者的数据全局逻辑要求
。外模式
也称用户模式
,处于最外层,它反映了用户对数据的要求
。数据库系统的三级模式是对数据的三个级别的抽象
,它把数据的具体物理实现留给物理模式,使用户与全局设计者不必关心
数据库的具体实现
与物理背景
。
数据库的二级映像
:模式到内模式
的映射以及外模式到模式
的映射。通过两级映射建立三级模式间的联系与转换,使得模式与外模式虽然并不具备物理存在,但是也能通过映射而获得其存在的实体。两级映射也保证了数据库系统中数据的独立性
,亦即数据的物理组织改变
与逻辑概念改变
不影响用模式,只需调整映射
方式即可。模式内模式
保证了数据库中数据与应用程序间的物理独立性
,而外模式模式
保证了数据与应用程序间的逻辑独立性
。
关系模式与关系
:关系模式
描述关系的静态结构
,它是静态、稳定的,而关系
是动态
、随用户对数据库的操作而变化的。
属性的值
:一个属性的值必须属于唯一的域
,域在这里相当于数据类型的子集,属性的取值必须为同一域
。标识属性的值不能重复
且不可以为空
。
数据字典
:对系统中各类数据描述的集合
,是进行详细的数据收集和数据分析所获得的主要成果。数据字典在数据库设计中占有很重要的地位,通常包括数据项
(项,项目,目录)、数据结构
(目录的结构)、数据流
、数据存储
和处理
过程5个部分。
视图
:从一个或几个基本表(或视图)中导出的虛表
,数据库中只存放了视图的定义
,不存放视图对应的数据
。它是原始数据库数据的一种变换
,是查看表中数据的另外-种方式
。可以将视图看成是一个移动的窗口
,通过它可以看到感兴趣的数据。视图是从一个或多个实际表中获得的,这些表的数据存放在数据库中。那些用于产生视图的表叫做该视图的基表
。-个视图也可以从另一个视图中产生。
视图的特点
:①简单性
,看到的就是需要的。视图不仅可以简化用户对数据的理解
;也可以简化对它们的操作
。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的操作每次指定全部的条件;②安全性
,通过视图用户只能查询和修改他们所能见到的数据。数据库中的其它数据
则既看不见也取不到
:③逻辑数据独立性
,视图可帮助用户屏蔽真实表结构变化
带来的影响;
视图的作用
:①简化
数据查询语句;②使用户从多角度
看待同一数据;③提高数据安全性
;④提供了-定程度的逻辑独立性
。
不同的
数据库管理系统
有着不同的逻辑实现结构
,因此数据库空间管理办法
随数据库管理系统不同而不同。
数据库完整性
包括实体完整性、参照完整性和用户自定义完整性。
①实体完整性
在CREATE TABLE中用PRIMARY KEY(主码)
定义。primary foreign
②参照完整性
在CREATE TABLE中用FOREIGN KEY(外码)
短语定义哪些列为外码,用REFERENCES短语指明这些外码参照哪些表的主码。
③用户自定义完整性
在CREATE TABLE中定义属性的同时也可以根据应用要求,定义属性上的约束条件,即属性值限制,包括:列值非空(NOT NULL)
,列值唯一一(UNQUE)
,检查列值是否满足-个布尔表达式( CHECK短语)
。
GRANT
关键字是属于定义数据库安全性
的语句,主要用于将某些对数据库的操作权限
授予某个用户。
快速原型模型
是一种快速开发方法,其指导思想是不必
把前期各阶段的活动做得尽善尽美
后才启动下阶段的活动;
螺旋模型
是将瀑布模型的系统化与快速模型的可修改性结合起来
,引入风险评估活动
。
需求分析
主要包括数据需求
分析、数据处理
需求分析、功能
需求分析(数据处理需求分析与业务规则需求分析)、性能
需求分析和其它
需求分析。
①数据处理
需求分析:从对数据组织与存储
的设计角度,辨识应用领域所管理的各类数据项和数据结构,与数据处理需求分析结果一起,组成数据字典
,形成"数据规范说明书”。
②功能需求
分析:功能需求分析主要针对DBAS应具有的功能进行分析,是DBAS需求分析的核心环节
,总体上可分为数据处理
需求分析与业务规则
需求分析。数据处理需求分析从数据访问和处理的角度,明确对各数据项所需要进行的数据访问操作
。在系统规划与分析阶段,DBAS开发者已经明确了各类用户视图
。因此数据处理需求分析阶段可以从这些视图出发,针对每个用户视图进行数据处理需求分析,然后汇总各个视图的分析结果得到对系统的完整分析结果。
③性能需求
分析:性能需求则描述了系统应当做到什么程度,分析DBAS应具有的性能指标。
④其他需求
分析包括:存储需求、安全性需求等。
a存储需求
分析:存储需求分析是指估计DBAS系统需要的数据存储量,如DB所存储的数据总量。
b.安全需求
分析:主要用于数据库安全设计,避免被非法使用和攻击。
数据流图(Data Flow Diagram,简称DFD)
:便于用户理解
系统数据流程
的图形表示
。DFD建模方法的核心是数据流
,它能精确地在逻辑上描述系统的功能、输入、输出和数据存储等,从而摆脱
了其物理内容
。数据流图是系统逻辑模型
的重要组成部分。
DFD特性
:
①抽象性
:在DFD中具体的组织机构、工作场所、物质流等都已经去掉,只剩下信息和数据
存储、流动、使用以及加工的情况。所以描述的是抽象出来的数据。
②概括性
:它把系统对各种业务
的处理过程联系起来
考虑,形成一个总体,可反映出数据流之间的概括情况。
常用的
需求建模方法
包括:①DFD
方法;②IDEF0
方法;③UML
方法。
DFD图
采用自顶向下
逐步细化的结构化分析方法。DFD即数据流图,它是由数据流
、
(对数据的加工)处理
、数据存储
和外部项
组成。
在
DFD建模方法
中,数据流用箭头
表示,处理用矩形框
表示,数据存储用圆角矩形框
表示,外部项用圆角框
或者平行四边形框
表示。
IDEF0图
:基本元素是矩形框
和箭头
,矩形框内的动词短语描述功能活动的名称,活动的编号
按要求写在矩形框右下角
指定的位置。
左边
的输入箭头表示完成活动需要的数据
;
上方
的控制箭头描述了影响这个活动执行的事件或约束条件
;
右边
的输出箭头说明由此活动产生的结果
集信息;
下方
进入的机制箭头表示实施该活动的物理手段
或完成活动所需要的资源
(计算机系统、人或组织)
数据模型
的构成:通常由数据结构
、数据操作
和完整性约束
三部分构成。
数据的完整性约束
是一组完整性规则,它是给定的数据模型中数据
及其联系
所有的制约和依存的规则,用以限定符合数据模型
的数据库状态及状态的变化,以保证数据的正确、有效、相容。
实体的完整性
规定,主码的任何属性都不能为空
,因为概念模型中实体和联系都是可区分
的,而且它们以主码为唯一性标识
。
ER模型
:设计数据库时,要分析这个数据库必须存储的信息
及这些信息组成部分之间的关系
,ER模型就是用来描述数据库中实体
及其属性
以及各个实体间联系
的描述方法。
ER模型建模时,不考虑
数据库在计算机中的存储
和处理
特性。
设计ER图是概念设计
阶段的产物。
ER图
向关系模式转换
涉及到两方面:实体
的转换和实体间联系的转换
。
①实体的转换
:在从ER图转换为关系模式时,一个实体就转换成一个关系模式
,实体的属性就是关系模式的属性,实体的键就是关系的主键。
②实体间联系的转换
:实体间存在三种联系,即1:1 (一对一)联系,1:m(- -对多)联系,m:n
(多对多)联系。在从ER向关系模式转换规则如下:
1:1 (一对一)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由两个实体中的任意- -个键构成。
方法二:联系与端的实体的关系模式合并,即将联系的属性加入到实体的关系模式内,主键不变。1:m (一对多)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由n端实体的键组成。
方法二:与n端的实体的关系模式合并,即将联系的属性加入到实体的关系模式内,主键不变。m:n(多对多)联系
多对多联系转换成新的独立的模式时,模式的属性由联系本身的属性及两个实体的键构成,主键由两端实体的键组合而成。
由题目可知,该题中有三个实体
、一-个1:1 (一对一)联系、三个1:m (一对多)联系和一-个m:n (多对多)联系
。三个实体和一个m:n(多对多)联系可以转换为单独的模式,1:1 (一对一)联系和一-对1:m
(一对多)联系需要合并到实体中去。因此可以最终得到四个模式
,即三个实体(员工,部门,项目)和- -个多对多联系。
逻辑设计
的主要工作是将现实世界的概念数据模型
设计成数据库
的一种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数据模式。
与此同时,可能还需为各种数据处理应用领域
产生相应的逻辑子模式
,这一步设计的结果就是所谓的"逻辑数据库"
。
ER图
到关系模式
的转换
和定义数据的约束条件
都是在逻辑设计
层面上的操作。
数据库
逻辑设计
的目标
是得到实际的数据库管理系统可处理的数据库模式
,各模式结构合理,数据之间不存在不合理的数据依赖关系
,且满足各类应用的处理和使用要求,为数据库的物理设计及数据库高效、正确地运行打下基础。在优化关系模式
中需根据应用规范化理论逐一检查
每一个关系模式
, 使之满足3NF
。
数据库物理设计
阶段活动
包括:
①数据库逻辑模式调整
;(打通上一层)
②选择或配置基本关系表
的文件组织形式
,为基本关系表设计数据存取方法
或存取路径
;(交通工具,路线)
③数据分布
设计;(分岔路)
④安全
模式设计;(转弯安全)
⑤确定系统配置
;(车的配置)
⑥物理模式评估
。(流程评估)
数据库
物理设计
的目的
是将数据的逻辑模式转换为实现技术规范
,其目标
是设计数据存储方案
,以便提供足够好的性能并确保数据库数据的完整性、安全性和可恢复性。通常,数据库物理设计并不包括
文件和数据库的具体实现细节
(例如如何创建文件、建立数据库以及如何加载数据等)。
内模式
也称存储模式,它是数据物理结构
和存储方式
的描述,是数据在数据库内部的表示方式,一个数据库只有一个
内模式。
外模式
可以有多个
,其是应用程序
或用户与数据库
通信的接口
,不同的用户访问同一个数据 库对应多个外模式。
数据
与程序
之间的独立性
,使数据定义与描述分离,所有数据的存取由DBMS管理,用户
不必考虑存取细节,所以减少
了应用程序的维护
。
对
模式进行分解
时,既要保证分解具有"无损连接性”
,又要保证分解"保持函数依赖"
。
"无损连接"
指分解的若干连接重组时可以精确恢复
到原来的数据表,数据记录既没有增加也没有减少
。
"保持函数依赖"
是指原关系模式含有的属性之间的隐含关系
在分解后不能丢失。
分解使得一个
关系变为多个
关系,常用于关系模式规范化
。-般情况下可以减少部分数据冗余
,但不恰当
的分解,也可能增加冗余
。
一张
关系表
中的主码
不能为空
且具有唯一性
。外码取值可能为被参照关系中已存在的主码值或空值。
SQL Server实例
就是在数据库中存在的现实的数据库例子,它是后台进程和数据库文件的集合。
仅具有登录权限
的用户对SQL Server只能进行系统数据库中有关SQL Server的一些系统信息
的查询,即只能对master、 msdb
数据库部分数据进行查询。
数据模型
三个要素包括:
①数据结构
数据结构是所研究的对象类型的集合。它从语法角度表述了客观世界中数据对象本身的结构和数据对象之间的关联关系,是对系统静态特征
的描述。
②数据操作
数据操作是对数据库中对象的实例允许执行的操作的集合,主要指检索
和更新
(插入、删除、修改)两类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。数据操作是对系统动态特性
的描述。
③数据完整性
约束
数据完整性约束是一组完整性规则的集合,规定数据库状态
及状态变化
所应满足的条件,以保证数据的正确性、有效性和相容性
。
根据
索引
的实现方式
,索引技术被分成两大类:有序
索引和散列
索引。
索引的分类
:
稀疏索引
是指如果只是一部分
查找码的值有对应的索引记录, 则该索引为稀疏索引;
稠密索引
是指如果数据文件中的每一个
查找码值在索引文件中都对应-个索引记录
,则该索引为稠密索引。
聚集索引、非聚集索引
:对于数据文件
和它的一-个特定的索引文件
,如果数据文件中的数据记录的排列顺序
与索引文件中索引项的排列顺序相致
,或者说,索引文件按照其查找码指定的顺序与数据文件中数据记录的排列顺序相一-致,则该索引文件称为聚集索引,聚集索引的键值
可以重复
,否则为非聚集索引。
对于
复合索引
,在查询使用时,最好将where条件顺序
作为索引的顺序
。
稀疏索引
属于有序索引
,所以所指向的数据文件- -定是有序的。
唯一索引
可以确保索引列不包含重复值的值,unique
表示唯一 索引。 在数据文件的非主属性
上建立的索引称为辅索引
。
聚集索引
确定表中数据的物理顺序
。由于聚集索引规定数据在表中的物理存储顺序,因此一个表只能包含一个聚集索引
。
非聚集索引
与课本中的目录
类似,数据存储在一个地方, 索引存储在另一个地方,索引带有指针指向数据的存储位置,一个表可以有多个
非聚集索引。
当对表中的数据
进行增加、删除和修改
的时候,索引
也要动态的维护
,这样就降低
了数据的维护速度
。
分布式数据
要达到的目标
是:本地自治
、非集中式管理
、高可用
性、位置
独立性、数据分片
独立性、数据复制
独立性、分布式查询
处理、分布式事务
管理、硬件
独立性、操作系统
独立性、网络
独立性、数据库管理系统
独立性。
并行数据库
的目标
是高性能
和高可用
性,通过多个处理节点并行执行
数据库任务,提高整个数据库系统的性能和可用性。
数据库
吞吐量
指的是系统在单位时间可以完成的数据库事务数量
。
文件结构
:
散列文件
:指利用散列存储方式
组织的文件,亦称为直接存取文件
。散列文件的优点是:文件随机存放,记录不需进行排序;插入、删除方便;存取速度快;不需要索引区,节省存储空间。其缺点是:不能进行顺序存取,只能按关键字随机存取,且询问方式只限于简单询问,并且在经过多次插入、删除后,也可能造成文件结构不合理,需要重新组织文件。
堆文件
:如果数据库中的一个基本表的数据量很少
,并且插入、删除、更新等操作非常频繁
,该基本表可以采用堆文件组织形式。因为堆文件无需建立索引,维护代价非常低。虽然堆文件的数据访问效率较低,但在数据量很少时,定位文件记录的时间非常短。
顺序文件
:文件信息存放在若干连续的物理块
中。其优点是简单,支持顺序存取和随机存取,顺序存取速度相对较快。缺点是文件不能动态增长,不利于文件插入和删除。如果用户的查询条件
定义在查找码上
,则顺序文件是比较适合的文件结构。
聚集文件
:将不同关系表中有关联关系
的记录存储在一起
。
如果某些重要而频繁的用户查询经常
需要进行多表连接操作
,可以考虑聚集文件
,来改善查询效率。
运行管理与维护阶段
包括日常维护
、监控与分析
、性能
优化调整、系统
进化。
数据库的
反规范化
是为了减少表间的连接
,提高查询性能
,但并非
所有经反规范的数据库都是高效的,这与实际的应用有关,只有满足一定条件的数据库采用反规范方法才能提高性能。
在
"确定型连接联系"
中,如果子女实体集中的每个实例
都是由它与双亲的联系而确定
,那么这个联系就被称为"标定型联系"
。在标定型联系中子女实体集总是从属实体集,标定型联系用一条实线或者线段把他们连接起来,1
(父)端是线段的原点,n (子女)端是线段的终点,并用一个实心圆点表示其联系的基数是n。
如果
两个实体集
之间发生联系,其中一个实体类型的标识符进入另一个实体类型并与该实体类型中的标识符共同组成其标识符时,这种联系则称为标定联系
。一个多对多分解为两个一对多时,其联系为标定型联系
。
常见能
提高连接操作性能
或者减少连接操作的是:
增加冗余列
:指在多个表中增加具有相同语义
的列,它常用来在查询时避免连接操作
;
反规范化
:也就是降低表的规范化程度,减少表间的连接
,提高查询性能
;
对于经常
需要进行查询、连接、统计操作
,且数据量大
的基本表可以建立索引
提高查询效率;
聚集文件
可以提高频繁
进行多表连接
操作的查询效率。
在
IDEF1X
数据建模方法中,直角矩形框
用于表示独立实体集
,圆角矩形框
用于表示从属实体集
。
IDEF1X
侧重分析、抽象和概括应用领域中的数据需求,被称为数据建模
方法。
IDEF 1X
是IDEF系列方法中IDEF1的扩展版本,是在E-R(实体联系)方法的原则基础上,增加了一些规则,使语义更为丰富的一种方法。
概念模型
设计常用IDEF1X方法。
IDEF1X建模方法:实体集(独立实体集、从属实体集)
、联系(标定型联系、非标定型联系、分类联系、非确定联系)
。从属实体集可以有自己的主码,并不是只能参与标定型联系。
事务概要设计
内容包括:事务名称
、事务所访问的关系表及关系属性
、事务处理
逻辑、事务用户
(指使用、启动、调用该事务的软件模块或系统)。
ORDER BY
语句用于对结果集进行排序
:
①ORDER BY语句用于根据指定的列
对结果集进行排序
;
②ORDER BY语句默认按照升序
对记录进行排序。ORDER BY可以对多个列
进行排序,此时的排序是嵌套
的; ORDER BY语句只能作为其他子句之后的最后一个子句
出现;视图
中也可以使用
ORDER BY语句;子查询
语句中是不能使用
ORDER BY子句的。
完整性语句
:FOREIGN KEY
和PRIMARY KEY
应用于关系级别约束
,NOT NULL
、UNIQUE
应用于列级约束
,CHECK
应用于元组约束
。
在数据文件的
主码属性集
上建立的索引称为主索引
。create unique clustered index idx1 on R(A)中unique
表示为表建立唯一索引
;clustered
表示为表创建聚集索引
。
考试取消了!!!(2020年4月16)