持续更新,共十套题。相关资料已经按知识点总结为PDF,可以通过文末下载学习。
ER图向关系模式转换涉及到两方面:①实体的转换;②实体间联系的转换。
实体的转换:在从ER图转换为关系模式时,一个实体就转换一个关系模式,实体的属性就是关系模式的属性,实体的键就是关系的主键。
实体间联系的转换:实体间存在三种联系,即1:1(一对一),1:n(-对多),m:n(多对多)。
在从ER向关系模式转换规则如下:
①1:1(一对一)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由两个实体中的任意一个键成。
方法二:联系与一端的实体的关系模式合并,即将联系的属性加入到实体的关系模式内,主键不变。
②1:n(一对多)联系
方法一:联系转换为独立的关系模式;模式的属性由联系本身的属性及两个实体的键构成;主键由n端实体的键组成。
方法二:与n端的实体的关系模式合并,即将联系的属性加入到实体的关系模式内,主键不变。
③m:n(多对多)联系转换成新的独立的模式,模式的属性由联系本身的属性及两个实体的键构成,主键由两端实体的键组合成。
参考链接:https://blog.csdn.net/baidu_41774120/article/details/114449377?utm_medium=distribute.pc_relevant.none-task-blog-2defaultbaidujs_title~default-0.control&spm=1001.2101.3001.4242
由题目可知,该题中有4个实体,两个二元一对多联系,两个二元多对多联系,一个三元多对多联系,两个一元多对多联系。4个实体和5个m:n(多对多)联系可以转换为单独的模式,1:n(一对多)联系需要合并到实体中去。因此可以最终得到9个模式。故答案为A。
19. 为了减少数据冗余而将一个2NF的关系模式分解为若干个3NF的关系模式,这项工作属于数据库结构设计中的 逻辑结构设计
20. 事务概要设计内容包括:事务名称、事务所访问的关系表及关系属性、事务处理逻辑、事务用户(指使用、启动、调用该事务的软件模块或系统)。
非确定型联系是多对多关系
22.
为改善对这类大数据量基本表的访问性能,可将基本表划分为若干分区,各分区数据分别存储在不同位置的磁盘上,并可采用不同的物理组织方式。分区表是从物理上将一个大表分成几个小表,但从逻辑上来看还是一个大表.
分区表是从物理上将一个表划分为若干个小的子表,数据库管理系统会自动将数据放到对应的子表中
可以看到后三个 按照24个英文字母表顺序
所以,Group by子句用于Order by子句之前
27. SELECT INTO语句表示从一个表中选取数据,然后把该数据插入到另一个表中。该语句结构通常用于创建表的备份复件或者用于对记录进行存档。该语句使用时要求目标表不存在,因为在插入时会自动创建。
28. 如果表已经存在,使用INSERT INTO复制表内容
29.
查询Student表中是否存在SC表中一条特定的记录,在SQL语句中被称为存在性测试。SQL语句通过子查询,使用EXISTS谓词进行存在性测试。
Where [NOT] EXISTS (子查询)
带EXISTS谓词的子查询不返回查询的结果,只产生逻辑真值和逻辑假值。
EXISTS的含义是:当子查询中有满足条件的数据时,EXISTS返回真值,否则返回假值。
NOT EXISTS的含义是:当子查询中有满足条件的数据时,NOT EXISTS返回假值,当子查询中不存在满足条件的数据时,NOT EXISTS返回真值。
30. 游标指针各个参数含义:
NEXT:返回紧跟在当前行之后的数据行,并且当前行递增为结果行。
PRIOR:返回紧跟当前行前面的数据行,并且当前行递减为结果行。
FIRST:返回游标中的第一行并将其作为当前行。
LAST:返回游标中的最后一行并将其作为当前行。
31. 删除架构的T_SQL语句是DROP SCHEMA,语法格式如下:
DROP SCHEMA <架构名> {|}
32. 在SQL Server 2008中,有两种身份验证模式,一种是混合身份验证模式,另一种是Window身份验证模式。
33. 索引视图是一种包含查询结果的数据库对象,其数据不是在视图使用时读取的,而是预先计算好的。
34. 派生性冗余列是指表中增加的列由表中的一些数据项经过计算生成。它的作用是在查询时减少连接操作,避免使用聚合函数。
例如,在销售单据表中,增加总价字段,总价字段是由单价*数目得到的,这种列得到的方式就叫做派生性冗余列
35. 日志文件记录每个事物对数据库的修改操作,数据库系统在运行过程中,将所有事物的修改操作记录到日志文件中。在动态转储中,利用转储文件只能将数据库恢复到转储过程中的某个状态,且转储文件中的数据可能处于不一致状态,只有和日志文件综合起来使用,才能将数据库恢复到一致状态,或将数据库恢复到故障发生前的状态,从而有效地恢复数据库。
36. 分布式数据库系统的恢复控制,最经典的策略是采取两阶段式协议
37. 在关联规则挖掘中,关联规则的成立与否一般用支持度和置信度两个指标进行描述。
后续大题链接:计算机三级数据库大题
(1)创建分区函数。创建分区函数的目的是告诉数据库管理系统以什么方式对表进行分区。
(2)创建分区方案。分区方案的作用是将分区函数生成的分区映射到文件组中。
(3)使用分区方案创建表。
水平划分将一张基本表划分为多张具有相同属性、结构完全相同的子表。垂直划分则是将一张基本表划分为多张子表,每张子表包含的属性是原基本表的子集。创建分区表就是对表中数据进行水平划分
分区表中的每个分区必须映射到不同的文件组中 ×
对于非聚集索引,数据行的物理排序独立于索引排序。
角色是一组具有相同权限的用户集合。用户定义的角色属于数据库一级的角色,**用户定义的角色的成员可以是数据库的用户,也可以是用户定义的角色。**只要权限没有被拒绝过,则角色中成员的权限就是其所在角色的权限加上他们自己所具有的权限。故答案为A。
Oracle的安全控制机制可分为数据库级的安全控制、表级、行级和列级的安全控制。
数据库级的安全性通过用户身份认证和授予用户相应系统权限来保证,而表级、行级、列级的安全性是通过授予或回收对象特权保证的。Oracle数据库中的用户按其操作权限大小可分DBA用户和普通用户。故答案为C。
数据库管理员可以对数据库用户授权
数据库重组是指按照系统设计要求对数据库存储空间进行全面调整,如调整磁盘分区方法和存储空间、重新安排数据的存储、整理回收碎块等,以提高数据库性能。(偏物理)
数据库的重构是指由于数据库应用环境的不断变化,增加了新的应用或新的实体,取消了某些应用,有的实体与实体间的联系也发生了变化等,使得原有的数据库设计不能满足新的需求,此时需要调整数据库的模式和内模式。(升级数据库软件版本)
数据库的重组并不修改数据库原有设计的逻辑结构和物理结构,而数据库的重构则不同,它可以部分修改数据库的模式和内模式。
数据库应用系统投入运行标志着系统开发任务的基本完成和系统运行维护工作的开始
在三层浏览器/服务器体系的数据库应用系统中,触发器是在数据库服务器上执行的。
在UML图中,用于表达系统中不同的包、命名空间或不同的顶目间彼此关系的图称为包图。
SQL Server提供了四个排名函数:RANK、DENSE_RANK、NTILE和ROW_NUMBER
其中RANK()函数返回结果集中每个分区内行的序列号,每个分区的第一行从1开始。函数返回结果集中每行数据在每个分区内的排名,并且每个分区内的排名从1开始,但排名中间数值可能有间断。
DENSE_RANK()函数与RANK()函数类似,唯一区别是DENSE_RANK函数排名中间值不间断。
单表的联接查询。其语法是:
SELECT 表的别名.列名FROM 表名 表的别名1 JOIN表名 表的别名2
ON 表的别名1.外键=表的别名2.外键
WHERE 查询条件
本题中Student的表有两个别名,分别是Sl,S2。由"Sl.Sname=‘张三’"表明张三是处于别名为S1的表中,那么同一个系的学生所在的表只能是S2。因此在 SELECT后面只能是S2.Sname。
在存储过程中输入参数不需要注明,输出参数需要用关键字OUTPUT注明该参数是输出参数
将经常一起使用的具有公共列值的多个表中的数据行存储在一起的数据库存储方法被称为聚集。
检查点技术的最大特点是最大限度地减少了数据库完成恢复时所必须执行的日志部分。
分布式数据库中,位置独立性、数据分片独立性和数据复制独立性形成了分布式数据库系统中的分布透明性,使用户完全感觉不到数据库是分布的,与使用集中式数据库完全一样。
对一个数据集的数据进行分组,使得每一组内的数据尽可能相似而不同组间的数据尽可能的不同,这样的数据挖掘方法称为聚类算法。
数据仓库是一个面向主题的、集成的、非易失的,且随时间变化的数据集合。
其中,面向主题
汽车表中有汽车的基本信息,却没有销售信息;而销售表中有汽车销售信息,没有汽车信息,如果想既知道汽车信息,又知道销售信息,必须将两张表连接进行查询。根据【4】后面的ON关键字提醒,本处应该使用JOIN……ON语法。
连接查询包括内连接和外连接查询。使用内连接时,仅当匹配的内容两个表中都存在时才显示出来。显然内连接不符合题意。因此必须使用外连接。外连接又分为三种类型:
左外连接(LEFT [OUTER] JOIN):结果表中保留连接条件左边关系中的所有内容;
右外连接(RIGHT [OUTER] JOIN):结果表中保留连接条件右边关系中的所有内容;
全外连接(FULL [OUTER] JOIN):结果表中保留连接条件左、右边关系中的所有内容;
其中OUTER关键字可以省略。
题目要求查询包括没有销售和销售的所有的汽车,而汽车表在左边,销售表在右边,因此只有左外连接符合要求。故此处应该填写LEFT JOIN或LEFT OUTER JOIN。
3.
4. 为了提高系统写性能,可以考虑将RAID1改为RAID5 × RAID1写慢读快
5. 数据库 安全性 上升 ,性能 下降
数据库的一致性设计往往以牺牲效率为代价
6. 维护工作主要包括:数据库的转储和恢复;数据库的安全性和完整性控制;数据库性能的监控分析和改进;数据库的重组和重构。
6. 如果运行队列数量超过了CPU处理的数目,服务器性能就会受到CPU的限制而下降,解决方法是为服务器适当增加CPU的数量或者是终止需要许多资源的进程。
7. 模式调整时,符合第一范式要求即可
8. 将数据文件和索引/日志文件放置在同一磁盘上 不利于提高查询效率。 都要放在不同磁盘
9. (易错)
9.
检查点技术大幅度减少了数据库完全恢复时所必须执行的日志部分。
静态转储虽然保证了数据的有效性,但是却是以降低数据库的可用性为代价;
动态转储虽然提高了数据库的可用性,但数据的有效性却可能得不到保障。
差量转储和增量转储相比,速度慢,占用空间较多,但恢复速度比增量转储快。
10. 数据库备份:
1)数据库备份设备可以是磁带也可以是磁盘,
2)数据库备份设备可以为本地设备,也可以使用远程网络设备。
3)SQL Server支持两种备份方式,一种是先建立备份设备,然后再将数据库备份到备份设备上,这样的备份设备称为永久备份设备;另一种是直接将数据库备份到物理文件上,这样的备份设备称为临时备份设备。
4)创建备份设备的 T-SQL存储过程为sp_addumpdevice。
11. 完整备份 是备份特定数据库中所有数据 和 可以恢复这些数据的足够日志;
事务日志备份 仅用于 完整恢复模式 和 大容量日志恢复模式
差异备份包含最近一次完整备份之后发生了更改的数据区
使用差异备份时,应当定期做完整备份
13.对于用户数据库,简单恢复模式只用于测试和开发数据库,或用于主要包含只读数据的数据库(如数据仓库),这种模式并不适合生产系统,因为对生产系统而言,丢失最新的更改是无法接受的。
16. SQL Server 2008支持数据库、数据文件两个级别的数据恢复。
17. 静态转储可以保证数据的有效性,但是却降低数据库的可用性,动态转储可以提高数据库的可用性,但数据的有效性得不到保证。为了保证数据的一致性,需使用日志文件和动态转储结合使用。在制定备份策略时,需要考虑备份空间、时间等因素。
完全转储是对数据库中所有数据进行转储,此种方式占用较多的时间和空间。
差量转储是对最近一次数据库完全转储以来发生的数据库变化进行转储。差量转储和完全转储相比速度快,占用空间小;差量转储和增量转储相比速度慢、占用空间多,但是恢复速度快。
增量转储只复制上次转储后发生变化的文件或数据块。增量转储所需的时间和空间都比较短,但增量转储数据只能和完全转储配合,才能对数据库进行恢复。增量转储的恢复时间比完全转储要长。故答案为A。
关于数据划分:
——1)根据销售数据划分————》即每个表都拥有完整属性,按照时间段不同,范围划分
——2)数据划分对并行算法的性能有很大的影响
并行数据库仅仅依靠采用多处理器、共享硬件资源等手段无法实现真正意义上的并行处理,只有当数据分布合理、易于并行处理,才能将并行数据库的性能最优化。所以,并行数据库主要依靠多处理器和共享硬件来实现并行处理,数据划分是辅助手段。 ×
位置独立性、数据分片独立性(最高级别的透明性)和数据复制独立性是使分布式数据库具有分布式透明性的主要因素。 喂薯片
SaaS,即Software as a Service,中文意思是软件即服务
PaaS,即Platform as a Service,中文意思是平台即服务。
共享磁盘结构所有的处理机拥有独立的内存,通过互联网共享磁盘。这种结构可以克服共享内存结构,但是由于是通过互联网实现处理器之间的信息交换,会产生一定的通信代价。
与传统数据库相比,XML数据库具有以下优势:
(1)XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。
(2)提供对标签和路径的操作。传统数据库语言允许对数据元素的值进行操作,但不能对元素名称进行操作,半结构化数据库提供了对标签名称的操作,包括对路径的操作。
(3)当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集。
现阶段在现实环境中,一边使用的是原有的关系数据库厂商在其传统商业产品中进行了相关的扩充,使其能够处理XML数据的产品。
BigTable表的索引是行关键字、列关键字和时间戳,每个单元由行关键字、列关键字和时间戳共同定位。
在BigTable中,不仅可以随意地增减行的数量,同在一定的约束条件下,还可以对列的数量进行扩展。
BigTable数据模型的特点是:
(1)表中的行关键字可以是任意的字符串。
(2)列族是由列关键字组成的集合,是访问控制的基本单位。
(3)时间戳记录了BigTable中每一个数据项所包含的不同版本的数据的时间标识。
允许动态增加列
快照是关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。它反映的是某个时间点内的数据,该数据具有不可以改变性。而商场商品销售表、电信公司通话详单属于动态数据,不适合用快照的方式获取数据。故答案为D。
数据仓库中数据特征包括面向主题性,集成性,不可更新性,时间特性。面向业务应用、可直接修改、相对OLTP环境性能要求高
在进行数据库应用系统需求分析时,需要给出允许并发访问的最大用户数,这属于数据库应用系统的性能需求分析。
DFD方法由四种基本元素(模型对象)组成:数据流、处理、数据存储和外部项。
活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序,并行次序。
18. SQL Server提供了两种开窗函数:排名开窗函数和聚合开窗函数。 PARTITION BY:将结果集划分为多个分区,OVER子句用于确定在应用关联的开窗函数之前对行集的分区和排序。
创建索引的语法格式为:
CREATE [UNIQUE][CLUSTERED|NONCLUSTERED] INDEX index_name
ON (column [ASC|DESC][,…n])
ASC为升序,DESC为降序,默认是ASC,
删除登录帐户的T-SQL语句为DROP LOGIN,其语法格式为:
DROP LOGIN login_name
索引视图是一种保存了查询结果的数据对象,其中数据是预先计算并保存在对象中的。
分布式事务管理主要包括恢复控制和并发控制。由于在分布式数据库系统中一个全局事务的完成需要多个场地共同参与,为了保持事务的原子性,参与事务执行的所有场地或者全部提交,或者全部撤消。
在数据仓库环境中,粒度是一个重要的设计问题,它影响到数据仓库的数据量以及系统能回答的查询的类型。显然,粒度越小,细节程度越高,能回答的查询就越多。
操作型数据存储ODS主要包括即时OLAP和全局型OLTP应用。
设置事务执行时的隔离级别,该任务属于数据库应用系统设计步骤中的物理设计。(事务,二合一表)
多对多联系可以写为两个一对多联系,这两个一对多联系属于标定型联系。
为了减少连接操作,可以将两个表合成一个表,这项工作属于数据库结构设计中的物理结构设计。
1)一个构件或模块只负责完成一项任务,也就是单一责任原则。 √
2)各个构件均应具有独立的功能,并最大限度地减少与其他构件功能重叠。
3)构件之间的接口应尽量简单明确。
4)如果两个构件间的关系比较复杂,应考虑进一步进行模块划分。
5)如果构件过于复杂,可以考虑将其细分。
该阶段的工作是将构件或模块细化,而不是越弄越复杂。关系复杂的构件合并之后会更复杂。
6.
count()为计数,sum()为求和
存储过程的输出参数可以是日期类型的;一个存储过程可以同时拥有输入参数和输出参数,可以拥有多个输入参数和输出参数。
唯一索引不允许两行具有相同的索引键值。
聚集索引键值的逻辑顺序决定表中对应行的物理顺序。一个表或视图只允许同时有一个聚集索引。
允许并发访问的最大用户数——性能需求分析
授予用户权限: grant 权限 on 被授予权限的对象 to 要向其授予权限的主体
例子1:授予用户U1在DB1数据库中具有创建表的权限
GRANT CREATE TABLE TO U1
例子2:要注意授予用户创建视图的权限,授予用户U1在表tb1上创建视图的权限
GRANT CREAT VIEW TO U1
例子3:回收创建视图
**无需表明表明,因为创建视图的权限属于语句级授权,而非对象级授权**
db_datereader具有查询数据库中所有用户数据的权限,该角色是固定数据库角色,是定义在数据库级别上的,而且存在于每个数据库中。用户不能添加、删除或更改固定数据库角色。(一句话总结:db_datereader是数据库角色,具有查询数据库中所有用户数据的权限)
db_datawriter 是数据库角色,具有具有插入、删除和更改数据库中用户数据的权限。
RAID1可以避免介质故障带来的影响,RAID0不行。
发生软故障后时,需要在重启系统后,undo所有未提交的事务,并redo所有已提交的事务。
非预期的事务内部故障不能由事务程序处理。
可预期的事务内部故障可以通过将事务回滚,撤销其对数据库的修改,使数据库回到一致性状态。
事务日志备份需要日志链完整
1)共享内存结构:通过互联网共享一个公共的主存储器,与单机系统的区别是以多个处理器代替单个处理器并行执行事务,通过共享内存传送消息和数据,实现对一个或多个磁盘的访问。
2)共享磁盘结构:所有处理机拥有独立的主存储器,通过互联网共享磁盘。
3)无共享结构:每个处理机拥有独立的主存储器和磁盘,不共享任何资源。高扩展性,适合OLTP结构
4)层次结构:前三种的结合,分两层,顶层无共享结构,底层共享内存或共享磁盘。
**并行数据库系统经常通过负载均衡的方法来提高数据库系统的业务吞吐率。**并行数据库不是分布式数据库!!
数据库镜像有三种实现方式,分别是:
1、高可用性:两台服务器上同步事务写入,并支持自动错误恢复。
2、高保护:两台服务器上同步事务写入,但错误恢复是手工的。
3、高性能:两台服务器上的写入可以不同步,因此性能上有所提高,只允许手工的错误恢复。
关于数据的数据被称为元数据
model数据库是用户数据库模板,大量更新后需要对它备份,新建数据库用户并不需要。
事务的隔离性是指多个并发事务同时访问一个数据库时,一个事物不应被另一个事物所干扰,即保证并发读取数据的正确性,降低发生数据不一致的可能性。
如果一个实体集的每个实例都能被唯一地标识而不决定于它与其他实体集的联系,则被称为独立实体集;如果依赖于与其他实体集的联系,则被称为从属实体集。
如果数据文件中的每个查找码值在索引文件中都对应一个索引记录则被称为稠密索引;如果只是一部分查找码的值有对应的索引记录,则被称为稀疏索引。
顺序图有两个坐标轴,纵向表示时间的持续过程,横向表示对象。每一个对象用矩形框表示,纵向的虚线表示对象在序列中的执行情况,称为对象的“生命线”。
声明游标的语法是 declare 游标名 cursor for select语句
云计算通过集中所有的计算资源,采用硬件虚拟化技术,为云计算使用者提供强大的计算能力、存储和带宽等资源。
钻取与卷起是OLAP分析的两个基本操作。钻取是指对应某一维逐步向更细节层方向观察数据,卷起则反之,所以本题应填钻取。
1.
2. 非标定型联系不会产生从属实体集
3. 根据事务-基本表交叉引用矩阵可以确定哪些事务对哪些表列执行了何种操作,基于该矩阵可以帮助数据库设计人员建立合适的索引
4. 可以同时定义一个由删除和插入功能引起的触发器
5. 聚集索引和非聚集索引建立顺序不影响
6. 数据库所包含的文件与文件存储位置信息均保存在主要数据文件中
7. 根据题目描述,只需要完成I、II即可,因为非介质故障一般只需要执行REDO(重做)和UNDO(回滚)即可。III中RAID是磁盘级别的,数据写入时自动完成备份,即便数据有问题,也将会在驱动程序的协调下自动完成恢复。IV和V是在介质故障时执行的。
8.
数据分布设计 ——物理设计
触发器通常用于保证业务规则和数据完整性,利用触发器可以实施业务规则
SQL Server有两种类型的文件组:主文件组(包含主要数据文件和任何没有明确分配给其他文件组的其他数据文件)和用户定义的文件组(用户可以创建自己的文件组,以将数据文件组织起来,便于管理和数据分配)。
说明:
1)日志文件不包括在文件组内。
2)一个文件不能属于多个文件组
3)如果文件组中有多个文件,则它们在所有文件被填满前不会自动增长,而填满后这些文件会循环增长。(所有文件被填满就会自动增长)
4)一个文件组中的数据文件可以存放在不同磁盘上
5)一个数据库只能有一个主文件组
用户定义的文件组中只能包含次要数据文件
一个登录账户可以对应多个数据库用户
sa是SQL Server自动创建的数据库系统管理员 见管理员即选
元数据 数据字典,ER图,说明文档
链接:https://pan.baidu.com/s/1dKpX7o_eauPIDQPiDyfVeg
提取码:xfet