2019年根据自己做的题,总结出的易错知识点。
第一套
第二套
第三套
模式/内模式保证了数据库中数据与应用程序间的物理独立性,而外模式/模式保证了数据与应用程序间的逻辑独立性。
视图是从一个或几个基本表(或视图)中导出的虚表,数据库中只存放了视图的定义,不存放视图对应的数据。它是原始数据库数据的一种变换,是查看表中数据的另外一种方式。可以将视图看成是一个移动的窗口,通过它可以看到感兴趣的数据。 视图是从一个或多个实际表中获得的,这些表的数据存放在数据库中。那些用于产生视图的表叫做该视图的基表。一个视图也可以从另一个视图中产生。视图的特点体现在三个方面:①简单性,看到的就是需要的。视图不仅可以简化用户对数据的理解,也可以简化对它们的操作。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的操作每次指定全部的条件;②安全性,通过视图用户只能查询和修改他们所能见到的数据。数据库中的其它数据则既看不见也取不到;③逻辑数据独立性,视图可帮助用户屏蔽真实表结构变化带来的影响;根据视图的特点可以达到以下的几点作用:①简化数据查询语句;②使用户从多角度看待同一数据;③提高数据安全性;④提供了一定程度的逻辑独立性。
建立数据仓库不是简单的把企业的各种应用集中在一起,而是利用企业信息系统生成的数据,以面向主题、集成的方式合理组织数据,解决数据分析应(非易失的且随时间变化的)
将关系模式转换为具体DBMS平台支持的关系表是数据库物理设计阶段的工作。设计视图和关系模式的完整性约束是数据逻辑设计阶(设计和优化关系模式)段的工作。
数据库应用系统的需求包括:数据需求分析,数据处理需求分析,业务需求分析及其在性能、存储、安全、备份和恢复等方面的要求。
数据需求分析的主要工作是从用户视图出发,分析与辨识应用领域所管理的各类数据项和数据结构,形成数据字典的主要内容。
需求分析阶段,系统需求分析员与用户充分沟通,并形成文档化的需求描述。
通过需求分析过程,需要系统的描述整个应用系统的功能特征、性能特征和约束,并形成需求规范说明文档。
数据操作响应时间、系统吞吐量和最大并发用户数都是性能需求分析的重要指
ORDER BY 语句用于对结果集进行排序:①ORDER BY 语句用于根据指定的列对结果集进行排序;②ORDER BY 语句默认按照升序对记录进行排序。ORDER BY可以对多个列进行排序,此时的排序是嵌套的;ORDER BY语句只能作为其他子句之后的最后一个子句出现;视图中也可以使用ORDER BY语句;子查询语句中是不能使用ORDER BY子句的(因为order by只能对最终结果进行排序)。
在保证数据库一致性的前提下,将频繁操作的多个可以分割的处理过程放在多个存储过程中,这样可以大大提高系统的响应速度。使用游标会占用较多的系统资源,尤其对于大规模并发量的情况下,很容易使得系统资源耗尽而崩溃,而使用临时表能够加速查询。相关子查询的不可以加速查询。
聚合关系强调是“整体”包含“部分”,但是“部分”可以脱离“整体”而单独存在。比如上图中汽车包含了发动机,而发动机脱离了汽车也能单独存在。UML中聚合关系用带空心菱形和箭头的直线表示
组合关系与聚合关系见得最大不同在于:这里的“部分”脱离了“整体”便不复存在。在UML类图中,组合关系用一个带实心菱形和箭头的直线表示。
Driver的drive方法只有传入了一个Car对象才能发挥作用,因此我们说Driver类依赖于Car类。在UML类图中,依赖关系用一条带有箭头的虚线表示。
继承关系对应的是extend关键字,在UML类图中用带空心三角形的直线表示,如下图所示中,Student类与Teacher类继承了Person类。
这种关系对应implement关键字,在UML类图中用带空心三角形的虚线表示。如下图中,Car类与Ship类都实现了Vehicle接口。
分割表增加了维护数据完整性的代价。分割表分为水平分割表和垂直分割表两种。水平分割表:一种是当多个过程频繁访问数据表的不同行时,水平分割表,并消除新表中的冗余数据列;另一种是当主要过程要重复访问部分行时,最好将被重复访问的这些行单独形成子集表(冗余储存),这在不考虑磁盘空间开销时显得十分重要,但在分割表以后,增加了维护难度,要用触发器立即更新 、或用存储过程及应用代码批量更新,这也会增加额外的磁盘I/O开销。 垂直分割表(不破坏第三范式):一种是当多个过程频繁访问表的不同列时,可将表垂直分成几个表,减少磁盘I/O(每行的数据列少,每页存的数据行就多,相应占用的页就少),更新时不必考虑锁,没有冗余数据。缺点是在插入或删除数据时要考虑数据的完整性,用存储过程维护。另一种是当主要过程反复访问部分列时,最好将这部分被频繁访问的列数据单独存为一个子集表(冗余储存),这在不考虑磁盘空间开销时显得十分重要,但因此增加了重叠列的维护难度,要用触发器立即更新、或用存储过程及应用代码批量更新,这也会增加额外的磁盘I/O开销。垂直分割表可以达到最大化利用Cache的目的。 水平分割后,查询数据需要使用UNION操作。垂直分割后,查询数据需要JOIN操作
结构图是指以模块的调用关系为线索,用自上而下的连线表示调用关系并注明参数传递的方向和内容,从宏观上反映模块层次结构的图形。其中结构图包括用例图、类图、组件图、对象图和部署图。
常见的数据挖掘任务包括分类、估计、预测、相关性分组或关联规则、聚类和描述、可视化以及复杂数据类型挖掘(Text、 Web、图形图像、视频和音频等)等。分类分析首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。该需求要求根据购书记录将用户映射到倾向于喜欢某种书的顾客特性中,而分类挖掘模型能把数据库中的数据项映射到给定类别的某一个中。
关系表在逻辑上由一系列元组组成,元组由多个属性组成。每个元组可以用数据库磁盘文件中的一个逻辑记录来存储,记录包括多个域。元组的每个属性对应于文件记录中的一个域。
相当于一个元组用一个逻辑记录,一个属性用一个域
C/S 架构是一种典型的两层架构,其全称是Client/Server,即客户端/服务器端架构。其客户端包含一个或多个在用户的电脑上运行的程序。而服务器端有两种,一种是数据库服务器端,客户端通过数据库连接访问服务器端的数据,另一种是Socket服务器端,服务器端的程序通过Socket与客户端的程序通信。C/S 架构也可以看做是胖客户端架构,因为客户端需要实现绝大多数的业务逻辑和界面展示。C/S的客户端一般需要单独开发。在这种架构中,作为客户端的部分需要承受很大的压力,因为显示逻辑和事务处理都包含其中,需要通过与数据库的交互(通常是SQL或存储过程的实现)来达到持久化数据,以此满足实际项目的需要。
B/S架构的全称为Browser/Server,即浏览器/服务器结构。Browser指的是Web浏览器,极少数事务逻辑在前端实现,但主要事务逻辑在服务器端实现。Browser客户端、WebApp服务器端和DB数据库服务端构成所谓的三层架构。B/S架构的系统无须特别安装,有Web浏览器即可。B/S架构中,显示逻辑交给了Web浏览器,事务处理逻辑则放在了WebApp上,这样就避免了庞大的胖客户端,减少了客户端的压力,因为客户端包含的逻辑很少,因此也被称为瘦客户端。B/S架构中,客户端只需安装WEB浏览器即可,且应用业务规则一般是WEB服务器端实现的。
15. RecordSet 对象用于操作来自提供者的数据。使用 ADO 时,通过 RecordSet 对象可对几乎所有数据进行操作,所有 RecordSet 对象均使用记录(行)和字段(列)进行构造。RecordSet的常用方法为:①AddNew,创建一条新记录;②Cancel,撤销一次执行;③Close,关闭一个 RecordSet;④Delete,删除一条记录或一组记录;⑤MoveNext,把记录指针移动到下一条记录。RecordSet对象的AddNew方法的功能是在对应的数据库表中增加一条新记录。
16. 在SQL Server 2008中,只有创建某个临时表的连接中才能查询当前临时表的数据,并当U1创建的该表的连接还未断开时,才能访问这个表的数据。
17. 稀疏索引是指如果只是一部分查找码的值有对应的索引记录,则该索引为稀疏索引;稠密索引是指如果数据文件中的每一个查找码值在索引文件中都对应一个索引记录,则该索引为稠密索引。对于数据文件和它的一个特定的索引文件,如果数据文件中的数据记录的排列顺序与索引文件中索引项的排列顺序相一致,或者说,索引文件按照其查找码指定的顺序与数据文件中数据记录的排列顺序相一致,则该索引文件称为聚集索引,否则为非聚集索引
18. 两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁:①在对任何数据进行读、写操作之前,要申请并获得对该数据的封锁;②在释放一个封锁之后,事务不再申请和获得其它任何封锁。可以证明,若并发执行的所有事务均遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的。
另外要注意两段锁协议和防止死锁的一次封锁法的异同之处。一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议。但两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁 ,因此遵守两段锁协议的事务可能发生死锁。
加锁阶段事务可以申请获得任何数据项上的任何类型的锁,但是不允许释放任何锁。
在解锁阶段,事务可以释放在任何数据项上任何类型的锁,但是不能再申请任何锁
每个事务开始执行后就进入了加锁阶段
19. 数据仓库不是用做日常查询,也不是汇总和统计,而主要用于提取数据中的潜在信息和知识
OLAP仍使用DBMS存取数据
20. 分布式数据库系统按不同层次提供的分布透明性有:分片透明性、位置透明性、局部数据模型透明性。其中分片透明性是分布式数据库中最高层次的分布透明性,位于全局概念模型和分片模型之间。用户编写程序只须对全局关系进行操作,不必考虑数据的分片及存储场地。当分片模式改变时,只须改变全局概念到分片模式的映象,而不会影响全局概念模式和应用程序,即实现了分片透明性。
21. 操作型数据对性能要求较高、无冗余。决策支持系统(Decision Support System)是一个基于计算机用于支持业务或组织决策活动的信息系统
操作型数据和DSS型数据特征有如下说法:
操作型数据更新频率高,DSS型数据一般不更新
操作型数据是详细的,DSS型数据是综合的
操作型数据处理需求事先可知,DSS型数据处理需求事先不明确
22. 数据仓库有四个特点:①面向主题,操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据按照一定的主题域进行组织。主题是一个抽象概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关;②集成的,面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息;③稳定的,操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新;④反映历史变化,操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
23. 事务是构成数据库应用中一个独立逻辑工作单元的操作的集合,也是访问并可能更新数据库中各种数据项的一个程序执行单元。数据库系统通过执行各种事务实现对数据库数据的操作,管理和执行事务是DBMS的基本功能。事务的四大特性为:①原子性;②一致性;③隔离性;④持久性。事务调度则是为了保证事务的此四大特性。调度分为串行调度和并发调度。串行调度的特点是一个事务的所有操作都执行完后才开始执行另一事务,不存在事务操作的交叉执行;不同事务操作的交叉执行称为并发调度,DBMS交叉执行来自多个事务的各个操作,以提高数据库系统的性能。并发调度中不同的事务的操作可以交叉执行。
24. 某些情况下,需要把数字数据类型显示为相应的文本名称,这就碰到了多表连接建立记录集的问题。多表连接的类型主要有left join、right join和inner join。其主要区别如下:①left join(左联接),返回包括左表中的所有记录和右表中联结字段相等的记录;②right join(右联接),返回包括右表中的所有记录和左表中联结字段相等的记录;③inner join(等值连接),只返回两个表中联结字段相等的行。因此本题采用inner join,结果集将返回包括table_1和table_2都满足条件的行。
25. 事务日志是一个与数据库文件分开的文件。它存储对数据库进行的所有更改,并记录全部插入、更新、删除、提交、回退和数据库模式变化等操作。事务日志是数据备份和数据恢复的重要文件,也是使用 SQL Remote 或 [复制代理] 复制数据所必需的。
26. 在UML模型中,通信图是交互图的一种,也被称作协作图。它是表达对象之间的联系以及对象间发送和接收消息的图。
27. 堆文件也称为无序文件。在堆文件中,记录随机地存储在文件物理空间中,新插入的记录存储在文件的末尾。
28. 数据仓库的数据来自多种数据源。不同的数据源可能由不同的平台开发,使用不同的数据库管理系统,数据格式也可能不同。源数据在被装载到数据仓库之前,需要进行一定的数据转换。数据转换的主要任务是对数据粒度以及不一致的数据进行转换。
29. 对数据库系统的监控分为手动监控机制和自动监控机制两种。
30. 重点理解关系范式
31. 索引视图
第四套
fetch的功能是通过Transact-SQL服务器游标检索特定的行,具体语法是:fetch 参数 行数 from 游标名
next:紧跟当前行返回结果行,并且当前行递增为返回行。如果fetch next为对游标的第一次操作,则返回结果的第一行。默认为next
prior:搜索返回紧邻当前行前面的结果行,并且当前行递减为返回行。如果fetch prior为对游标的第一次提取操作,则没有行返回并且游标置于第一行之前。
first:返回游标中的第一行为结果行
last:返回游标中的最后一行并将其作为当前行搜索
absolute n/nvar:如果n或者nvar为正,则返回从当前行开始向后的第n行,并将返回的行作为当前行。如果为负,则返回从当前行开始向前的第n行,并将返回的结果作为当前行。如果为0则不反回行。
relative n/nvar:如果为正,则返回从当前行开始向后的第n行,并将返回结果作为当前行。如果为负,则返回从当前行向前的第n行,并将返回结果作为当前行。如果为0,则返回当前行。在第一次提取的时候,将n或者nvar设置为负数或者0时,则不反回行。
创建唯一聚簇索引:unique clustered
创建唯一非聚簇索引:unique nonclustered
分布式数据库的分片类型:
水平分片:按照一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集都是关系的一个片段
垂直分片:把全局关系的属性集若干子集,并且在这些自己上做投影运算,每个投影成为垂直分片
导出分片:导出水平分片,水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。
混合分片:以上三种方法的混合。
常用的数据挖掘方法:分类(事先知道类型),回归分析,聚类,关联规则,特征,变化和偏差分析,web页挖掘。
SQL Server主要采用发布,分布,订阅的方式来处理复制。复制技术包括:快照复制,事务复制,合并复制
快照复制:发布服务器会定时向订阅服务器传送数据,如果订阅服务器修改过数据,定时传递后订阅服务器的数据修改会全部丢失,全部以发布服务器为准。
事务复制:发布服务器会定时检查数据是否有修改过,如果有则向订阅服务器传送数据(记录行级)
合并复制:发布服务器和订阅服务器可以独立修改,会定时合并。
需求分析主要包括数据需求分析、数据处理需求分析、功能需求分析(数据处理需求分析与业务规则需求分析)、性能需求分析和其它需求分析。
①数据处理需求分析:从对数据组织与存储的设计角度,辨识应用领域所管理的各类数据项和数据结构,与数据处理需求分析结果一起,组成数据字典,形成"数据规范说明书"。
②功能需求分析:功能需求分析主要针对DBAS应具有的功能进行分析,是DBAS需求分析的核心环节,总体上可分为数据处理需求分析与业务规则需求分析。数据处理需求分析从数据访问和处理的角度,明确对各数据项所需要进行的数据访问操作。在系统规划与分析阶段,DBAS开发者已经明确了各类用户视图。因此数据处理需求分析阶段可以从这些视图出发,针对每个用户视图进行数据处理需求分析,然后汇总各个视图的分析结果得到对系统的完整分析结果。故选择A项。
③性能需求分析:性能需求则描述了系统应当做到什么程度,分析DBAS应具有的性能指标。
④其他需求分析包括:存储需求、安全性需求等。
a.存储需求分析:存储需求分析是指估计DBAS系统需要的数据存储量,如DB所存储的数据总量。
b.安全需求分析:主要用于数据库安全设计,避免被非法使用和攻击。
顺序图是用来描述对象自身及对象间信息传递顺序的视图。
活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序、并行次序。
类图是展现一组类、接口和协作以及它们之间的关系的一种静态视图
协作图是交互图的一种,其中包含一组对象、对象之间的联系以及对象间发送和接收的消息
状态图主要用来描述一个实体在发生一些事件时的状态变化情况,用于展示该实体处于不同状态时对不同事件做出响应后的状态变化情况
count()函数用于统计元组的个数或者某个字段的个数,SUM()则用来计算某个字段的总和。
前型触发器是在引发该触发器执行的操作语句执行之前激活的触发器,后触发器就是在语句执行之后激活的触发器
自主存取控制:
通过GRANT(授予),REVOKE(收回),DENY(拒绝)来实现的
权限的种类:
1.数据库管理系统进行维护的权限
2.数据库的对象和数据进行操作的权限:语句权限和执行权限
3.隐含权限:用户自动具有的权限,不能被更改
强制存取控制:
将全部实体划分成主体(DBMS所管理的实际用户,代表用户的各个进程)和客体(受主体操纵的,包括文件,基本表,索引,视图)两大类。
主体对客体的存取必须遵循如下规则:
仅当主体的许可证级别大于或者等于客体的密级时,主体才能读取相应的客体
主体等于客体时,才能进行写操作
检查点:最大限度的减少了数据库完全恢复时所必需的执行的日志部分。
记录的内容:检查点时刻所有正在执行的事物清单
这些事务最近一个日志记录的地址
重新开始文件用来记录各个检查点记录在日志文件中的地址
在检查点建立的同时,数据库管理系统会将当前数据缓冲区的所有数据记录写入数据库中
主-备方式(Active-Standby方式)即指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。该方式的特点是当Active状态服务器出现故障的时候,通过软件诊断将Standby机器激活,保证系统在最短时间内恢复正常使用。
公有网络为客户端和数据库服务器连接的网络,私有网络为两台数据库服务器之间检测的网络。接管的资源:共享存储资源,服务器ip地址。
异常情况:作为心跳检测的私有网络出现故障,备用服务器就会启动接管过程,强行接管服务器的IP地址和共享存储。叫做“脑裂”
缺点:备用服务器长期处于standby状态,计算资源浪费严重。运行服务器和备用服务器之间的切换本质上可以认为是数据库重新启动的过程,所有数据库的连接就会中断,并且重新启动会需要一段时间。
双主机方式(Active-Active方式)即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态),优点是两台服务器切换速度快,数据库连接不中断,应用不受影响。
快照:该方法通过对当前数据表进行"照相",记录当前的数据表信息"相片",然后将当前的"相片"与以前的数据表"相片"进行比较,如果不一致将通过一定的方式传到数据仓库,从而实现数据的一致性,这种方式适合于更新频率较低的数据表。
大容量日志恢复模式:在包含最小化日志操作的日志记录的日志备份,是不能恢复数据库到特定时间点的。另外,如果运行的是最小化日志模式,有尾日志会备份失败的特殊情形,当数据库运行在大容量日志模式里,在事务日志里活动部分存在的记录和数据文件会因灾难而不可用(例如磁盘故障)。
数据库物理设计阶段的主要活动有:确定存储结构,存取路径的选择和调整,确定数据存放的位置和确定存储分配。
数据库备份与恢复设计属于数据库日常维护活动
DFD的主要组成包括外部实体(外部项),处理过程,数据存储和数据流。
外部实体是指系统之外又和系统有联系的人或者事物,说明了数据的外部来源和去处。
处理是指对数据逻辑处理,也就是数据变换,用来改变数据值
数据流:用箭头表示数据的流向
数据存储:表示用数据库的形式(或者文件的形式)存储数据,对其进行的存取分别以指向或者离开数据存储的箭头表示。
用例之间的关系包括:扩展,使用,组合
索引视图是存储一个查询结果的数据库对象。
事务内部故障可以分为预期和非预期的,非预期的事务内部故障包括:运算溢出故障,并发事务死锁故障,违反了某些完整性限制而导致的故障
在并行数据库中,无共享结构被认为是支持并行数据库系统结构的最好并行结构,适用于银行出纳之类的应用。
共享结构:每个处理机拥有独立的主存储器和磁盘
数据挖掘作为知识发现的过程,一般由三个阶段组成:数据准备,数据挖掘,结果的解释和评估
因为很少用到商品描述属性,系统在查询时也就很少查询。因此可以将其分割,这样虽然破坏了表的整体性,却可以将系统得到优化。
增加冗余列是指在多个表中增加具有相同语义的列,它常用来在查询时避免连接操作,值得一提的是,主码和外码在多表中重复出现不属于冗余列,这里指得冗余列是非关键字字段在多表的中的出现。
由于表的连接操作是比较费时的,如果在表中增加冗余列,则在行上执行查询操作时不需要进行表的连接操作,从而提高了查询效率。
一个聚集是一组表,可将经常一起使用的具有同一公共列值的多个表中的数据行存储在一起。对于经常频繁一起查询的表,使用聚集比较方便。
通常在运行Order By和Group By语句时会涉及到排序的操作,尤其是对大型的表进行重复的排序,会引起磁盘很大的开销。而散列文件的优点是:文件随机存放,记录不需进行排序;插入、删除方便;存取速度快;不需要索引区,节省存储空间。因此带有Order By和Group By的表可以使用散列文件存储,提高查询效率。
第五套
瀑布模型是基于严格的、明确的需求作为软件系统开发基础的软件开发模型;快速原型模型是一种快速开发方法,其指导思想是不必把前期各阶段的活动做得尽善尽美后才启动下阶段的活动;螺旋模型是将瀑布模型的系统化与快速模型的可修改性结合起来,引入风险评估活动
IDEF0:
顺序图的第一个消息一般在左边第一个对象的生命线顶端,然后其他消息按时间顺序相继加入顺序图中,后面发生的消息的线应该比前面发生的消息的线画得低些,以表示它们之间的时间关系。
顺序图的横向矩形框代表对象,水平消息线用于表示对象间通信。
顺序图可以用来描述对象的创建和销毁。
顺序图中的虚线称作“生命线”,表示一个对象在其时间周期内的存在。
desc降序排列,系统默认是升序
sp_addrolemember语句的作用是为固定数据库角色添加成员。
①create role R1语句是添加用户角色R1;
②create user U1语句是添加用户U1;
③grant INSERT on T to R1语句是授权用户R1在表上T具有insert(插入)权限;
④sp_addrolemember ‘R1’, 'U1’是将用户U1添加到R1角色中;⑤sp_addrolemember ‘db_datareader’, 'U1’是将用户U1添加到db_datareader角色中,db_datareader的角色具有查询数据库中所有用户数据的角色;
⑥deny SELECT on T to R1作用是不允许角色R1在表上T上具有查询的功能。
由步骤④、⑤和⑥知道,U1属于R1角色,而R1不能查询T1
SQL Server 2008支持三种恢复模式:简单恢复模式、完整恢复模式和大容量日志恢复模式。简单恢复模式只用于测试和开发数据库,或用于主要包含只读数据的数据库(如数据仓库),这种模式并不适合生产系统。大容量日志恢复模式一般只作为完整恢复模式的附加模式,该模式不支持时点恢复。
分片透明性是最高级别的透明性,位于全局概念模式与分片模式之间。局部数据模型透明性位于分配模式与局部概念模式之间
无共享结构通过最小化共享资源来降低资源竞争的概率,具有很高的扩展性,适合OLTP应用。B项错误。
共享磁盘结构比共享内存结构具有更大的优势,访问内存不再会产生冲突,但这种结构是通过互联网实现各个处理器之间的信息和数据交换,会产生一定的通信代价。C项错误。
分布式数据库系统的主要目的是实现场地自治和数据全局透明共享。D项错误。
故答案为A项。层次结构可以分为两层,顶层是无共享结构,底层是共享内存或共享磁盘结构
OLTP:联机事务处理环境,一般需要处理大量事务,且执行事务的内容比较简单且重复率高
OLAP:用于复杂的分析操作,侧重对决策人员和高层管理人员的决策支持。
在数据库事务概要设计阶段,使用read和write原语来表达存取操作
用例图用于描述系统与外部系统的交互
公用表表达式:with 公用表表达式标识符(列表1…列表n)AS(select 语句)
删除存储过程:drop proc
将视图sales.V定义为索引视图:create unique clustered index idx on sales.V(…)
分布式数据库管理系统由局部数据库管理系统,全局数据库管理系统,全局数据字典,通信管理四部分组成
数据从操作型环境转移到数据仓库过程中所用到的ETL工具通常需要完成的处理操作包括抽取,转换和装载
对sql语句进行性能优化属于数据库运行管理与维护
create function goods_prifit(@year)
returns @totle table
(
商品号 varchar(50),
销售总额 int
)
as
begin
insert into @totle
select a.商品号,sum(a.单价*b.销售数量) from 商品表 a join 销售变 b on a.商品号=b.商品号 where year(销售时间)=@year
group by a.商品号
return
end
数据库复制技术:
优点:能满足数据的一致性,因为利用数据库快照复制技术,可以将相关表分发给另一台服务器,可以满足数据的一致性。数据库的更新可以采用自动更新和手动更新方式。更新时间可以在建立分发数据库时设置,设置时间小于1分钟。通过这种方式可以满足用户体验。数据库的分发只在软件层面进行,对于已经建好的发布和订阅可以直接用delete按钮删除,然后进行重新设置,可扩展性强。
缺点:曾加了一台服务器的开销
存放网站系统的服务器被设置为发布服务器,另外一台服务器可以作为分发服务器和订阅服务器。发布服务器以事务复制的方式向分发服务器发送信息。客户端通过订阅服务器获取数据,实现信息同步更新。这种方式不会影响网站系统服务器的运行,又能保证客户端可以随时刷新信息。
建立索引是加快查询速度的有效手段。使用create index,一般格式为:
create [unique] index<索引名> on <表名>(<列名>[<次序>],<列名>[<次序>],)include (属性名) where 约束条件
区分数据库维护工作中的数据库备份和数据库监控
传统的索引(有序索引,树索引,聚集)都是建立在比较的基础上,在结构中查找记录时需要进行一系列与关键字的比较。理想情况是不希望经过任何比较,一次存取就能查到所有记录,则散列(哈希)索引可以办到。
文件备份(文件备份,差异文件备份)主要是对数据库中的数据文件的备份,不对日志文件备份。数据库备份(完整数据库备份,差异数据库备份)会对日志文件进行备份。
数据库系统的故障:事务内部故障,系统故障,介质故障,计算机病毒故障。
数据水平分片,关系中每一行至少属于一个片段,需要时可以重构关系。
数据垂直分片,个片段应该包含关系的主码,以便通过连接的方法恢复关系
分布式数据库可以从数据分片和数据分配两个角度考虑,一般先进行数据分片,再进行数据分配。
数据集中分配,便于控制,但数据过于集中,负载过重,已形成瓶颈,可靠性差
数据定义语言经过DDL编译处理后,存放在数据库的数据字典中。
数据字典:数据项,数据结构,数据流,处理
DFD四种基本元素:数据流,处理,数据存储,外部项
数据模型三要素:数据结构,数据操作,完整性约束
具有创建数据库权限:
exec sp_addsrvrolemember ‘log1’ ‘dbcreator’
采用事务等待图来检测死锁
并行数据服务器体系结构:共享和无共享。无共享:每个站点都要实现全局数据目录,每个站点有独立的内存和磁盘对应该站点的服务器。
第六套
DFD建模中,数据流用箭头表示,处理用矩形框表示,外部项用圆角框或者平行四边形框表示
一个数据库只能有一个主数据文件,可以有多个次要数据文件,主数据文件和次要数据文件可以放在相同的磁盘上,也可以分开放置。一个数据文件只能是一个文件组成员。日志文件和数据文件可以放在相同的磁盘上,也可以放在不同的磁盘上。
db_datawriter:具有插入,删除和更新数据库中所有用户数据的权限
db_accessadmin:添加和删除数据库用户的权限
db_backupoperator:备份和恢复数据库的权限
db_owner:具有创建数据库对象的权限
数据监控分析包括对数据库架构体系的监控(空间基本信息,空间使用率和剩余空间大小,空间是否具有自动扩展功能等)和对数据库性能的监控(数据缓冲区命中率,库缓冲,用户锁,锁与等待,回滚段,临时短的使用情况,索引的使用情况,等待时间和共享池)。监控分析的对象是数据库而不是数据库系统。
索引建立的原则:
经常在查询中作为条件的属性
表中数据大量更新后重建相关索引
频繁进行分组或者排序的属性建立索引
一个列的值范围很大应建立索引
如果排序的列有多个,应建立复合索引
RAID1比RAID5具有更好的写操作性能,所以在例如数据库系统日志文件的存储这样的应用中使用广泛。对于经常使用读操作而很少使用写操作的的应用,RAID5是首选。
全局外模式:全局应用在用户视图,即终端用户看到的逻辑上并未分布的表,视图等
全局概念模式:描述全体数据的逻辑结构和特征
分片模式:描述每个数据片段以及全局关系到片段的印象,是分布式数据库系统中全局数据的逻辑划分视图
分配模式:描述各片段到物理存放场地的映像
局部概念模式:描述全局关系在场地上存储的物理片段的逻辑结构和特征
局部内模式:描述局部概念模式涉及到的数据在本地的物理存储
在UML中,通信图主要是用于描述对象在空间中如何交互,即除了动态交互,它也直接描述了对象是如何连接在一起的。在图中没有时间轴,将消息按序编号
具有查询全部用户表数据权限的数据库角色的是:db_datareader
可以再查询语句中加入 FOR XML 子句实现以XML格式返回查询结果
局部数据模型透明性处于分配模式和局部概念模式之间,使用户在编写程序是不但要了解全局数据的分片情况,还要了解个片段的副本复制情况以及各副本的场地位置分配情况,但是不需要了解各场地上数据库的数据模型
分布式数据库的数据分配:
集中式,分割式(全局数据只有一份),全复制式(全局数据有多分),混合式