1.混合分片式水平分片,垂直分片和导出分片的混合
2.关联挖掘是用于发现数据库中数据间的关联习惯
3.提取游标:
FETCH ABSOLUTE
4.修改触发器
ALTER TRIGGER
4.无共享结构被认为是支持并行数据库系统最好并行结构
5.数据库镜像分为 高可用操作模式,高保护操作模式和高性能操作模式
6.ODS一般用以支撑即时OLAP和全局性OLTP
7.主码不能为空,属于数据模型三要素中的完整性约束
8.刀片服务也就是无共享结构
9.数据仓库是一个面向主题的,集成的,且随时间变化的数据集合
10.数据库管理系统中的加锁协议规定了事务的加锁时间,持锁时间和释放锁时间,三级加锁协议可以完全保证并发事务
11.sysadmin具有系统管理员权限
12.定义标识列
CREATE TABLE T1(C1 int IDENTITY )
13.
面向主题的设计方法:
调查用户的决策或数据处理需求,将功能相近且需要相关联数据支持的需求进行归类
14.
DECLARE X CURSOR FOR SELECT
15.
以多维数组作为存储结构的被称为MOLAP
复习9.19
1.存储过程可以有多个输入参数,但只有一个输出参数
2.规划与分析工作包括系统规划与定义、项目规划和可行性分析
3.内联表值函数没有相关联的返回变量
内联表值函数的作用类似于带参数的视图
调用内联表值函数时,只能将内联表函数频繁出现在FROM子句中
4.
用户自定义函数主要包括标量函数和表值函数两种
5.
新建数据库、数据库恢复、数据库软件升级、数据库管理系统补丁安装
均属于数据库运行维护工作
6.段的占用空间,用户连接数都属于数据库监控内容
9.
与非聚集索引相比,聚集索引更适合范围查询
10.
数据库镜像可分为高可用操作模式,高保护操作模式,高性能操作模式
11.
创建触发器和定义事务隔离性界别都属于数据库的完整性保护
12.
差异备份是指从最近的一次完整备份到当前时间数据库中变化的数据和日志
13.
分布式数据库的目标是本地自治
14.无监督学习就是对未知标签进行学习和分组
15.
数据仓库中数据维护策略可分为3种:
实时维护、延时维护和快照维护
实时维护能够保证用户总查到最新的数据
延时维护不是在数据源的更新事务中完成
快照维护时定期对数据库仓库进行维护
16.
ODS一般用以支撑即时OLAP和全局OLTP
17.
在关联规则挖掘中,为了发现有意义的关联规则,需要给定最小支持度和最小可信度两个阈值
18.
从高粒度级数据视图切换到低粒度视图的分析操作称为钻取操作
19.
分类算法需要用到的样本数据一般分成训练集、测试集和验证集3类
20.
聚类算法所处理的数据对象一般都没有标记,因此聚类也被称为无监督的学习方法
21.
知识发现主要由三个步骤完成,他们是数据准备,数据挖掘,结果的解释评估
22.
元数据主要分为技术元数据和业务元数据
23.
ETL是用来描述数据从来源经过抽取,转换,加载至目的端的过程。采用数据抽取程序从OLTP系统中抽取数据的主要原因是解决不同类型应用程序之间的性能冲突问题
24.
OLTP是生成数据的系统,OLAP是利用数据的系统
OLTP系统一般面向企业外部人员和企业内部,而OLAP主要面向企业内部各层次决策人员
25.
数据仓库中的数据集合具有集成性,实现企业数据的集成有助于实现企业范围的跨部门视图
26.
数据库系统的数据一般是面向企业,数据仓库中的数据是以面向主题的方式进行的
27.
将每年每个分店的销售数据划分为独立的数据表,这种划分方式被称为多维划分
28.
集中式:所有数据片都安排在一个场地上,易形成瓶颈,可靠性较差
分割式:所有全局数据只有一份,他们被分割成若干个片段,每个片段被分配到一个特定场地上
29.
在分布式数据库中,虽然数据分布在多个不同的场地上,在进行查询处理时还要考频率站点间阐述数据的通信代价
30.
共享内存结构与单机系统的差别是以多个处理器代替单处理器
31.
共享磁盘结构中所有处理器都有独立的内存,通过网络共享磁盘
32.
共享内存结构中所有的处理机通过互联网共享一个公共的主存储器
共享磁盘结构中所有处理器拥有独立的主存储器,通过互联网共享磁盘
无共享结构中的每个处理剂拥有独立的主存储器和磁盘,不共享任何资源
33.
以多维数组作为存储结构的被称为MOLAP
new
分布式数据库采用数据分片对数据机型管理,需要保持三个原则:
1.完整性原则:全局关系的所有数据项必须包含在某个片段中,否则将导致数据库不完整,造成某些片段数据丢失
2.重构性原则:即所有片段必须能够还原全局关系
3.不相交原则:对于一个全局关系,要保证数据不丢失,则必须要属于某个片段
2.数据分片中的水平分片根据一定的条件分为不同的片段,关系中的每一行必须至少属于一个片段(注意是每一行不是每一个属性)
3.全局外模式是全局应用的用户视图,即终端用户看到的是逻辑上并未分布的表、视图等
4.全局概念模式用于描述全体 数据的逻辑结构和特征
5.分片模式用于描述每个数据片段以及全局关系到片段的映像
6.分配模式用于描述各片段到物理存放场地的映像
7.局部概念模式用于描述全局关系在场地上存储的物理片段的逻辑结构以及特征
8.局部内模式用于描述局部概念模式涉及的数据在本场地的物理存储
9.分布式数据管理系统应能对各个场地的软硬件资源进行管理
10.
分布式数据管理系统能管理全局数据字典
11.
全局数据库管理新系统是分布式数据管理 系统的核心,它为终端用户提供分布透明性,协商全局事务在各个场地的执行,为全局应用提供支持。
局部数据库管理系统负责创建和管理局部数据库,提供场地自制能力,执行全局应用以及全局查询的子查询
12.
无共享结构被认为式支持并行数据库系统的最好并行结构,它通过最小化共享资源来降低资源竞争 的概率,具有极高的可扩展性(这里要与共享结构区分开来),并可在复杂数据库查询处理和练级处理事务过程中达到尽线性的加速比
13.
并行数据库 的 主要目的式提高数据库系统的吞吐量和减少事务响应时间
14.
共享内存结构与单机系统的差别只在于以多个处理器代替单个处理器,并行执行事务,通过共享内存传送消息与数据
15.
SUM,MAX,MIN等聚集函数一般都无法实现并行化
16.
共享磁盘是通过互联网共享磁盘,这种结构可以克服共享结构,但是会由信息交换,换产生一定的通信代价
17.
一维数据划分方法主要包括转轮法 、散列划分和范围划分,其中转轮法和范围划分用到了两个划分属性,因此需要采用多维数据划分,即将关系属性分为主划分属性和辅助划分属性,然后在按其进行范围划分
18.
Bigtable表的索引式行关键字、列关键字和时间戳
19.Bigtable数据模型的 特点是:
1.表中的关键字可以是任意的字符串
2.列族是由列关键字组成的集合,是访问控制的基本单位
3.时间戳记录了BigTable是每一个数据项所包含的不同版本的数据的时间标识
在Bigtable中,不仅可以随意地增减行的数量,在一定的约束条件下,还可以对列的数量进行扩展
20.
散列划分适合点查询和顺序扫描
转轮法适合于扫描整个关系的应用,无法准备定位元组的那一个磁盘,不能均衡的将数据划分到各个 磁盘上
范围划分策略适合范围查询和点查询,
21.
共享内存结构中所有的处理机通过互联网共享一个公共的主存储器
22.
共享 磁盘结构中所有处理机拥有独立的主存储器,通过互联网共享磁盘
23.
层次机构综合了共享内存、共享磁盘和无共享结构的特点
24.
并行数据库系统的主要目的是:提高是数据库吞吐率和减少事务响应时间
分布式数据库系统的主要目的是实现场地自治和数据全局透明共享
25.
云计算平台的一个定位在于设法为应用系统提供无限的计算资源
云计算具有为用户提供短期使用资源的灵活性
云数据库架构通过计算迁移而不是数据迁移减少了分布式系统的结点间通信量
26.
MapReduce运算是在应用层上提供了一套大规模集群基础上编写大型分布式应用程序机制
27.
采用OLTP,是不能使用共享内存结构的,会引起大量数据冲突
28.
范围划分适合范围查询以及点查询
eg:
查询a1值为最大的元组 ->范围查询
查询a1= 5的所有的元组 ->范围查询
查询a1值属于[1,100]的元组 -> 点查询