14.在具有数据仓库的企业数据环境中,数据仓库数据一般都具有许多特点,下列都属于其特点的是
A、面向主题、不可直接修改、批量访问
B、面向主题、可直接修改、性能要求较为宽松
C、集成的、可直接修改、批量访问
D、集成的、不可直接修改、性能要求高
参考答案为A
解析:数据仓库的特性包括面向主题性、集成性、不可更新性和时间特性。
其中不可更新并不意味着不再向数据仓库追加新的数据,只是一般不对数据仓库内的原始数据进行修改,数据的载入和更新通常是以批量方式进行操作。
时间特性是指随着时间的推移,部分数据不再需要,将会被删除,但不是像操作型数据库那样直接删除。
15.在企业数据仓库设计中,数据的粒度级设计是一个重要的问题,在粒度级设计中,设有下列考虑因素
I.用户查询所涉及的数据的最低细节程度
II.高粒度级数据所需的存储空间
III.用户查询的平均性能需求
IV.系统的可用存储空间
V.低粒度级数据的规模
VI.用户查询所涉及的数据最高粒度级
在以上因素中,属于设计时需要考虑的主要因素是
A、仅I和III
B、仅I、III和VI
C、仅I、III、IV和V
D、仅IV和V
参考答案为C
解析:关于设计过程中如何确定数据粒度,目前还没有一个精确度量的方法,设计者应将考虑的重点放在数据仓库中数据的存储量大小及数据是否满足最终客户需求上。在数据仓库中确认粒度的级别时,需要考虑这样一些因素:要接受的分析类型,可接受的数据最低粒度和能存储的数据量。所以I、IV和V对。
粒度的高低影响到数据仓库的数据量以及系统能回答的查询类型。粒度越小,细节程度越高,能回答的查询就越多,但是数据量会较大,空间代价也大;粒度越大则反之。
进行数据仓库的数据组织时,需要根据当前应用的需求来进行多粒度级设计,在可用的存储空间中保存不同粒度粗细的主题数据,以尽可能满足各种应用的查询要求,同时提高查询的计算效率。所以需要考虑用户查询的平均性能需求,III对。
16.在下面列出的每组描述特性中,均不属于数据仓库数据特点的是
A、集成的、可直接修改、相对OLTP环境性能要求高
B、面向业务应用、集成的、批量访问
C、面向主题、可直接修改、性能要求较为宽松
D、面向业务应用、可直接修改、相对OLTP环境性能要求高
参考答案为D
解析:数据仓库的特征包括:面向主题性、集成性、不可更新性和时间特性。
故答案是D。
17.关于数据仓库、数据挖掘和决策支持的相关概念,下列说法一般情况下错误的是
A、在企业中,建立数据仓库的主要目的是服务于企业的数据挖掘,使企业的信息系统尽可能地实现自主业务决策
B、在企业中开展数据挖掘不一定都需要建立规模庞大的数据仓库
C、企业中的决策支持活动不一定非得需要信息系统,但是信息系统与数据仓库的建设有利于更方便地开展决策支持活动
D、建设数据仓库有助于更方便地实现数据挖掘,更好地实现决策支持
参考答案为A
解析:建立数据仓库的主要目的在于根据决策需求对企业的数据采取适当的手段进行集成,形成一个综合的、面相分析的数据环境,用于支持企业的信息型、决策型的分析应用。与选项A所述不符,而BCD选项逻辑无误,故答案为A。
18.在数据挖掘或机器学习概念中,有监督学习、无监督学习和强化学习是常见的学习方法,下列学习任务属于有监督学习的是
A、将未知类别的一组数据,采用聚类方法,分成不同的组
B、机器人在动态环境中自主学习掌握行走方法
C、不基于人类历史棋谱数据,训练出下围棋的智能软件
D、根据样本数据,采用分类算法,训练分类器
参考答案为D
解析:有监督学习是从打上标签的训练数据中推断函数的机器学习任务。
聚类挖掘是典型的无监督学习。
以上选项中只有D选项是基于打上标签的指定数据进行学习的。
故本题答案为D。
19.设有某移动通信公司的业务支撑系统,该系统中存在如下各种数据或文档
I.用户通话详单
II.用户短信记录
III.系统ER图及说明文档
IV.DBMS中的数据字典
V.用户名单数据
VI.用户每月费用支出分类汇总数据
VII.用户缴费记录
以上各类数据,属于元数据的是
A、仅III、IV、V和VII
B、仅IV、VI和VII
C、仅III和IV
D、仅I、II和V
参考答案为C
解析:考察 元数据
元数据是关于数据的数据,或者叫做描述数据的数据,它描述了数据的结构、内容、链和索引等项的内容。
故本题答案为C。
20.在编写事务时,提高封锁的粒度带来的好处是
A、提高了事务并发性
B、减少了封锁开销
C、降低了发生死锁的可能性
D、提高了事务吞吐量
参考答案为B
解析:封锁粒度越大,数据库系统能够封锁的数据单元就越少,封锁开销也就越小,并发度也就随之降低。
21.数据仓库是服务于决策支持的数据集合,面向主题是其中的一个重要特征。下列关于面向主题的理解,一般情况下错误的是
A、面向主题要求进行数据仓库数据模型设计和组织时需要针对特定主题的决策支持需求集进行
B、面向主题一般会要求数据仓库中必须集成企业或组织机构中多个来源的数据集
C、面向主题中的主题是指一组决策支持需求的集合
D、面向主题是指进行数据仓库的应用开发和部署时要采用面向主题的开发工具和实施平台
参考答案为D
解析:主题是一个抽象的概念,用于标识某一宏观的分析领域所涉及的对象。
开发工具和实施平台并非抽象概念。
22.设有某网购平台业务系统与大数据平台,其中存在如下各种数据或文档
I.商品清单表
II.厂家清单表
III.业务系统与大数据平台的ER图及说明文档
IV.业务系统中DBMS中的数据字典
V.销售数据明细
VI.业务系统数据与大数据平台数据的对应关系数据
VII.客服聊天记录
以上各类数据,属于元数据的是
A、仅I、II和VI
B、仅IV、V和VII
C、仅I、II、IV和VI
D、仅III、IV和lVI
参考答案为D
解析: 元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。
故答案应为D。
23.设某数据仓库系统中有下列数据表:
I.商品销售表(商品号,店铺标识,销售量,单价,日期,时间>
II.各店商品周销售表(商品号,店铺标识,周销售量,周)
III.各店商品月销售表(商品号,店铺标识,月销售量,月>
IV.各小类各店商品月销售表(商品小类,店铺标识,月销售量,月>
以上各个表中数据,粒度级最低和最高的表分别是
A、仅I和IV
B、仅I和II
C、仅II和III
D、仅III和IIV
参考答案为A
解析:一般将综合级别称为粒度。粒度越大,综合程度越高;粒度越小,综合程度越低。例如,若为商场经营管理系统案例设计监理数据库,商品的销售明细数据是低粒度数据,对某段时间范围内商品销售情况的统计是高粒度数据。
故本题答案为A。
24.设数据仓库平台中有三个物化视图(实体化视图)V1、V2和V3,若有分别针对这三个视图进行的查询Q1、Q2和3,查询过程或结果有如下现象:
I.Q1查询到的是V1视图所对应原始数据的4小时前的数据
II.Q2每次查询到的都是V2视图所对应原始数据的1分钟前的数据
III.Q3查询V3时,发现V3不是最新数据,实时启动对V3的更新程序,刷新后得到最新数据
有关V1、V2和V3所采用的物化视图更新维护策略的说法,正确的是
A、对Vv1和V2采用的是快照维护策略,V3是延时维护策略
B、对v1和V2采用的是延时维护策略,V3是实时近实时维护策略
C、对V1采用的是快照维护策略,V2是实时近实时维护策略,V3是延时维护策略
D、对V1、v2和V3都采用的是延时维护策略
参考答案为C
解析: 维护策略分为三种,如下
①实时维护:数据源发生变化时,立即更新数据仓库中的数据。
②延时维护:不是在数据源的更新事务中完成,而是在数据仓库中的视图被查询时完成。
③快照维护:定期对数据仓库进行维护,触发的条件是时间。
故本题答案为C。
25.有监督学习、无监督学习和强化学习是常见典型的机器学习方法,下列学习任务属于无监督学习的是
A、不基于人类历史棋谱数据,训练出下围棋的智能软件
B、将一组无标签数据,采用一定的机器学习算法将数据分成不同的组
C、根据一组小规模样本数据,采用某种小样本学习算法,训练分类器
D、根据专家标定的一组有标签时间序列数据,训练异常发现算法
参考答案为B
解析:有监督学习是从打上标签的训练数据中推断函数的机器学习任务。
聚类挖掘是典型的无监督学习。
26.设有某短视频平台的业务支撑系统,该系统中存在如下各种数据或文档
I.用户发布的短视频
II.用户间相互关注的关系数据
III.大数据平台的系统ER图及说明文档
IV.平台大系统中的某个DBMS中的数据字典
V.每个视频在系统中的存放位置数据
VI.用户商品下单数据
VII.用户对短视频的评论
以上各类数据,属于元数据的是
A、仅III、IV和VII
B、仅IV、V、VI和VII
C、仅III、IV和V
D、仅I、II和V
参考答案为C
解析:元数据是关于数据的数据,或者叫做描述数据的数据。