CRISP-DM模型是应用最广泛的KDD过程模型,下面属于CRISP-DM模型的阶段有()
A.业务理解
B.数据理解
C.数据准备、建模、模型评估
D.模型发布
2/20
表结构是数据分析中常用的数据结构,以下属于表结构分析工具的是
A.DB2
B.Power BI
C.Excel
D.PPT
3.收集多源数据是进行数据分析工作中的重要步骤之一,以下可以成为表结构数据数据源的选项有哪些
A.CSV格式的数据文件
B.数据库
C.Excel文件
D.网页数据
4/20
某电商订单表中的主键为订单号,根据业务常识判断不能存放于订单表中的字段是()
A.客户ID
B.产品名称
C.付费时间
D.产品金额
5/20
关系型数据库中表与表之间可以横向连接也可以纵向连接,以下连接中属于表的横向连接的有()
A.inner join
B.left join
C.right join
D.union
6/20
数据的完整性表示:存储在数据库中的所有数据值均正确的状态,在SQL的CREATE TABLE 语句中实现完整性约束的有()
A.NOT NULL
B.PRIMARY KEY
C.DEFAULT
D.UNIQUE
7/20
SQL中有许多连接查询关键字,可以完成不同业务需求下的合并查询,下面哪些查询关键字能保留被连接两表的全部信息()
A.inner join
B.left join
C.full join
D.union all
8/20
若想分析分类变量之间的相关性,可以采用以下哪种方法( )
A.卡方检验
B.t 检验
C.计算皮尔逊相关系数
D.计算列联相关系数(coefficient of contingency)
9/20
数据的概括性度量分集中趋势、离散程度、偏态、峰度的度量,下列属于描述性统计中集中趋势度量的有( )。
A.均值
B.众数
C.四分位差
D.极差
10/20
事实表是用来记录业务行为结果的表,以下属于事实表的是
A.订单表
B.订单详情表
C.客户表
D.产品表
11/20
订单表与产品详情表可以通过产品ID构成多对一的连接关系,关于多对一连接关系下的透视计算描述正确的是
A.以多表为主表
B.以一表为主表
C.以多维为维度表
D.以一表为维度表
12/20
如何获取更多优质流量是电商行业中重要课题,下列哪些属于流量类指标
A.平均访问深度
B.访问次数
C.浏览量
D.客单价
13/20
电商行业为了获取流量往往需要投入成本到其他平台进行引流,下列哪些指标不属于引流时流量的计费方式?
A.CDA
B.CPM
C.CPC
D.CPN
14/20
横向分析可针对不同分析对象间的差异情况进行描述,下列哪些指标分析属于横向分析?
A.过去一年各类水杯的销量比对
B.6.18活动中注册用户和非注册用户的销售额比对
C.红富士苹果在过去一年每月的销量比对
D.本学期语文、英语、数学成绩的平均值比对
15/20
二八分析经常用来定位重要对象,以下场景中二八分析法不适用的场景是
A.发现重要客户群体
B.了解客户生命周期
C.了解付费流程转化效果
D.了解不同时间点下的趋势变化
16/20
在梳理抽象业务线索及需求到具体数据时常用到5W2H模型,那么通过5W2H模型整理数据的思维步骤包括哪些
A.将业务场景进行5W2H的概括总结
B.将5W2H总结内容梳理为业务维度
C.将业务维度梳理为数据表
D.将数据表展开到字段
17/20
在“人货场”的业务模块下,有可能成为描述“场”的情况的相关数据表是
A.订单表
B.订单详情表
C.客户详情表
D.区域表
图表决策树中的图表类别分别是
A.比较类
B.描述类
C.结构类
D.序列类
19/20
在分析人员向决策者提交业务分析报告汇报分析成果时,业务分析报告的文字信息应尽量避免
A.对图表信息重复描述
B.过多主观推测性结论
C.对图表信息进行总结
D.对论据进行片面解读
20/20
分析人员在使用分析结果撰写业务分析报告时应注意
A.条理清晰
B.结构完整
C.图表与文字相结合
D.论点明确、论据充分
1.ABCD
CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述。该模型将一个KDD工程分为6个不同的阶段:商业理解、数据理解、数据准备、建模、模型评估、模型部署(发布)
2.ABC
D选项PPT属于办公软件
3.ABCD
应用ETL功能可以导入所有选项中提及数据源中的数据到DW中作为表结构数据使用
4.BD
一个订单中可能存在多个产品,所以存放产品名称字段会破坏主键约束。同样的产品金额也不可以,订单金额是没问题的。所以选BD
5.ABC
union 属于表的纵向连接。
6.ABCD
为了保证数据的完整性,可以通过四种方式来实现,约束、规则、默认值、触发器。
题干说的是“在 CREATE TABLE 语句中实现完整性约束的有”,所以只能从约束性条件选择
完整性约束包括:主键约束(PRIMARY KEY)、外键约束(FOREIGN KEY)、 唯一约束(UNIQUE)、非空约束(NOT NULL)、检查约束(CHECK)、默认约束(DEFAULT)、自动增长约束(AUTO_INCREMENT)。
7.CD
full join 为横向连接,保留两张表的全部信息。union all 为纵向连接,且 不去除重复记录。
8.AD
BC 只能用来分析数值型变量,分类变量用不了这两种方法。
9.AB
CD 都是描述数据的离散程度
10.AB
A、B选项是关于消费行为及消费行为细节的记录数据表,属于事实表,C、D是观测消费行为的维度信息,书友维度表,所以正确答案是A、B两项
11.AD
多对一连接关系下,进行透视计算时应以多表为主表,多表出度量为事实表,而一表为附表,一表出维度是维度表,所以正确答案是A与D
12.ABC
D客单价是用来描述客单价情况的指标,不属于描述流量相关指标,其余ABC都是流量相关指标
13.AD
CPM与CPC是常见的平台间引流计费指标,所以A与D的选项不是流量统计计费指标,所以正确答案是A、D
14.ABD
纵向分析指时间周期下指标的变化规律,横向分析指指定维度下不同项的指标值的差异,故C为纵向分析,其他选项均为横向分析
15.BCD
BCD都是时间下状态变化情况的分析场景,只有A是判断重要对象的业务场景,所以正确答案是BCD
16.ABCD
ABCD都是5W2H模型的整理步骤
17.AB
“人货场”中的“场”指的是与交易行为相关的业务模块,所以AB是正确选项
18.ABCD
所有选项都属于图表决策树中的类别
19.ABD
报告中的文字应起到总结图表内容的作用,所以C是错误选项,其余三项都是正确选项
20.ABCD
所有选项都正确