总结整理不易,记得一键三连(关注哦,模拟二及其他练习题库正在整理中,在评论框发“模拟题”三个字给你们发word版方便自测)
考试题型:客观选择题(单选 80 题+多选 20 题+内容相关 20 题+ 案例分析 20 题)
1.EDIT数字化模型是企业在实现数字化工作的落地模板,以下关于数据分析EDIT模型描述错误的是:
• A.E指的是Exploration、探索
• B.D指的是Data、数据
• C.I指的是Instruction、指导
• D.T指的是Tool,工具
EDIT中的D指的是诊断(Diagnosis)的意思,所以选B。
2.数据分析由许多关键的阶段性步骤构成,以下不属于数据分析步骤的是
• A.业务理解
• B.数据获取
• C.数据处理
• D.制定决策方案
指定决策方案是数据分析结果的应用环节,不属于数据分析步骤,所以选D。
3.数据安全是从事数据分析工作人员必须要严格保障的事项,以下对于保护数据信息安全不利的错误做法是
• A.将机密数据U盘随身携带
• B.对机密数据载体进行加密保存
• C.不在咖啡厅等公共场所使用机密数据电脑办公
• D.不使用能够连入外网的电脑处理企业机密数据
机密数据U盘随身携带可能出现遗失风险,对机密数据应更加谨慎处理,确保万无一失,所以选A。
4.电子表格工具是表格结构数据的载体,以下属于表格结构数据处理工具的是
• A.Numbers
• B.Power BI
• C.MySQL
• D.Tableau
Numbers是苹果公司的电子表格工具,其余三项都是表结构分析工具,答案是A。
5.表格结构数据是应用与电子表格工具上的数据,作为表格结构数据数据源描述错误的是
• A.主要来自数据库
• B.全部来自数据库
• C.部分来自数据文件
• D.部分来自数据仓库
数据库只是数据的主要来源之一而不是全部来源,所以B是错误的。
6.在电子表格工具中可以使用公式引用数据,下面哪个引用公式写法是错误的()?
• A.A:A
• B.B1:C17
• C.1:19
• D.A4:19
从单元格地址到单元格地址,不能从单元格地址到行号,所以D是错误的。
7.电子表格工具中存在大量处理计算表格结构数据使用的函数,以下属于电子表格工具中文本函数的是
• A.date
• B.vlookup
• C.left
• D.count
left是从左侧取连续字符串的函数,是文本函数,所以答案是C。
8.表结构是常用的数据组织结构,下面不属于表结构数据的引用参照对象的是()
• A.字段
• B.记录
• C.单元格值
• D.数据表
表结构数据中不能引用单元格值,C是错误的。
9.主键是表结构数据中重要概念之一,针对主键描述错误的是
• A.一个表只能有一个主键
• B.主键中不能有null值
• C.主键只能是一个字段
• D.主键中不能有重复值
由多个字段构成的主键称为多字段联合主键,所以C是错误描述。
10.熟悉表结构数据特征是使用表结构数据的前提,以下不属于表结构数据特征的描述是
• A.表是由不同字段构成的
• B.表结构的第一行称为字段名
• C.表的第一行称为标题行
• D.不同字段的行数可以不同
表的数据结构是方形的,要求不同字段记录行数相同,所以答案是D。
11.表结构数据分析工具不自己产生数据而是通过获取其他数据源数据进行分析,表结构数据分析工具获取其他数据源的方式是
• A.应用
• B.引用
• C.复制
• D.汇总
表结构数据分析工具通过ETL功能引用数据源数据,所以答案是B。
12.横向合并多表信息完善数据源内容是利用表结构数据的重要方法之一,在横向合并两个数据表时的对应关系决定合并结果的什么
• A.主附关系
• B.合并结果行数
• C.合并结果数据范围
• D.合并结果数据类型
表的合并行数是对应项乘积的结果,所以B是正确选项。
13.在整合多表数据源进行横向合并操作时两表通过__进行连接
• A.公共字段
• B.主键
• C.维度字段
• D.度量字段
主键、维度字段以及度量字段与两表横向合并操作无关,两表通过公共字段进行连接,正确答案是A。
14.关系型数据库在系统搭建以及数据分析过程中都发挥着重要作用,对于关系型数据库功能的核心定位应属于
• A.OLTP
• B.OLAP
• C.DW
• D.Cube
数据库主要功能是事务处理用的,所以定位是OLTP,联机事务处理,所以答案是A。
15.数据透视分析是业务描述性分析中的重要方法之一,关于透视分析中维度概念描述错误的是
• A.业务观测角度
• B.多为文本型字段
• C.维度筛选度量
• D.度量筛选维度
维度筛选度量而度量被维度筛选,所以描述错误的是D。
16.对student1和student2两张表进行inner join连接后,形成的新表中( )
• A.一定包含student1中的所有行,不一定包含student2中的所有行
• B.不一定包含student1中的所有行,一定包含student2中的所有行
• C.一定包含student1中的所有行,一定包含student2中的所有行
• D.不一定包含student1中的所有行,不一定包含student2中的所有行
Inner Join只匹配两表中匹配项,所以D是正确选项,A是左连接,B是右连接,C是全连接的描述。
17.在关系型数据库中,最小的存储单位是
• A.数据库
• B.表
• C.字段
• D.记录
数据库存储层级自上而下分别是数据库、数据表、字段,字段是最小存储单位,所以选C。
18.分析师小A想要在数据表中查询名称里包含“新款”的产品。那么在进行查询时,可以选择以下哪种方式用来进行模糊匹配( )
• A.like
• B.<>
• C.distinct
• D.between
可以通过使用like‘%字符串%’的形式来进行模糊匹配,寻找包含字符串取值的所有记录。
19.向数据库的表中添加数据时必须小心谨慎,使用关系型数据库向数据表中添加数据时应注意()
• A.字段的个数和添加的数据取值个数可以不一致
• B.字段的顺序和添加的数据取值的顺序可以不一致
• C.字段的数据类型和添加的数据取值的数据类型可以不一致
• D.以上都不对
字段和添加数据的字段个数,数据类型,字段顺序都要一致才能正确添加,所以选D。
20.在SQL命令中关于删除命令DELTE的用法中,DELETE FROM后跟
• A.表名
• B.字段名
• C.记录行号
• D.数据库名称
delete from+表名,所以选A。
1.在SQL语言中对查询结果排序可以使用ORDER BY语句,在ORDER BY子句中如果指定了多个字段,则()
• A.只按第一个字段排序
• B.只按最后一个字段排序
• C.按从左至右优先依次排序,前一个字段取值相同时,再按照后一个字段排序
• D.无法进行排序
order by可以按照从左至右顺序多层级排序,所以答案是C。
2.某数据表中包含name字段,现要查找name字段中包含"a"的姓名,下面哪个选项获取的结果最准确()
• A.name LIKE ’%a%’
• B.name LIKE ’a%’
• C.name LIKE ’%a’
• D.name LIKE ’_a%’
A. ’%’可以匹配0个或多个字符,’_’可以匹配一个字符。因此 D选项不如A选项匹配的范围广,比如“huater” 这样的名字 通过’%a%‘可以匹配到,但是用’_a%'是匹配不到的。
3.别名是SQL中常用的内容,通过别名可以区别不同的表、可以让查询结果可读性增强。在SQL语句中,别名不能出现在哪个⼦句中呢()?
• A.SELECT
• B.WHERE
• C.FROM
• D.JOIN
B。在SQL中可以设置表别名和列别名,SQL语句的执⾏顺序是FROM–>–>ON–>JOIN–>WHERE–>GROUP BY-- >HAVING–>SELECT–>ORDER BY,别名是在WHERE⼦句后计算的,所以WHERE⼦句中不能⽤列别名, FROM和JOIN⼦句中可以⽤表别名。
4.使用SQL合并数据简单方便,以下关于SQL中UNION关键字的描述,不正确的是()?
• A.UNION合并数据集的字段个数必须相同
• B.UNION合并数据集的字段数据类型必须相同
• C.UNION合并数据集的字段顺序必须相同
• D.UNION合并后的数据集的行数是合并前的总行数
D。UNION合并数据集后去重,UNION ALL不去重,所以UNION去除重复值后的行数小于合并前的数据集的总行数。
5.子查询是SQL语句中常用语法,合理的使用子查询可以让代码更简洁。以下关于子查询,说法不正确的是()
• A.表子查询必须添加表别名
• B.引用表子查询中的计算字段,必须添加列别名
• C.所有的连接查询都可以替换为子查询
• D.所有的子查询都可以替换为连接查询
D。当WHERE子句的查询条件是聚合函数时,子查询不能替换为连接查询。
6.SQL 中ALL关键字可以实现逻辑运算,它能将单个值与子查询返回的单列值集进行比较 ,下面关于ALL的含义描述正确的是()
• A.满足所有条件
• B.满足任意一个条件
• C.一个都不满足
• D.满足一个条件
A。IN或NOT IN表示是否在其中,等于其中任意一个条件即可,ALL表示每一个,全部条件都满足。
7.SQL提供了丰富的运算符来进行各种运算,我们需要熟悉这些运算符的用法,现要找age字段中大于60岁小于80岁的用户需使用哪个运算符( )
• A.加号(+)
• B.等号(=)
• C.且(AND)
• D.或(OR)
C。A. 加号进行数值型数据的加法运算 B. 等号用来做判断,判断值是否相等 C. AND 求两个条件的交集 D.OR求两个条件的并集 因此此题应该选C。
8.SQL中提供了丰富的数值函数用来处理数值数据,以下哪个 SQL 函数可以完成对数字的四舍五入()
• A.FLOOR
• B.CEILING
• C.ROUND
• D.TRUNCATE
C。floor(x)表示返回小于 x 的最大整数值(去掉小数取整),ceiling(x)表示返 回大于 x 的最小整数值(进一取整),round(x,y)表示返回参数 x 的四舍五入的 有 y 位小数的值(四舍五入),truncate(x,y)表示返回数字 x 截短为 y 位小数的结果。
9.检验单总体均值的过程中,如果是小样本,但总体标准差已知,检验统计量应该选择()。
A。 在样本量较小的情况下,如果总体标准差已知,样本统计量服从正态分布,这时可以采用Z统计量。
10.在假设检验中,有时不仅需要检验正态总体的均值、比例,而且需要检验正态总体的方差。检验单总体方差的过程中,检验统计量服从( )。
• A.标准正态分布
• B.正态分布
• C.卡方分布
• D.t 分布
C。Z统计量和t统计量常常用于均值和比例的检验,卡方统计量则用于方差的检验。
11.某专业毕业的研究生年薪的标准差大约为2000 美元,现在想要估计这个专 业毕业研究生年薪95%的置信区间,并要求误差为100 美元,应抽取多大的样本 量?( ) Zα/2=1.96
• A.182
• B.98
• C.1537
• D.634
C
计算方法如下:
方括号[ ]表示取整函数。计算样本量的时候不是四舍五入,而是向上进位。
12.在进行缺失值填补时,若数据呈明显的偏态分布,则可考虑采用下列哪种方法?( )
• A.将存在缺失值的样本删除
• B.将存在缺失值的变量删除
• C.中位数填补
• D.均值填补
C.中位数不受具体数据分布的影响
13.卡方检验是用途非常广的一种假设检验方法,卡方检验中将任意两行互换则卡方值( )
• A.变大
• B.变小
• C.不变
• D.不确定
C.卡方检验的结果与分类变量的顺序无关,将任意两行进行互换,卡方值不变。
14.下面的数据是一家企业科研投入与专利产出的相关性描述,根据表格信息,下列选项中正确的是( )。
表中的显著性表示相关系数显著性检验中的P值。
• A.专利产出与科研投入高度线性相关
• B.专利产出与科研投入相关性不显著
• C.专利产出与科研投入存在线性相关性,但是相关性较弱
• D.加大科研投入就能够提高专利的产出
B.相关性是只有0.03,且其P值很大,所以是不显著的。
15.在分析两变量的关系时常常会使用散点图,现有变量X与Y,如下图所示横轴为X,纵轴为Y,则关于下图描述错误的是( )
• A.X 和Y 之间很大可能是非线性关系
• B.这些散点中存在异常点
• C.X 和Y 之间是正相关的
• D.分析两者之间的关系可用逻辑回归模型
D.都是数值变量,不能用逻辑回归。
16.某数据分析员希望展示某网站10 年来月度访问量数据,采用以下哪个图形比较合适?
• A.散点图
• B.饼图
• C.盒须图
• D.折线图
D.折线图更容易看出时间上的趋势.
17.以下字段中可作为度量使用的是
• A.客户名称
• B.产品类别
• C.省份
• D.购买数量
D.暂无答案解析
18.在多个业务表连接构成的多维模型中,如果需要进行跨表筛选应满足___的逻辑
• A.维度与主键是父子级关系
• B.维度与公共字段是父子级关系
• C.维度与度量是父子级关系
• D.度量与主键是父子级关系
B.跨表筛选应满足B的条件才能保证按照维度下汇总计算的度量的方式进行计算,所以选B.
19.在多个数据表连接构成的多维模型下,星型模式是
• A.一个维度表连接多个事实表
• B.多个维度表连接多个事实表
• C.一个事实表连接多个维度表
• D.多个事实表连接多个维度表
C.C是星型模式的正确定义
20.针对多维数据模型中星座模式表述正确的是
• A.一个维度表连接多个事实表
• B.多个维度表连接多个事实表
• C.一个事实表连接多个维度表
• D.多个事实表共用某些维度表
D. D是星座模式的正确定义
1.四象限分析法帮助我们理解分析项目的特征,应用四象限分析法对客户贡献价值进行描述时可以使用的横纵轴是
• A.到店时间、消费金额
• B.消费金额、购买数量
• C.消费金额、消费频次
• D.消费渠道、到店时间
C. 横纵坐标应能汇总成为描述对象的目的,目的是贡献价值,可以拆分成金额与频次,所以选C.
2.某电商平台进行分析时,不能直接描述商品销售情况好坏的指标是
• A.库存周转率
• B.库销比
• C.动销金额
• D.动销天数
D是正确描述,动销天数用来辅助描述销售行为的风险程度而不是好坏程度.
3.通过数据分析为某电商平台定位核心用户群体可以使用哪种分析模型
• A.5W2H
• B.帕累托分析
• C.漏斗模型
• D.AB测试
B.帕累托分析用来定位重点对象
4.不适合用销量作为度量使用的是
• A.汽车行业市场分析
• B.笔记本行业市场分析
• C.超市库存产品分析
• D.APP下载量分析
D.暂无答案解析
5.SKU是商品的某种单位,以下属于SKU的是
• A.手机
• B.某品牌手机
• C.某品牌某型号手机
• D.某品牌某型号5G亮银8G*128G手机
D.SKU是商品的最小单位,应精确到最细的具体产品上.
6.电商收入由黄金公式的三个指标构成,某电商企业急需解决现金流不足问题,不考虑融资的情况下,应针对黄金公式中哪个指标进行突破
• A.流量
• B.转化率
• C.访问次数
• D.访问量
• D.访问量
B.流量需要投入大量成本,企业资金出现问题时,应优先解决黄金公式中另两项指标.
7.指标用来描述业务行为结果的好坏程度,但是对于指标值的观测应在一定条件下进行,以下选项中不属于观测指标值好坏程度的前提条件的是
• A.相同时间内
• B.相同条件下
• C.相同维度下
• D.相同观测者
D.指标值可以由不同观测者观测.
8.业务图形决策树将业务描述性分析中使用的图表分为了四个不同类别,包含在业务图形决策树中的图表类别是
• A.仪表类
• B.描述类
• C.预测类
• D.统计类
B是正确描述、四类图表分别是构成类、对比类、序列类及描述类.
9.某服装企业有A、B、C三类品牌产品,想要显示每一类产品的销售额分别占销售总额的比例关系,下列哪种图表比较合适
• A.柱形图
• B.箱型图
• C.散点图
• D.饼图
D.此题体现部分与整体的占比关系,使用饼图最合适.
10.用可视化图表展示波士顿矩阵中各类产品特征时应使用以下哪种基础图表
• A.桑吉图
• B.箱形图
• C.散点图
• D.柱形图
C.用散点图生成波士顿矩阵效果
11.描述某电视厂商不同产品销售额与总销售额间的占比关系时使用了饼图,其中饼图的数据标签使用恰当的是
• A.销售额百分比
• B.销售额值
• C.销量值
• D.记录行数值
A.饼图强调占比,应使用百分比形式展现
12.数据分析人员使用业务分析报告汇报分析成果,对于业务分析报告的注意事项,以下不正确的是
• A.条理清晰
• B.论点明确
• C.图、表、文字可以不相关
• D.有论必有数,有数必好懂
C,分析报告中应做到图表文字相结合
13.数据分析人员使用业务分析报告汇报分析成果,不同种类的分析报告着重点不同,以下不属于渠道合作报告的重点的是()
• A.总结合作硕果
• B.多从内部找原因
• C.适当提出加深合作的需求
• D.展现前景,树立信心
B,渠道合作报告应聚焦于合作情况,所以B是错误的
14.数据分析人员使用业务分析报告汇报分析成果,下列属于业务分析报告作用的是
• A.评估一段时期内业务的好坏情况
• B.发现合作机会
• C.检验业务的真实性
• D.以上都是
D是正确描述
15.在数据分析人员撰写分析报告时避不开进行适度主观推测判断,但是推测判断也要有充分依据,以下适合用于业务推测依据的信息来源是
• A.朋友提供
• B.网站留言
• C.新闻联播
• D.社会舆论
C,作为推测判断信息来源的渠道应权威,信息应准确无误
16.数据分析人员使用业务分析报告汇报分析成果,以下对数据可视化报表的叙述正确的是
• A.为企业提供决策支持
• B.数据资源无法被较好利用
• C.提高经营成本
• D.能够获取到的信息比较片面
A是正确描述
17.BI报表需要使用专业的BI分析工具制作完成,以下不属于BI分析工具的是
• A.SPSS
• B.Tableau
• C.Smart BI
• D.Power BI
A不是BI分析工具
18.分析人员通过BI报表对某家电厂商过去5年间、四种不同产品的销售额情况进行可视化展现,此时的可视化图表中包含___种不同信息
• A.40
• B.20
• C.240
• D.无法计算
B 5年*4种产品,共20种不同信息
19.BI报表基于表结构数据进行制作,在BI报表中使用的表结构数据主要来自
• A.ETL
• B.OLTP
• C.DB
• D.DW
D,BI报表使用DW汇总不同数据源数据作为自己的数据源使用
1.某电商的每笔交易信息逐行记录在订单表中,在订单表中能否使用average求客户购买金额的总平均值
• A.可以
• B.不行
• C.无多次购物行为的客户存在时可以
• D.有多次购物行为的客户存在时可以
C 一个客户只有一次购买行为时,客户平均=订单平均,可以直接用average计算平均值,答案是C
2.在记录某电商交易行为内容的订单表中求客户购买金额总平均值应使用的公式是(客户有多次购买行为)
• A.SUM/COUNT
• B.直接用Average
• C.SUM/DISTINCTCOUNT
• D.SUM/AVERAGE
C 客户有多次购买行为时,客户数小于订单数,不能直接用average计算客户平均值,应用总金额/不重复客户数,所以选C
3.同环比是业务描述性分析中针对时间维度使用的重要指标,以下选项中不适用于做同环比的是
• A.日销售额
• B.年产量
• C.季度净利润率
• D.月毛利率
A选项指标汇总周期太短,不适用于同环比,同环比指标应满足长周期,高汇总的特点,所以选A
4.同环比是业务描述性分析中针对时间维度使用的重要指标,以下关于同环比描述正确的是
• A.任何指标都可以做同环比分析
• B.长周期指标适合做同环比分析
• C.短周期指标适合做同环比分析
• D.连续变化的指标适合做同环比分析
B. B是同环比特征
5.业务描述性分析方法是一级考试的主要内容,关于业务描述性分析的主要意义以下选项中描述错误的是
• A.精细化观测业务细节
• B.及时发现业务问题
• C.预测业务未来趋势
• D.全面了解业务情况
C. C是预测性分析不是描述性分析,是错误答案
6.数据驱动型业务模式为企业带来更大竞争力,以下关于数据驱动型业务模式描述正确的是
• A.数据决定业务策略
• B.数据+经验决定业务策略
• C.数据为业务决策唯一参照标准
• D.当经验与数据结论相违时,应以数据结论为主
数据驱动型业务模式也需要经验指导,所以B是正确答案
7.表格结构数据与表结构数据是进行分析时主要使用的结构化数据,在表结构数据下得到指标值结果描述正确的是
• A.对表结构业务数据进行汇总计算
• B.前端系统导出
• C.IT人员提供
• D.前边都不对
将表结构数据进行字段整体的汇总计算可以求得指标结果,所以选A
8.某产品在一年内卖出300件,退回50件,请问销量是多少
• A.300件
• B.250件
• C.350件
• D.无法统计
D 问题未明确指出查看的维度,指标需与维度结合才能统计出结果
9.某汽车销售情况统计网站中得知某款汽车2021年1月销售500辆,2月比1月环比增长20%,那么请计算该款汽车2月份销售多少量
• A.600辆
• B.400辆
• C.1100辆
• D.550辆
A 根据环比计算公式:(当期值-上期值)100%/上期值,带入公式(600-500)/500100%=20%,得出2月销量为600
10.某电商9月份GMV为1000万元,退废比为3%,进货成本500万元,其余成本200万元,请计算毛利多少钱?
• A.500万元
• B.470万元
• C.300万元
• D.270万元
D GMV指的是包含退款额的销售额,实际销售金额为(1-3%)*1000万=970万,去除进货成本和其他成本共700万,故毛利为270万
11.描述电商流量质量好坏程度时可以使用平均访问深度,平均访问深度的计算公式是
• A.浏览量/访问次数
• B.访问次数/浏览量
• C.浏览量/访客数
• D.访客数/访问次数
A是正确计算公式
12.在业务描述性分析方法中,观测相同维度下不同项间的差异情况的指标分析方法是
• A.纵向分析
• B.预警分析
• C.横向分析
• D.占比分析
横向对比的C是正确答案
13.在业务描述性分析方法中,以下选项中不属于时间维度下观测指标的是
• A.YTD
• B.QTD
• C.MTD
• D.CPC
D是错误答案、前三个选项都是重要时间维度下汇总计算指标
14.在电商运营业务中描述客户质量好坏程度时使用的指标是
• A.登录用户数
• B.注册用户数
• C.留存率
• D.浏览用户数
C是正确答案,其余选项是客户属性的统计结果与客户质量好坏无关
15.指标分析是业务描述性分析中观测业务行为结果的重要方法,以下选项中不属于基本指标的是
• A.求和类指标
• B.比较类指标
• C.计数类指标
• D.业务场景相关指标
D是场景相关的特殊指标,不属于基本指标
16.“进销存”业务模块是业务分析中需要重点关注的业务模块之一,其中在“存”的业务模块下关于期初库存额与期末库存额描述正确的是
• A.期末库存额不能大于期初库存额
• B.期末库存额只能小于期初库存额
• C.期末库存额只能大于期初库存额
• D.期末库存额可以大于期初库存额
当进货额>出库金额时期末库存额>期初库存额,所以D是正确的
17.理解业务分析模型能够更好的把握业务全局,以下不属于分析模型中分类模型的是
• A.RFM模型
• B.客户价值模型
• C.波士顿矩阵
• D.销售漏斗模型
漏斗模型没有进行项目件的分类,所以选D
18.漏斗模型帮助我们理解各不同业务阶段特征,使用漏斗模型的本质意义是
• A.风险管控
• B.分层定位
• C.绩效管理
• D.效果评估
A是正确描述
19.AARRR模型是电商运营业务中使用的重要业务模型,在模型中最后的R指的是
• A.用户获取
• B.用户留存
• C.用户激活
• D.推荐传播
D是正确描述
20.“黄金公式”清晰地描述出电商企业收入的构成,在公式中最重要的指标是
• A.转化率
• B.购买频次
• C.流量
• D.浏览量
C是正确描述,电商以流量为王,有了流量才能考虑剩下的两个指标,转化率与客单价
1.• A.两表的单号
• B.两表的客户ID
• C.单金额与产品金额
• D.没有公共字段
A. 根据两表的业务意义、字段匹配特征以及字段对应关系综合考虑,应选择订单ID作为连接两表的公共字段使用
2.两表连接后使用左连接进行查询后的总行数是____
• A.5
• B 6
• C.4
• D.8
C 使用订单ID连接两表后,左表订单表为主表时,a01项一行,a02项一行,a03项两行,共4行连接结果
3.建立如下数据库表: CREATE TABLE department( departid int not null primary key, deptname varchar(20) not null ); CREATE TABLE employee( employeeid int not null, deptid int not null, ename varchar(20) not null,job varchar(10),sal decimal(10,2)); 要想保证employee表中每一个雇员是唯一的,且只能属于在department表中已经存在的部门,最有效的做法是
• A.把employeeid和deptid设为联合主键
• B.把employeeid设为主键,同时在deptid列上创建一个外键约束
• C.把employeeid设为主键,同时在deptid列上创建一个唯一约束
• D.在deptid列上创建一个唯一约束,同时在deptid列上创建一个外键约束
B 要想保证employee表中每一个雇员是唯一的,把employeeid设为主键或唯一约束。每个雇员只能属于在department表中已经存在的部门,在deptid列上创建一个外键约束。
4.建立如下数据库表: CREATE TABLE department( departid int not null primary key, deptname varchar(20) not null ); CREATE TABLE employee( employeeid int not null, deptid int not null, ename varchar(20) not null,job varchar(10),sal decimal(10,2)); 以下SQL语句中,错误的是
• A.SELECT AVG(sal) FROM employee;
• B.SELECT deptid,AVG(sal) FROM employee GROUP BY deptid;
• C.SELECT deptid,job,AVG(sal) FROM employee GROUP BY deptid,job;
• D.SELECT deptid,AVG(sal) FROM employee GROUP BY deptid HAVING job=’clerk’
D HAVING 子句中的筛选字段必须是可以出现在分组结果中的字段。
5.student表中有4个字段:StudentID(学生编号),Class(班级),CourseID(课程编号),Score(分数) student 表中记录了同学每一次考试的成绩。那么以下哪组 sql 代码取数的结果中,StudentID字段取值不会出现重复
• A.select StudentID,max(score) from student group by StudentID;
• B.select distinct StudentID,Score from student;
• C.select StudentID from student;
• D.select StudentID from student where studentID is not null;
B选项和C选项where子句中不能使用聚合函数,D选项语法顺序不正确,所以选A
6.student表中有4个字段:StudentID(学生编号),Class(班级),CourseID(课程编号),Score(分数) 以下关于DISTINCT的⽤法,不正确的是
• A.SELECT DISTINCT StudentID FROM student;
• B.SELECT DISTINCT StudentID,Class FROM student;
• C.SELECT StudentID,DISTINCT Class FROM student;
• D.SELECT COUNT(DISTINCT StudentID) FROM student;
C DISTINCT关键字可以对一个或多个字段去重,也可以结合COUNT函数进行去重计数,但是DISTINCT关键字必须位于第一个字段的前面
7.甲乙两班的数学成绩平均分分别为:75,75.27,标准差分别为:7,11.74,离散系数分别为:0.093和0.156 根据题目对数据代表性判断合理的是?
• A.乙班的平均成绩有较大的代表性
• B.甲班的平均成绩有较大的代表性
• C.两班的平均成绩有相同代表性
• D.无法判断
B 离散趋势的大小可以用来描述集中趋势度量指标的代表性,例如方差越大就说明均值的代表性越弱。此题需要判断平均成绩的代表性,那么找取离散趋势小的班即可。为了过滤掉数据量纲的影响,我们取离散系数最小的甲班
8.甲乙两班的数学成绩平均分分别为:75,75.27,标准差分别为:7,11.74,离散系数分别为:0.093和0.156 对数据分布情况判断合理的是?
• A.甲班的成绩分布较分散
• B.乙班的成绩分布较集中
• C.甲班的成绩分布较集中
• D.甲乙班的成绩分布无法判断
C 甲班的离散系数更小,说明数据的离散程度小,说明成绩分布较集中
9.下图是某公司销售业务中使用的多表连接E-R图,参照下图回答问题:
上述连接关系是
• A.星型连接
• B.交叉连接
• C.星座连接
• D.雪花连接
销售业绩表为事实表,其余表是维度表,一个事实表与多个维度表连接的连接模式是星型连接模式,所以正确答案是A
10.同上图
上述连接的对应关系描述正确的是
• A.销售业绩表是多表
• B.客户信息表是多表
• C.城市信息表是多表
• D.产品信息表是多表
事实表是多表在汇总过程中贡献度量字段,其余维度表是一表,所以正确答案是A
11.假设某店1.1号的消费记录如下表 请问这天消费的会员数是多少?
• A.2
• B.3
• C.4
• D.5
B 能够统计会员编号的记录是三行,所以有三名会员消费
12.请问这天一共有多少人消费?
• A.2
• B.3
• C.4
• D.5
这天共有五条消费记录,三名不重复会员有会员编号,还有两个非会员消费记录,所以最少消费人数在四人以上,复合条件的只有D选项
13.下图是销售管理中使用的维度表与事实表的E-R图,请看图回答以下问题:
下表中连接错误的地方是
• A.1
• B.2
• C.3
• D.没有错误
C 客户表与商机记录表是维度表与事实表的关系,应使用一对多的连接关系,所以错误处是C的编号3
14.同上图 适用于对销售阶段变化情况进行管理的模型是
• A.帕累托模型
• B.AARRR模型
• C.漏斗模型
• D.波士顿矩阵模型
漏斗模型适用于动态状态监控与分析,所以选C
15.在电商企业中,一般不划归在流量分析任务中的行为是
• A.了解流量渠道特征
• B.了解引流行为效果
• C.了解流量人群特征
• D.了解流量付费情况
对流量付费情况的分析应归属于转化阶段的分析任务,所以是错误的,所以选D
16.在电商企业中,对流量付费可能性大小进行描述可了解获取流量的质量高低,适用于对付费可能性大小进行描述的指标是
• A.UV
• B.跳失率
• C.新访客数
• D.浏览量
跳失率越高,流量付费可能性越低,流量质量越差,所以正确答案是B
17.下表是2018年8月汽车市场销量树状结构图,百分比为销量的同比增长率,根据图表回答问题:
影响总销量增长的主要车类是
• A.轿车
• B.MPV
• C.SUV
• D.以上都不对
轿车是第二层三种不同车类中销量最多的车类,轿车的增长变化对总销量产生的影响高于SUV及MPV,所以选A
18.对汽车市场销量影响最大的车系是
• A.德系
• B.日系
• C.美系
• D.自主
A 在第三层各类车系的销量变化数据中可以了解到,德系车销量占比最多,结合增长率综合观测,德系车对市场销量变化的影响最大
19.下表是某班各学员的成绩信息,参照下表回答问题 用图表描述学员成绩水平,
合适的图表应为
• A.折线与柱形图的组合图
• B.折线图
• C.饼图
• D.树状图
折线可作为基准线评估柱形代表的实际成绩的好坏程度,所以选A
20.依据上表数据描述学员成绩好坏水平的对比方法称为
• A.基准比
• B.标准比
• C.均比
• D.目标比
A 及格线与优秀线是基准值,实际值与基准值对比是A的基准比
21.下表销售阶段自上而下按顺序排列,根据下表回答问题
用上表中数据做漏斗图会出现的问题是
• A.流速慢
• B.体量小
• C.体型差
• D.以上都不是
从上表中判断意向的金额及金额占比高于接触阶段,高阶段比低阶段数值大会造成漏斗图体型变形的情况,所以选C
22.上表表销售阶段自上而下按顺序排列,根据表回答问题
如果销售周期是3个月,当前数据位于第11周,销售目标为4000,那么以下描述正确的是
• A.已经完成销售目标
• B.完成销售目标的可能性高
• C.完成销售目标的可能性低
• D.几乎不可能完成销售目标
当前真正成交的商机只有742,远低于4000的目标,大多数商机在第11周都处在低阶段,时间上很难在剩下的两周内完成,所以选D
1.表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题,salary是每次发帖论坛奖励的分数。 表示更新t1表中字段内容的语句是
• A.create table t1(id int,name char(30),salary int);
• B.drop table t1;
• C.create view v_t1 as select id,name from t1;
• D.update t1 set name=’lixiaoming’ where id=100;
D UPDATE…SET…语句用于修改表中字段内容。
2.表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题,salary是每次发帖论坛奖励的分数。 查看t1表中id等于10的行
• A.select id from t1 id=10;
• B.select id from t1 where id=10;
• C.select id from t1 id 10;
• D.select id from t1 where id 10;
B 查看特定的行时,需要使用WHERE+条件子句的形式对数据输出结构进行约束。
3.表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题,salary是每次发帖论坛奖励的分数。 显示每个会员发了几个帖子的语句是
• A.select id ,count(name)from t1 group by id;
• B.select id ,count(name)from t1 group by id having count(name)>5;
• C.select id ,count(name)from t1 group by id having count(name)>5 order by count(name);
• D.select id ,count(name)from t1 where id > 100 group by id;
A id是发帖人的编号,是唯一的,我们想知道每个会员的发帖数,group by id----按照id分组,就是必然选择。 count(name)是对按照id分组之后的结果计算name的个数。
4.表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题,salary是每次发帖论坛奖励的分数。 显示发帖数超过5个的语句是
• A.select id ,count(name)from t1 group by id;
• B.select id ,count(name)from t1 group by id having count(name)>5;
• C.select id ,count(name)from t1 group by id having count(name)>5 order by count(name);
• D.select id ,count(name)from t1 where id > 100 group by id;
B 每个分组计算发帖个数(count(name))之后,我们希望输出结果大于5(count(name)>5)。 这里还是比较好理解的,难度在于对having的理解。我们平时用到条件子句时,它前面的关键词都是where,而这里用的是having。在使用GROUP BY对数据进行分组时需要使用HAVING作为限制条件的关键词。
5.某部门员工的每天办公时长X(以小时计时)服从正态分布,现测得6名员工的某天办公时长如下:9、10、6、7、8.3、7.7。 计算该样本的均值
• A.6
• B.8
• C.7
• D.9
B 题目给的不是分组数据,因此直接计算简单算术平均数即可。即(9+10+6+7+8.3+7.7)/6
6.某部门员工的每天办公时长X(以小时计时)服从正态分布,现测得6名员工的某天办公时长如下:9、10、6、7、8.3、7.7。 计算该样本统计推断的标准差(保留2位小数)
• A.1.43
• B.1.42
• C.1.3
• D.1.30
A 题目要求计算样本标准差,因此需要减去一个自由度。即分母取6-1=5
7.某部门员工的每天办公时长X(以小时计时)服从正态分布,现测得6名员工的某天办公时长如下:9、10、6、7、8.3、7.7。 计算变异系数(或称离散系数)(保留2位小数)
• A.0.21
• B.0.2
• C.0.18
• D.0.3
C 变异系数计算公式为标准差除以均值
8.某部门员工的每天办公时长X(以小时计时)服从正态分布,现测得6名员工的某天办公时长如下:9、10、6、7、8.3、7.7。 计算该样本统计推断的方差
• A.1.43
• B.2.036
• C.1.69
• D.1.72
B 题目要求计算样本方差,因此需要减去一个自由度。即分母取6-1=5
9.下图描述了某公司销售业务相关各表的连接关系,请观察下图回答以下问题:
产品表与区域表之前的筛选关系描述正确的是
• A.产品可以筛选区域
• B.区域可以筛选产品
• C.两者之间不存在筛选关系
• D.无法确认筛选关系
C 因为商机记录不能筛选产品或者区域,所以区域与产品间不能筛选
10.观察上图对应关系,结合维度表与事实表的业务关系判断上图连接关系有误的是
• A.产品与商机记录间的连接
• B.区域与商机记录间的连接
• C.客户与商机记录间的连接
• D.所有连接关系正确
C是一对一的连接关系,客户是维度表而商机记录是事实表,所以应该是一对多的关系,所以选C
11.上图属于事实表的是
• A.产品表
• B.客户表
• C.区域表
• D.商机记录表
商机记录表记录商机的执行行为,属于事实表,而其他都是维度表,所以选D
12.根据上图各表的连接状态判断上图属于___连接模式
• A.星型模式
• B.雪花模式
• C.星座模式
• D.交叉连接
一个事实表连接多个维度表是星型模式,所以选A
13.商品在电商平台上销售,共投放5个品类,共20种商品,每屏可放5个商品位,这5天的销售记录如下。假设动销率=指定商品层级下有销售行为数/该层级下总数100%,请问品类层级的动销率是多少?
• A.0.2
• B.0.4
• C.0.8
• D.0.95
==C 总品类数为5,发生销售行为的品类数为4,故品类层级的动销率为4/5100%=80%==
14.根据题目描述计算商品层级的动销率是多少?
• A.0.2
• B.0.4
• C.0.8
• D.0.95
B 总商品数为20,发生销售行为的商品数为8,故商品层级的动销率为8/20*100%=40%
15.假设屏效=屏内所有商品的销售数量/所有屏的总销量100%,请问第一屏的屏效是多少?
• A.0.2105
• B.0.31578947368421
• C.0.26315789473684
• D.0.22052631578947
==A 第一屏的销售数量为4,所有屏的总销量为19,故第一屏的屏效为4/19100%=21.05%==
16.根据题目数据判断哪一屏屏效最高?
• A.第一屏
• B.第二屏
• C.第三屏
• D.第四屏
B 第二屏屏效为6/19,第三屏屏效为4/19,第四屏屏效为4/19,故屏效最高的为第二屏
17.下图是某电商客户价值模型与不同用户类别人数占比饼图,观察下图回答问题
此电商当前面对资金短缺的情况,为维系经营需要想办法在短期内用最少成本投入获得收入增长,那么应想办法提高什么指标
• A.流量
• B.转化率
• C.客单价
• D.转化率及客单价
电商资金短缺,无法购买充足流量,所以应优先在资金投入少的转化率及客单价指标上采取对策,所以选D
18.价值模型中,一般认为营销实现价值提升难度最小的用户群体是
• A.大众会员
• B.保值会员
• C.进阶会员
• D.忠诚会员
价值模型中一般右上左下提升难度大,其余阶段随着贡献价值的升高提升难度会随之逐渐增大,所以选B
接前两题,如果要想办法针对一类人群进行有针对性的营销,应选择的人群是
• A.大众会员
• B.保值会员
• C.进阶会员
• D.忠诚会员
综合提升难度及右侧人数占比判断,难度小,人数占比大的人群投入资金少,产生价值高,所以选B
20以下不能用来对用户进行分类的是
• A.RFM模型
• B.波士顿矩阵
• C.帕累托模型
• D.以上都不能用来对用户进行分类
波士顿矩阵是商品矩阵,不能用来进行用户分类,所以选B
1.CRISP-DM模型是应用最广泛的KDD过程模型,下面属于CRISP-DM模型的阶段有()
• A.业务理解
• B.数据理解
• C.数据准备、建模、模型评估
• D.模型发布
ABCD。 CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述。该模型将一个KDD工程分为6个不同的阶段:商业理解、数据理解、数据准备、建模、模型评估、模型部署(发布)
2.表结构是数据分析中常用的数据结构,以下属于表结构分析工具的是
• A.DB2
• B.Power BI
• C.Excel
• D.PPT
ABC。 D选项PPT属于办公软件
3.收集多源数据是进行数据分析工作中的重要步骤之一,以下可以成为表结构数据数据源的选项有哪些
• A.CSV格式的数据文件
• B.数据库
• C.Excel文件
• D.网页数据
ABCD。应用ETL功能可以导入所有选项中提及数据源中的数据到DW中作为表结构数据使用
4.某电商订单表中的主键为订单号,根据业务常识判断不能存放于订单表中的字段是()
• A.客户ID
• B.产品名称
• C.付费时间
• D.产品金额
BD。一个订单中可能存在多个产品,所以存放产品名称字段会破坏主键约束。同样的产品金额也不可以,订单金额是没问题的。所以选BD
5.关系型数据库中表与表之间可以横向连接也可以纵向连接,以下连接中属于表的横向连接的有()
• A.inner join
• B.left join
• C.right join
• D.union
ABC。 union 属于表的纵向连接。
6.数据的完整性表示:存储在数据库中的所有数据值均正确的状态,在SQL的CREATE TABLE 语句中实现完整性约束的有()
• A.NOT NULL
• B.PRIMARY KEY
• C.DEFAULT
• D.UNIQUE
ABD。为了保证数据的完整性,可以通过四种方式来实现,约束、规则、默认值、触发器。 题干说的是“在 CREATE TABLE 语句中实现完整性约束的有”,所以只能从约束性条件选择 完整性约束包括:主键约束(PRIMARY KEY)、外键约束(FOREIGN KEY)、 唯一约束(UNIQUE)、非空约束(NOT NULL)、检查约束(CHECK)。 所以不选C
7.SQL中有许多连接查询关键字,可以完成不同业务需求下的合并查询,下面哪些查询关键字能保留被连接两表的全部信息()
• A.inner join
• B.left join
• C.full join
• D.union all
CD。 full join 为横向连接,保留两张表的全部信息。union all 为纵向连接,且 不去除重复记录。
8.若想分析分类变量之间的相关性,可以采用以下哪种方法( )
• A.卡方检验
• B.t 检验
• C.计算皮尔逊相关系数
• D.计算列联相关系数(coefficient of contingency)
AD。 BC 只能用来分析数值型变量,分类变量用不了这两种方法。
9.数据的概括性度量分集中趋势、离散程度、偏态、峰度的度量,下列属于描述性统计中集中趋势度量的有( )。
• A.均值
• B.众数
• C.四分位差
• D.极差
AB。 CD 都是描述数据的离散程度
10.事实表是用来记录业务行为结果的表,以下属于事实表的是
• A.订单表
• B.订单详情表
• C.客户表
• D.产品表
AB。AB选项是关于消费行为及消费行为细节的记录数据表,属于事实表,C、D是观测消费行为的维度信息,属于维度表,所以正确答案是A、B两项
11.订单表与产品详情表可以通过产品ID构成多对一的连接关系,关于多对一连接关系下的透视计算描述正确的是
• A.以多表为主表
• B.以一表为主表
• C.以多维为维度表
• D.以一表为维度表
AD. 多对一连接关系下,进行透视计算时应以多表为主表,多表出度量为事实表,而一表为附表,一表出维度是维度表,所以正确答案是A与D
12.如何获取更多优质流量是电商行业中重要课题,下列哪些属于流量类指标
• A.平均访问深度
• B.访问次数
• C.浏览量
• D.客单价
ABC D客单价是用来描述客单价情况的指标,不属于描述流量相关指标,其余ABC都是流量相关指标
13.电商行业为了获取流量往往需要投入成本到其他平台进行引流,下列哪些指标不属于引流时流量的计费方式?
• A.CDA
• B.CPM
• C.CPC
• D.CPN
AD. CPM与CPC是常见的平台间引流计费指标,所以A与D的选项不是流量统计计费指标,所以正确答案是A、D
14.横向分析可针对不同分析对象间的差异情况进行描述,下列哪些指标分析属于横向分析?
• A.过去一年各类水杯的销量比对
• B.6.18活动中注册用户和非注册用户的销售额比对
• C.红富士苹果在过去一年每月的销量比对
• D.本学期语文、英语、数学成绩的平均值比对
ABD. 纵向分析指时间周期下指标的变化规律,横向分析指指定维度下不同项的指标值的差异,故C为纵向分析,其他选项均为横向分析
15.二八分析经常用来定位重要对象,以下场景中二八分析法不适用的场景是
• A.发现重要客户群体
• B.了解客户生命周期
• C.了解付费流程转化效果
• D.了解不同时间点下的趋势变化
BCD. BCD都是时间下状态变化情况的分析场景,只有A是判断重要对象的业务场景.
16.在梳理抽象业务线索及需求到具体数据时常用到5W2H模型,那么通过5W2H模型整理数据的思维步骤包括哪些
• A.将业务场景进行5W2H的概括总结
• B.将5W2H总结内容梳理为业务维度
• C.将业务维度梳理为数据表
• D.将数据表展开到字段
ABCD都是5W2H模型的整理步骤
17.
在“人货场”的业务模块下,有可能成为描述“场”的情况的相关数据表是
• A.订单表
• B.订单详情表
• C.客户详情表
• D.区域表
AB.“人货场”中的“场”指的是与交易行为相关的业务模块,所以AB是正确选项
18.图表决策树中的图表类别分别是
• A.比较类
• B.描述类
• C.结构类
• D.序列类
ABCD所有选项都属于图表决策树中的类别
19.在分析人员向决策者提交业务分析报告汇报分析成果时,业务分析报告的文字信息应尽量避免
• A.对图表信息重复描述
• B.过多主观推测性结论
• C.对图表信息进行总结
• D.对论据进行片面解读
ABD 报告中的文字应起到总结图表内容的作用,所以C是错误选项,其余三项都是正确选项
20.分析人员在使用分析结果撰写业务分析报告时应注意
• A.条理清晰
• B.结构完整
• C.图表与文字相结合
• D.论点明确、论据充分
ABCD 所有选项都正确
都看到这里了,欢迎下方评论告诉我,你们还需要哪些CDA1级的干货享?