狐狸的帽子

CDA LEVELⅠ2021新版模拟题一（附答案）

总结整理不易，记得一键三连（关注哦，模拟二及其他练习题库正在整理中，在评论框发“模拟题”三个字给你们发word版方便自测）
考试题型：客观选择题（单选 80 题+多选 20 题+内容相关 20 题+ 案例分析 20 题）

第一套

单选1：

1.EDIT数字化模型是企业在实现数字化工作的落地模板，以下关于数据分析EDIT模型描述错误的是：
• A.E指的是Exploration、探索
• B.D指的是Data、数据
• C.I指的是Instruction、指导
• D.T指的是Tool，工具
EDIT中的D指的是诊断（Diagnosis）的意思，所以选B。

2.数据分析由许多关键的阶段性步骤构成，以下不属于数据分析步骤的是
• A.业务理解
• B.数据获取
• C.数据处理
• D.制定决策方案
指定决策方案是数据分析结果的应用环节，不属于数据分析步骤，所以选D。

3.数据安全是从事数据分析工作人员必须要严格保障的事项，以下对于保护数据信息安全不利的错误做法是
• A.将机密数据U盘随身携带
• B.对机密数据载体进行加密保存
• C.不在咖啡厅等公共场所使用机密数据电脑办公
• D.不使用能够连入外网的电脑处理企业机密数据
机密数据U盘随身携带可能出现遗失风险，对机密数据应更加谨慎处理，确保万无一失，所以选A。

4.电子表格工具是表格结构数据的载体，以下属于表格结构数据处理工具的是
• A.Numbers
• B.Power BI
• C.MySQL
• D.Tableau
Numbers是苹果公司的电子表格工具，其余三项都是表结构分析工具，答案是A。

5.表格结构数据是应用与电子表格工具上的数据，作为表格结构数据数据源描述错误的是
• A.主要来自数据库
• B.全部来自数据库
• C.部分来自数据文件
• D.部分来自数据仓库
数据库只是数据的主要来源之一而不是全部来源，所以B是错误的。
6.在电子表格工具中可以使用公式引用数据，下面哪个引用公式写法是错误的（）？
• A.A:A
• B.B1:C17
• C.1:19
• D.A4:19
从单元格地址到单元格地址，不能从单元格地址到行号，所以D是错误的。

7.电子表格工具中存在大量处理计算表格结构数据使用的函数，以下属于电子表格工具中文本函数的是
• A.date
• B.vlookup
• C.left
• D.count
left是从左侧取连续字符串的函数，是文本函数，所以答案是C。

8.表结构是常用的数据组织结构，下面不属于表结构数据的引用参照对象的是（）
• A.字段
• B.记录
• C.单元格值
• D.数据表
表结构数据中不能引用单元格值，C是错误的。

9.主键是表结构数据中重要概念之一，针对主键描述错误的是
• A.一个表只能有一个主键
• B.主键中不能有null值
• C.主键只能是一个字段
• D.主键中不能有重复值
由多个字段构成的主键称为多字段联合主键，所以C是错误描述。

10.熟悉表结构数据特征是使用表结构数据的前提，以下不属于表结构数据特征的描述是
• A.表是由不同字段构成的
• B.表结构的第一行称为字段名
• C.表的第一行称为标题行
• D.不同字段的行数可以不同
表的数据结构是方形的，要求不同字段记录行数相同，所以答案是D。
11.表结构数据分析工具不自己产生数据而是通过获取其他数据源数据进行分析，表结构数据分析工具获取其他数据源的方式是
• A.应用
• B.引用
• C.复制
• D.汇总
表结构数据分析工具通过ETL功能引用数据源数据，所以答案是B。

12.横向合并多表信息完善数据源内容是利用表结构数据的重要方法之一，在横向合并两个数据表时的对应关系决定合并结果的什么
• A.主附关系
• B.合并结果行数
• C.合并结果数据范围
• D.合并结果数据类型
表的合并行数是对应项乘积的结果，所以B是正确选项。

13.在整合多表数据源进行横向合并操作时两表通过__进行连接
• A.公共字段
• B.主键
• C.维度字段
• D.度量字段
主键、维度字段以及度量字段与两表横向合并操作无关，两表通过公共字段进行连接，正确答案是A。

14.关系型数据库在系统搭建以及数据分析过程中都发挥着重要作用，对于关系型数据库功能的核心定位应属于
• A.OLTP
• B.OLAP
• C.DW
• D.Cube
数据库主要功能是事务处理用的，所以定位是OLTP，联机事务处理，所以答案是A。

15.数据透视分析是业务描述性分析中的重要方法之一，关于透视分析中维度概念描述错误的是
• A.业务观测角度
• B.多为文本型字段
• C.维度筛选度量
• D.度量筛选维度
维度筛选度量而度量被维度筛选，所以描述错误的是D。

16.对student1和student2两张表进行inner join连接后，形成的新表中（）
• A.一定包含student1中的所有行，不一定包含student2中的所有行
• B.不一定包含student1中的所有行，一定包含student2中的所有行
• C.一定包含student1中的所有行，一定包含student2中的所有行
• D.不一定包含student1中的所有行，不一定包含student2中的所有行
Inner Join只匹配两表中匹配项，所以D是正确选项，A是左连接，B是右连接，C是全连接的描述。

17.在关系型数据库中，最小的存储单位是
• A.数据库
• B.表
• C.字段
• D.记录
数据库存储层级自上而下分别是数据库、数据表、字段，字段是最小存储单位，所以选C。

18.分析师小A想要在数据表中查询名称里包含“新款”的产品。那么在进行查询时，可以选择以下哪种方式用来进行模糊匹配（）
• A.like
• B.<>
• C.distinct
• D.between
可以通过使用like‘%字符串%’的形式来进行模糊匹配，寻找包含字符串取值的所有记录。

19.向数据库的表中添加数据时必须小心谨慎，使用关系型数据库向数据表中添加数据时应注意（）
• A.字段的个数和添加的数据取值个数可以不一致
• B.字段的顺序和添加的数据取值的顺序可以不一致
• C.字段的数据类型和添加的数据取值的数据类型可以不一致
• D.以上都不对
字段和添加数据的字段个数，数据类型，字段顺序都要一致才能正确添加，所以选D。

20.在SQL命令中关于删除命令DELTE的用法中，DELETE FROM后跟
• A.表名
• B.字段名
• C.记录行号
• D.数据库名称
delete from+表名，所以选A。

单选2：

1.在SQL语言中对查询结果排序可以使用ORDER BY语句，在ORDER BY子句中如果指定了多个字段，则（）
• A.只按第一个字段排序
• B.只按最后一个字段排序
• C.按从左至右优先依次排序，前一个字段取值相同时，再按照后一个字段排序
• D.无法进行排序
order by可以按照从左至右顺序多层级排序，所以答案是C。

2.某数据表中包含name字段，现要查找name字段中包含"a"的姓名，下面哪个选项获取的结果最准确（）
• A.name LIKE ’%a%’
• B.name LIKE ’a%’
• C.name LIKE ’%a’
• D.name LIKE ’_a%’

A. ’%’可以匹配0个或多个字符，’_’可以匹配一个字符。因此 D选项不如A选项匹配的范围广，比如“huater” 这样的名字通过’%a%‘可以匹配到，但是用’_a%'是匹配不到的。

3.别名是SQL中常用的内容，通过别名可以区别不同的表、可以让查询结果可读性增强。在SQL语句中，别名不能出现在哪个⼦句中呢（）？
• A.SELECT
• B.WHERE
• C.FROM
• D.JOIN
B。在SQL中可以设置表别名和列别名，SQL语句的执⾏顺序是FROM–>–>ON–>JOIN–>WHERE–>GROUP BY-- >HAVING–>SELECT–>ORDER BY，别名是在WHERE⼦句后计算的，所以WHERE⼦句中不能⽤列别名， FROM和JOIN⼦句中可以⽤表别名。

4.使用SQL合并数据简单方便，以下关于SQL中UNION关键字的描述，不正确的是（）？
• A.UNION合并数据集的字段个数必须相同
• B.UNION合并数据集的字段数据类型必须相同
• C.UNION合并数据集的字段顺序必须相同
• D.UNION合并后的数据集的行数是合并前的总行数
D。UNION合并数据集后去重，UNION ALL不去重，所以UNION去除重复值后的行数小于合并前的数据集的总行数。

5.子查询是SQL语句中常用语法，合理的使用子查询可以让代码更简洁。以下关于子查询，说法不正确的是()
• A.表子查询必须添加表别名
• B.引用表子查询中的计算字段，必须添加列别名
• C.所有的连接查询都可以替换为子查询
• D.所有的子查询都可以替换为连接查询
D。当WHERE子句的查询条件是聚合函数时，子查询不能替换为连接查询。

6.SQL 中ALL关键字可以实现逻辑运算，它能将单个值与子查询返回的单列值集进行比较，下面关于ALL的含义描述正确的是（）
• A.满足所有条件
• B.满足任意一个条件
• C.一个都不满足
• D.满足一个条件
A。IN或NOT IN表示是否在其中，等于其中任意一个条件即可,ALL表示每一个，全部条件都满足。

7.SQL提供了丰富的运算符来进行各种运算，我们需要熟悉这些运算符的用法，现要找age字段中大于60岁小于80岁的用户需使用哪个运算符( )
• A.加号（+）
• B.等号（=）
• C.且（AND）
• D.或（OR）
C。A. 加号进行数值型数据的加法运算 B. 等号用来做判断，判断值是否相等 C. AND 求两个条件的交集 D.OR求两个条件的并集因此此题应该选C。

8.SQL中提供了丰富的数值函数用来处理数值数据，以下哪个 SQL 函数可以完成对数字的四舍五入（）
• A.FLOOR
• B.CEILING
• C.ROUND
• D.TRUNCATE
C。floor(x)表示返回小于 x 的最大整数值（去掉小数取整），ceiling(x)表示返回大于 x 的最小整数值（进一取整），round(x,y)表示返回参数 x 的四舍五入的有 y 位小数的值（四舍五入），truncate(x,y)表示返回数字 x 截短为 y 位小数的结果。

9.检验单总体均值的过程中，如果是小样本，但总体标准差已知，检验统计量应该选择（）。

A。在样本量较小的情况下，如果总体标准差已知，样本统计量服从正态分布，这时可以采用Z统计量。

10.在假设检验中，有时不仅需要检验正态总体的均值、比例，而且需要检验正态总体的方差。检验单总体方差的过程中，检验统计量服从（）。
• A.标准正态分布
• B.正态分布
• C.卡方分布
• D.t 分布
C。Z统计量和t统计量常常用于均值和比例的检验，卡方统计量则用于方差的检验。

11.某专业毕业的研究生年薪的标准差大约为2000 美元，现在想要估计这个专业毕业研究生年薪95%的置信区间，并要求误差为100 美元，应抽取多大的样本量？（） Zα/2=1.96
• A.182
• B.98
• C.1537
• D.634
C
计算方法如下：
方括号[ ]表示取整函数。计算样本量的时候不是四舍五入，而是向上进位。

12.在进行缺失值填补时，若数据呈明显的偏态分布，则可考虑采用下列哪种方法？（）
• A.将存在缺失值的样本删除
• B.将存在缺失值的变量删除
• C.中位数填补
• D.均值填补
C.中位数不受具体数据分布的影响

13.卡方检验是用途非常广的一种假设检验方法，卡方检验中将任意两行互换则卡方值（）
• A.变大
• B.变小
• C.不变
• D.不确定
C.卡方检验的结果与分类变量的顺序无关，将任意两行进行互换，卡方值不变。

14.下面的数据是一家企业科研投入与专利产出的相关性描述，根据表格信息，下列选项中正确的是（）。

表中的显著性表示相关系数显著性检验中的P值。
• A.专利产出与科研投入高度线性相关
• B.专利产出与科研投入相关性不显著
• C.专利产出与科研投入存在线性相关性，但是相关性较弱
• D.加大科研投入就能够提高专利的产出
B.相关性是只有0.03，且其P值很大，所以是不显著的。

15.在分析两变量的关系时常常会使用散点图，现有变量X与Y，如下图所示横轴为X，纵轴为Y，则关于下图描述错误的是（）

• A.X 和Y 之间很大可能是非线性关系
• B.这些散点中存在异常点
• C.X 和Y 之间是正相关的
• D.分析两者之间的关系可用逻辑回归模型
D.都是数值变量，不能用逻辑回归。

16.某数据分析员希望展示某网站10 年来月度访问量数据，采用以下哪个图形比较合适？
• A.散点图
• B.饼图
• C.盒须图
• D.折线图
D.折线图更容易看出时间上的趋势.

17.以下字段中可作为度量使用的是
• A.客户名称
• B.产品类别
• C.省份
• D.购买数量
D.暂无答案解析

18.在多个业务表连接构成的多维模型中，如果需要进行跨表筛选应满足___的逻辑
• A.维度与主键是父子级关系
• B.维度与公共字段是父子级关系
• C.维度与度量是父子级关系
• D.度量与主键是父子级关系
B.跨表筛选应满足B的条件才能保证按照维度下汇总计算的度量的方式进行计算，所以选B.

19.在多个数据表连接构成的多维模型下，星型模式是
• A.一个维度表连接多个事实表
• B.多个维度表连接多个事实表
• C.一个事实表连接多个维度表
• D.多个事实表连接多个维度表
C.C是星型模式的正确定义

20.针对多维数据模型中星座模式表述正确的是
• A.一个维度表连接多个事实表
• B.多个维度表连接多个事实表
• C.一个事实表连接多个维度表
• D.多个事实表共用某些维度表
D. D是星座模式的正确定义

单选3：

1.四象限分析法帮助我们理解分析项目的特征，应用四象限分析法对客户贡献价值进行描述时可以使用的横纵轴是
• A.到店时间、消费金额
• B.消费金额、购买数量
• C.消费金额、消费频次
• D.消费渠道、到店时间
C. 横纵坐标应能汇总成为描述对象的目的，目的是贡献价值，可以拆分成金额与频次，所以选C.

2.某电商平台进行分析时，不能直接描述商品销售情况好坏的指标是
• A.库存周转率
• B.库销比
• C.动销金额
• D.动销天数
D是正确描述，动销天数用来辅助描述销售行为的风险程度而不是好坏程度.

3.通过数据分析为某电商平台定位核心用户群体可以使用哪种分析模型
• A.5W2H
• B.帕累托分析
• C.漏斗模型
• D.AB测试
B.帕累托分析用来定位重点对象

4.不适合用销量作为度量使用的是
• A.汽车行业市场分析
• B.笔记本行业市场分析
• C.超市库存产品分析
• D.APP下载量分析
D.暂无答案解析

5.SKU是商品的某种单位，以下属于SKU的是
• A.手机
• B.某品牌手机
• C.某品牌某型号手机
• D.某品牌某型号5G亮银8G*128G手机
D.SKU是商品的最小单位，应精确到最细的具体产品上.

6.电商收入由黄金公式的三个指标构成，某电商企业急需解决现金流不足问题，不考虑融资的情况下，应针对黄金公式中哪个指标进行突破
• A.流量
• B.转化率
• C.访问次数
• D.访问量
• D.访问量
B.流量需要投入大量成本，企业资金出现问题时，应优先解决黄金公式中另两项指标.

7.指标用来描述业务行为结果的好坏程度，但是对于指标值的观测应在一定条件下进行，以下选项中不属于观测指标值好坏程度的前提条件的是
• A.相同时间内
• B.相同条件下
• C.相同维度下
• D.相同观测者
D.指标值可以由不同观测者观测.

8.业务图形决策树将业务描述性分析中使用的图表分为了四个不同类别，包含在业务图形决策树中的图表类别是
• A.仪表类
• B.描述类
• C.预测类
• D.统计类
B是正确描述、四类图表分别是构成类、对比类、序列类及描述类.

9.某服装企业有A、B、C三类品牌产品，想要显示每一类产品的销售额分别占销售总额的比例关系，下列哪种图表比较合适
• A.柱形图
• B.箱型图
• C.散点图
• D.饼图
D.此题体现部分与整体的占比关系，使用饼图最合适.

10.用可视化图表展示波士顿矩阵中各类产品特征时应使用以下哪种基础图表
• A.桑吉图
• B.箱形图
• C.散点图
• D.柱形图
C.用散点图生成波士顿矩阵效果

11.描述某电视厂商不同产品销售额与总销售额间的占比关系时使用了饼图，其中饼图的数据标签使用恰当的是
• A.销售额百分比
• B.销售额值
• C.销量值
• D.记录行数值
A.饼图强调占比，应使用百分比形式展现

12.数据分析人员使用业务分析报告汇报分析成果，对于业务分析报告的注意事项，以下不正确的是
• A.条理清晰
• B.论点明确
• C.图、表、文字可以不相关
• D.有论必有数，有数必好懂
C，分析报告中应做到图表文字相结合

13.数据分析人员使用业务分析报告汇报分析成果，不同种类的分析报告着重点不同，以下不属于渠道合作报告的重点的是（）
• A.总结合作硕果
• B.多从内部找原因
• C.适当提出加深合作的需求
• D.展现前景，树立信心
B，渠道合作报告应聚焦于合作情况，所以B是错误的

14.数据分析人员使用业务分析报告汇报分析成果，下列属于业务分析报告作用的是
• A.评估一段时期内业务的好坏情况
• B.发现合作机会
• C.检验业务的真实性
• D.以上都是
D是正确描述

15.在数据分析人员撰写分析报告时避不开进行适度主观推测判断，但是推测判断也要有充分依据，以下适合用于业务推测依据的信息来源是
• A.朋友提供
• B.网站留言
• C.新闻联播
• D.社会舆论
C，作为推测判断信息来源的渠道应权威，信息应准确无误

16.数据分析人员使用业务分析报告汇报分析成果，以下对数据可视化报表的叙述正确的是
• A.为企业提供决策支持
• B.数据资源无法被较好利用
• C.提高经营成本
• D.能够获取到的信息比较片面
A是正确描述

17.BI报表需要使用专业的BI分析工具制作完成，以下不属于BI分析工具的是
• A.SPSS
• B.Tableau
• C.Smart BI
• D.Power BI
A不是BI分析工具

18.分析人员通过BI报表对某家电厂商过去5年间、四种不同产品的销售额情况进行可视化展现，此时的可视化图表中包含___种不同信息
• A.40
• B.20
• C.240
• D.无法计算
B 5年*4种产品，共20种不同信息

19.BI报表基于表结构数据进行制作，在BI报表中使用的表结构数据主要来自
• A.ETL
• B.OLTP
• C.DB
• D.DW
D，BI报表使用DW汇总不同数据源数据作为自己的数据源使用

单选4：

1.某电商的每笔交易信息逐行记录在订单表中，在订单表中能否使用average求客户购买金额的总平均值
• A.可以
• B.不行
• C.无多次购物行为的客户存在时可以
• D.有多次购物行为的客户存在时可以
C 一个客户只有一次购买行为时，客户平均=订单平均，可以直接用average计算平均值，答案是C

2.在记录某电商交易行为内容的订单表中求客户购买金额总平均值应使用的公式是（客户有多次购买行为）
• A.SUM/COUNT
• B.直接用Average
• C.SUM/DISTINCTCOUNT
• D.SUM/AVERAGE
C 客户有多次购买行为时，客户数小于订单数，不能直接用average计算客户平均值，应用总金额/不重复客户数，所以选C

3.同环比是业务描述性分析中针对时间维度使用的重要指标，以下选项中不适用于做同环比的是
• A.日销售额
• B.年产量
• C.季度净利润率
• D.月毛利率
A选项指标汇总周期太短，不适用于同环比，同环比指标应满足长周期，高汇总的特点，所以选A

4.同环比是业务描述性分析中针对时间维度使用的重要指标，以下关于同环比描述正确的是
• A.任何指标都可以做同环比分析
• B.长周期指标适合做同环比分析
• C.短周期指标适合做同环比分析
• D.连续变化的指标适合做同环比分析
B. B是同环比特征

5.业务描述性分析方法是一级考试的主要内容，关于业务描述性分析的主要意义以下选项中描述错误的是
• A.精细化观测业务细节
• B.及时发现业务问题
• C.预测业务未来趋势
• D.全面了解业务情况
C. C是预测性分析不是描述性分析，是错误答案

6.数据驱动型业务模式为企业带来更大竞争力，以下关于数据驱动型业务模式描述正确的是
• A.数据决定业务策略
• B.数据+经验决定业务策略
• C.数据为业务决策唯一参照标准
• D.当经验与数据结论相违时，应以数据结论为主
数据驱动型业务模式也需要经验指导，所以B是正确答案

7.表格结构数据与表结构数据是进行分析时主要使用的结构化数据，在表结构数据下得到指标值结果描述正确的是
• A.对表结构业务数据进行汇总计算
• B.前端系统导出
• C.IT人员提供
• D.前边都不对
将表结构数据进行字段整体的汇总计算可以求得指标结果，所以选A

8.某产品在一年内卖出300件，退回50件，请问销量是多少
• A.300件
• B.250件
• C.350件
• D.无法统计
D 问题未明确指出查看的维度，指标需与维度结合才能统计出结果

9.某汽车销售情况统计网站中得知某款汽车2021年1月销售500辆，2月比1月环比增长20%，那么请计算该款汽车2月份销售多少量
• A.600辆
• B.400辆
• C.1100辆
• D.550辆
A 根据环比计算公式：(当期值-上期值)100%/上期值，带入公式（600-500)/500100%=20%,得出2月销量为600

10.某电商9月份GMV为1000万元，退废比为3%，进货成本500万元，其余成本200万元，请计算毛利多少钱？
• A.500万元
• B.470万元
• C.300万元
• D.270万元
D GMV指的是包含退款额的销售额，实际销售金额为(1-3%)*1000万=970万，去除进货成本和其他成本共700万，故毛利为270万

11.描述电商流量质量好坏程度时可以使用平均访问深度，平均访问深度的计算公式是
• A.浏览量/访问次数
• B.访问次数/浏览量
• C.浏览量/访客数
• D.访客数/访问次数
A是正确计算公式

12.在业务描述性分析方法中，观测相同维度下不同项间的差异情况的指标分析方法是
• A.纵向分析
• B.预警分析
• C.横向分析
• D.占比分析
横向对比的C是正确答案

13.在业务描述性分析方法中，以下选项中不属于时间维度下观测指标的是
• A.YTD
• B.QTD
• C.MTD
• D.CPC
D是错误答案、前三个选项都是重要时间维度下汇总计算指标

14.在电商运营业务中描述客户质量好坏程度时使用的指标是
• A.登录用户数
• B.注册用户数
• C.留存率
• D.浏览用户数
C是正确答案，其余选项是客户属性的统计结果与客户质量好坏无关

15.指标分析是业务描述性分析中观测业务行为结果的重要方法，以下选项中不属于基本指标的是
• A.求和类指标
• B.比较类指标
• C.计数类指标
• D.业务场景相关指标
D是场景相关的特殊指标，不属于基本指标

16.“进销存”业务模块是业务分析中需要重点关注的业务模块之一，其中在“存”的业务模块下关于期初库存额与期末库存额描述正确的是
• A.期末库存额不能大于期初库存额
• B.期末库存额只能小于期初库存额
• C.期末库存额只能大于期初库存额
• D.期末库存额可以大于期初库存额
当进货额>出库金额时期末库存额>期初库存额，所以D是正确的

17.理解业务分析模型能够更好的把握业务全局，以下不属于分析模型中分类模型的是
• A.RFM模型
• B.客户价值模型
• C.波士顿矩阵
• D.销售漏斗模型
漏斗模型没有进行项目件的分类，所以选D

18.漏斗模型帮助我们理解各不同业务阶段特征，使用漏斗模型的本质意义是
• A.风险管控
• B.分层定位
• C.绩效管理
• D.效果评估
A是正确描述

19.AARRR模型是电商运营业务中使用的重要业务模型，在模型中最后的R指的是
• A.用户获取
• B.用户留存
• C.用户激活
• D.推荐传播
D是正确描述

20.“黄金公式”清晰地描述出电商企业收入的构成，在公式中最重要的指标是
• A.转化率
• B.购买频次
• C.流量
• D.浏览量
C是正确描述，电商以流量为王，有了流量才能考虑剩下的两个指标，转化率与客单价

内容相关题：

1.• A.两表的单号
• B.两表的客户ID
• C.单金额与产品金额
• D.没有公共字段
A. 根据两表的业务意义、字段匹配特征以及字段对应关系综合考虑，应选择订单ID作为连接两表的公共字段使用

2.两表连接后使用左连接进行查询后的总行数是____
• A.5
• B 6
• C.4
• D.8
C 使用订单ID连接两表后，左表订单表为主表时，a01项一行，a02项一行，a03项两行，共4行连接结果

3.建立如下数据库表： CREATE TABLE department( departid int not null primary key, deptname varchar(20) not null ); CREATE TABLE employee( employeeid int not null, deptid int not null, ename varchar(20) not null,job varchar(10),sal decimal(10,2)); 要想保证employee表中每一个雇员是唯一的,且只能属于在department表中已经存在的部门，最有效的做法是
• A.把employeeid和deptid设为联合主键
• B.把employeeid设为主键，同时在deptid列上创建一个外键约束
• C.把employeeid设为主键，同时在deptid列上创建一个唯一约束
• D.在deptid列上创建一个唯一约束，同时在deptid列上创建一个外键约束
B 要想保证employee表中每一个雇员是唯一的，把employeeid设为主键或唯一约束。每个雇员只能属于在department表中已经存在的部门，在deptid列上创建一个外键约束。

4.建立如下数据库表： CREATE TABLE department( departid int not null primary key, deptname varchar(20) not null ); CREATE TABLE employee( employeeid int not null, deptid int not null, ename varchar(20) not null,job varchar(10),sal decimal(10,2)); 以下SQL语句中，错误的是
• A.SELECT AVG(sal) FROM employee;
• B.SELECT deptid,AVG(sal) FROM employee GROUP BY deptid;
• C.SELECT deptid,job,AVG(sal) FROM employee GROUP BY deptid,job;
• D.SELECT deptid,AVG(sal) FROM employee GROUP BY deptid HAVING job=’clerk’
D HAVING 子句中的筛选字段必须是可以出现在分组结果中的字段。

5.student表中有4个字段：StudentID（学生编号）,Class（班级），CourseID（课程编号），Score（分数） student 表中记录了同学每一次考试的成绩。那么以下哪组 sql 代码取数的结果中，StudentID字段取值不会出现重复
• A.select StudentID,max(score) from student group by StudentID;
• B.select distinct StudentID,Score from student;
• C.select StudentID from student;
• D.select StudentID from student where studentID is not null;
B选项和C选项where子句中不能使用聚合函数，D选项语法顺序不正确，所以选A

6.student表中有4个字段：StudentID（学生编号）,Class（班级），CourseID（课程编号），Score（分数）以下关于DISTINCT的⽤法，不正确的是
• A.SELECT DISTINCT StudentID FROM student;
• B.SELECT DISTINCT StudentID,Class FROM student;
• C.SELECT StudentID,DISTINCT Class FROM student;
• D.SELECT COUNT(DISTINCT StudentID) FROM student;
C DISTINCT关键字可以对一个或多个字段去重，也可以结合COUNT函数进行去重计数，但是DISTINCT关键字必须位于第一个字段的前面

7.甲乙两班的数学成绩平均分分别为：75，75.27，标准差分别为：7，11.74，离散系数分别为：0.093和0.156 根据题目对数据代表性判断合理的是？
• A.乙班的平均成绩有较大的代表性
• B.甲班的平均成绩有较大的代表性
• C.两班的平均成绩有相同代表性
• D.无法判断
B 离散趋势的大小可以用来描述集中趋势度量指标的代表性，例如方差越大就说明均值的代表性越弱。此题需要判断平均成绩的代表性，那么找取离散趋势小的班即可。为了过滤掉数据量纲的影响，我们取离散系数最小的甲班

8.甲乙两班的数学成绩平均分分别为：75，75.27，标准差分别为：7，11.74，离散系数分别为：0.093和0.156 对数据分布情况判断合理的是？
• A.甲班的成绩分布较分散
• B.乙班的成绩分布较集中
• C.甲班的成绩分布较集中
• D.甲乙班的成绩分布无法判断
C 甲班的离散系数更小，说明数据的离散程度小，说明成绩分布较集中

9.下图是某公司销售业务中使用的多表连接E-R图，参照下图回答问题：

上述连接关系是
• A.星型连接
• B.交叉连接
• C.星座连接
• D.雪花连接
销售业绩表为事实表，其余表是维度表，一个事实表与多个维度表连接的连接模式是星型连接模式，所以正确答案是A

10.同上图
上述连接的对应关系描述正确的是
• A.销售业绩表是多表
• B.客户信息表是多表
• C.城市信息表是多表
• D.产品信息表是多表
事实表是多表在汇总过程中贡献度量字段，其余维度表是一表，所以正确答案是A

11.假设某店1.1号的消费记录如下表请问这天消费的会员数是多少？

• A.2
• B.3
• C.4
• D.5
B 能够统计会员编号的记录是三行，所以有三名会员消费

12.请问这天一共有多少人消费？
• A.2
• B.3
• C.4
• D.5
这天共有五条消费记录，三名不重复会员有会员编号，还有两个非会员消费记录，所以最少消费人数在四人以上，复合条件的只有D选项

13.下图是销售管理中使用的维度表与事实表的E-R图，请看图回答以下问题：

下表中连接错误的地方是
• A.1
• B.2
• C.3
• D.没有错误
C 客户表与商机记录表是维度表与事实表的关系，应使用一对多的连接关系，所以错误处是C的编号3

14.同上图适用于对销售阶段变化情况进行管理的模型是
• A.帕累托模型
• B.AARRR模型
• C.漏斗模型
• D.波士顿矩阵模型
漏斗模型适用于动态状态监控与分析，所以选C

15.在电商企业中，一般不划归在流量分析任务中的行为是
• A.了解流量渠道特征
• B.了解引流行为效果
• C.了解流量人群特征
• D.了解流量付费情况
对流量付费情况的分析应归属于转化阶段的分析任务，所以是错误的，所以选D

16.在电商企业中，对流量付费可能性大小进行描述可了解获取流量的质量高低，适用于对付费可能性大小进行描述的指标是
• A.UV
• B.跳失率
• C.新访客数
• D.浏览量
跳失率越高，流量付费可能性越低，流量质量越差，所以正确答案是B

17.下表是2018年8月汽车市场销量树状结构图，百分比为销量的同比增长率，根据图表回答问题：

影响总销量增长的主要车类是
• A.轿车
• B.MPV
• C.SUV
• D.以上都不对
轿车是第二层三种不同车类中销量最多的车类，轿车的增长变化对总销量产生的影响高于SUV及MPV，所以选A

18.对汽车市场销量影响最大的车系是
• A.德系
• B.日系
• C.美系
• D.自主
A 在第三层各类车系的销量变化数据中可以了解到，德系车销量占比最多，结合增长率综合观测，德系车对市场销量变化的影响最大

19.下表是某班各学员的成绩信息，参照下表回答问题用图表描述学员成绩水平，

合适的图表应为
• A.折线与柱形图的组合图
• B.折线图
• C.饼图
• D.树状图
折线可作为基准线评估柱形代表的实际成绩的好坏程度，所以选A

20.依据上表数据描述学员成绩好坏水平的对比方法称为
• A.基准比
• B.标准比
• C.均比
• D.目标比
A 及格线与优秀线是基准值，实际值与基准值对比是A的基准比

21.下表销售阶段自上而下按顺序排列，根据下表回答问题
用上表中数据做漏斗图会出现的问题是

• A.流速慢
• B.体量小
• C.体型差
• D.以上都不是
从上表中判断意向的金额及金额占比高于接触阶段，高阶段比低阶段数值大会造成漏斗图体型变形的情况，所以选C

22.上表表销售阶段自上而下按顺序排列，根据表回答问题
如果销售周期是3个月，当前数据位于第11周，销售目标为4000，那么以下描述正确的是
• A.已经完成销售目标
• B.完成销售目标的可能性高
• C.完成销售目标的可能性低
• D.几乎不可能完成销售目标
当前真正成交的商机只有742，远低于4000的目标，大多数商机在第11周都处在低阶段，时间上很难在剩下的两周内完成，所以选D

案例分析：

1.表t1中有id，name，salary三列，如果t1是一个论坛的发帖信息表，id是发帖人的编号，name是帖子的标题，salary是每次发帖论坛奖励的分数。表示更新t1表中字段内容的语句是
• A.create table t1（id int，name char（30），salary int）;
• B.drop table t1;
• C.create view v_t1 as select id,name from t1;
• D.update t1 set name=’lixiaoming’ where id=100;
D UPDATE…SET…语句用于修改表中字段内容。

2.表t1中有id，name，salary三列，如果t1是一个论坛的发帖信息表，id是发帖人的编号，name是帖子的标题，salary是每次发帖论坛奖励的分数。查看t1表中id等于10的行
• A.select id from t1 id=10;
• B.select id from t1 where id=10;
• C.select id from t1 id 10;
• D.select id from t1 where id 10;
B 查看特定的行时，需要使用WHERE+条件子句的形式对数据输出结构进行约束。

3.表t1中有id，name，salary三列，如果t1是一个论坛的发帖信息表，id是发帖人的编号，name是帖子的标题，salary是每次发帖论坛奖励的分数。显示每个会员发了几个帖子的语句是
• A.select id ，count（name）from t1 group by id;
• B.select id ，count（name）from t1 group by id having count（name）>5;
• C.select id ，count（name）from t1 group by id having count（name）>5 order by count（name）;
• D.select id ，count（name）from t1 where id > 100 group by id;
A id是发帖人的编号，是唯一的，我们想知道每个会员的发帖数，group by id----按照id分组，就是必然选择。 count（name）是对按照id分组之后的结果计算name的个数。

4.表t1中有id，name，salary三列，如果t1是一个论坛的发帖信息表，id是发帖人的编号，name是帖子的标题，salary是每次发帖论坛奖励的分数。显示发帖数超过5个的语句是
• A.select id ，count（name）from t1 group by id;
• B.select id ，count（name）from t1 group by id having count（name）>5;
• C.select id ，count（name）from t1 group by id having count（name）>5 order by count（name）;
• D.select id ，count（name）from t1 where id > 100 group by id;
B 每个分组计算发帖个数（count（name））之后，我们希望输出结果大于5（count（name）>5）。这里还是比较好理解的，难度在于对having的理解。我们平时用到条件子句时，它前面的关键词都是where，而这里用的是having。在使用GROUP BY对数据进行分组时需要使用HAVING作为限制条件的关键词。

5.某部门员工的每天办公时长X（以小时计时）服从正态分布，现测得6名员工的某天办公时长如下：9、10、6、7、8.3、7.7。计算该样本的均值
• A.6
• B.8
• C.7
• D.9
B 题目给的不是分组数据，因此直接计算简单算术平均数即可。即(9+10+6+7+8.3+7.7)/6

6.某部门员工的每天办公时长X（以小时计时）服从正态分布，现测得6名员工的某天办公时长如下：9、10、6、7、8.3、7.7。计算该样本统计推断的标准差(保留2位小数)
• A.1.43
• B.1.42
• C.1.3
• D.1.30
A 题目要求计算样本标准差，因此需要减去一个自由度。即分母取6-1=5

7.某部门员工的每天办公时长X（以小时计时）服从正态分布，现测得6名员工的某天办公时长如下：9、10、6、7、8.3、7.7。计算变异系数（或称离散系数）(保留2位小数)
• A.0.21
• B.0.2
• C.0.18
• D.0.3
C 变异系数计算公式为标准差除以均值

8.某部门员工的每天办公时长X（以小时计时）服从正态分布，现测得6名员工的某天办公时长如下：9、10、6、7、8.3、7.7。计算该样本统计推断的方差
• A.1.43
• B.2.036
• C.1.69
• D.1.72
B 题目要求计算样本方差，因此需要减去一个自由度。即分母取6-1=5

9.下图描述了某公司销售业务相关各表的连接关系，请观察下图回答以下问题：

产品表与区域表之前的筛选关系描述正确的是
• A.产品可以筛选区域
• B.区域可以筛选产品
• C.两者之间不存在筛选关系
• D.无法确认筛选关系
C 因为商机记录不能筛选产品或者区域，所以区域与产品间不能筛选

10.观察上图对应关系，结合维度表与事实表的业务关系判断上图连接关系有误的是
• A.产品与商机记录间的连接
• B.区域与商机记录间的连接
• C.客户与商机记录间的连接
• D.所有连接关系正确
C是一对一的连接关系，客户是维度表而商机记录是事实表，所以应该是一对多的关系，所以选C

11.上图属于事实表的是
• A.产品表
• B.客户表
• C.区域表
• D.商机记录表
商机记录表记录商机的执行行为，属于事实表，而其他都是维度表，所以选D

12.根据上图各表的连接状态判断上图属于___连接模式
• A.星型模式
• B.雪花模式
• C.星座模式
• D.交叉连接
一个事实表连接多个维度表是星型模式，所以选A

13.商品在电商平台上销售，共投放5个品类，共20种商品，每屏可放5个商品位,这5天的销售记录如下。假设动销率=指定商品层级下有销售行为数/该层级下总数100%，请问品类层级的动销率是多少？

• A.0.2
• B.0.4
• C.0.8
• D.0.95
==C 总品类数为5，发生销售行为的品类数为4，故品类层级的动销率为4/5100%=80%==

14.根据题目描述计算商品层级的动销率是多少？
• A.0.2
• B.0.4
• C.0.8
• D.0.95
B 总商品数为20，发生销售行为的商品数为8，故商品层级的动销率为8/20*100%=40%

15.假设屏效=屏内所有商品的销售数量/所有屏的总销量100%，请问第一屏的屏效是多少？
• A.0.2105
• B.0.31578947368421
• C.0.26315789473684
• D.0.22052631578947
==A 第一屏的销售数量为4，所有屏的总销量为19，故第一屏的屏效为4/19100%=21.05%==

16.根据题目数据判断哪一屏屏效最高？
• A.第一屏
• B.第二屏
• C.第三屏
• D.第四屏
B 第二屏屏效为6/19，第三屏屏效为4/19，第四屏屏效为4/19，故屏效最高的为第二屏

17.下图是某电商客户价值模型与不同用户类别人数占比饼图，观察下图回答问题


此电商当前面对资金短缺的情况，为维系经营需要想办法在短期内用最少成本投入获得收入增长，那么应想办法提高什么指标
• A.流量
• B.转化率
• C.客单价
• D.转化率及客单价
电商资金短缺，无法购买充足流量，所以应优先在资金投入少的转化率及客单价指标上采取对策，所以选D

18.价值模型中，一般认为营销实现价值提升难度最小的用户群体是
• A.大众会员
• B.保值会员
• C.进阶会员
• D.忠诚会员
价值模型中一般右上左下提升难度大，其余阶段随着贡献价值的升高提升难度会随之逐渐增大，所以选B

接前两题，如果要想办法针对一类人群进行有针对性的营销，应选择的人群是
• A.大众会员
• B.保值会员
• C.进阶会员
• D.忠诚会员
综合提升难度及右侧人数占比判断，难度小，人数占比大的人群投入资金少，产生价值高，所以选B

20以下不能用来对用户进行分类的是
• A.RFM模型
• B.波士顿矩阵
• C.帕累托模型
• D.以上都不能用来对用户进行分类
波士顿矩阵是商品矩阵，不能用来进行用户分类，所以选B

多选题：

1.CRISP-DM模型是应用最广泛的KDD过程模型，下面属于CRISP-DM模型的阶段有（）
• A.业务理解
• B.数据理解
• C.数据准备、建模、模型评估
• D.模型发布
ABCD。 CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述。该模型将一个KDD工程分为6个不同的阶段：商业理解、数据理解、数据准备、建模、模型评估、模型部署（发布）
2.表结构是数据分析中常用的数据结构，以下属于表结构分析工具的是
• A.DB2
• B.Power BI
• C.Excel
• D.PPT
ABC。 D选项PPT属于办公软件

3.收集多源数据是进行数据分析工作中的重要步骤之一，以下可以成为表结构数据数据源的选项有哪些
• A.CSV格式的数据文件
• B.数据库
• C.Excel文件
• D.网页数据
ABCD。应用ETL功能可以导入所有选项中提及数据源中的数据到DW中作为表结构数据使用

4.某电商订单表中的主键为订单号，根据业务常识判断不能存放于订单表中的字段是（）
• A.客户ID
• B.产品名称
• C.付费时间
• D.产品金额
BD。一个订单中可能存在多个产品，所以存放产品名称字段会破坏主键约束。同样的产品金额也不可以，订单金额是没问题的。所以选BD

5.关系型数据库中表与表之间可以横向连接也可以纵向连接，以下连接中属于表的横向连接的有（）
• A.inner join
• B.left join
• C.right join
• D.union
ABC。 union 属于表的纵向连接。
6.数据的完整性表示：存储在数据库中的所有数据值均正确的状态，在SQL的CREATE TABLE 语句中实现完整性约束的有（）
• A.NOT NULL
• B.PRIMARY KEY
• C.DEFAULT
• D.UNIQUE
ABD。为了保证数据的完整性，可以通过四种方式来实现，约束、规则、默认值、触发器。题干说的是“在 CREATE TABLE 语句中实现完整性约束的有”，所以只能从约束性条件选择完整性约束包括：主键约束（PRIMARY KEY）、外键约束（FOREIGN KEY）、唯一约束（UNIQUE）、非空约束（NOT NULL）、检查约束（CHECK）。所以不选C

7.SQL中有许多连接查询关键字，可以完成不同业务需求下的合并查询，下面哪些查询关键字能保留被连接两表的全部信息（）
• A.inner join
• B.left join
• C.full join
• D.union all
CD。 full join 为横向连接，保留两张表的全部信息。union all 为纵向连接，且不去除重复记录。

8.若想分析分类变量之间的相关性，可以采用以下哪种方法（）
• A.卡方检验
• B.t 检验
• C.计算皮尔逊相关系数
• D.计算列联相关系数(coefficient of contingency)
AD。 BC 只能用来分析数值型变量，分类变量用不了这两种方法。

9.数据的概括性度量分集中趋势、离散程度、偏态、峰度的度量，下列属于描述性统计中集中趋势度量的有（）。
• A.均值
• B.众数
• C.四分位差
• D.极差
AB。 CD 都是描述数据的离散程度

10.事实表是用来记录业务行为结果的表，以下属于事实表的是
• A.订单表
• B.订单详情表
• C.客户表
• D.产品表
AB。AB选项是关于消费行为及消费行为细节的记录数据表，属于事实表，C、D是观测消费行为的维度信息，属于维度表，所以正确答案是A、B两项

11.订单表与产品详情表可以通过产品ID构成多对一的连接关系，关于多对一连接关系下的透视计算描述正确的是
• A.以多表为主表
• B.以一表为主表
• C.以多维为维度表
• D.以一表为维度表
AD. 多对一连接关系下，进行透视计算时应以多表为主表，多表出度量为事实表，而一表为附表，一表出维度是维度表，所以正确答案是A与D

12.如何获取更多优质流量是电商行业中重要课题，下列哪些属于流量类指标
• A.平均访问深度
• B.访问次数
• C.浏览量
• D.客单价
ABC D客单价是用来描述客单价情况的指标，不属于描述流量相关指标，其余ABC都是流量相关指标

13.电商行业为了获取流量往往需要投入成本到其他平台进行引流，下列哪些指标不属于引流时流量的计费方式？
• A.CDA
• B.CPM
• C.CPC
• D.CPN
AD. CPM与CPC是常见的平台间引流计费指标，所以A与D的选项不是流量统计计费指标，所以正确答案是A、D

14.横向分析可针对不同分析对象间的差异情况进行描述，下列哪些指标分析属于横向分析？
• A.过去一年各类水杯的销量比对
• B.6.18活动中注册用户和非注册用户的销售额比对
• C.红富士苹果在过去一年每月的销量比对
• D.本学期语文、英语、数学成绩的平均值比对
ABD. 纵向分析指时间周期下指标的变化规律，横向分析指指定维度下不同项的指标值的差异，故C为纵向分析，其他选项均为横向分析

15.二八分析经常用来定位重要对象，以下场景中二八分析法不适用的场景是
• A.发现重要客户群体
• B.了解客户生命周期
• C.了解付费流程转化效果
• D.了解不同时间点下的趋势变化
BCD. BCD都是时间下状态变化情况的分析场景，只有A是判断重要对象的业务场景.

16.在梳理抽象业务线索及需求到具体数据时常用到5W2H模型，那么通过5W2H模型整理数据的思维步骤包括哪些
• A.将业务场景进行5W2H的概括总结
• B.将5W2H总结内容梳理为业务维度
• C.将业务维度梳理为数据表
• D.将数据表展开到字段
ABCD都是5W2H模型的整理步骤
17.
在“人货场”的业务模块下，有可能成为描述“场”的情况的相关数据表是
• A.订单表
• B.订单详情表
• C.客户详情表
• D.区域表
AB.“人货场”中的“场”指的是与交易行为相关的业务模块，所以AB是正确选项

18.图表决策树中的图表类别分别是
• A.比较类
• B.描述类
• C.结构类
• D.序列类
ABCD所有选项都属于图表决策树中的类别

19.在分析人员向决策者提交业务分析报告汇报分析成果时，业务分析报告的文字信息应尽量避免
• A.对图表信息重复描述
• B.过多主观推测性结论
• C.对图表信息进行总结
• D.对论据进行片面解读
ABD 报告中的文字应起到总结图表内容的作用，所以C是错误选项，其余三项都是正确选项

20.分析人员在使用分析结果撰写业务分析报告时应注意
• A.条理清晰
• B.结构完整
• C.图表与文字相结合
• D.论点明确、论据充分
ABCD 所有选项都正确

都看到这里了，欢迎下方评论告诉我，你们还需要哪些CDA1级的干货享？

你可能感兴趣的:(数据挖掘,数据分析,big,data)

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Vue中table合并单元格用法 weixin_30613343 javascript ViewUI
地名结果人名性别{{item.name}}已完成未完成{{item.groups[0].name}}{{item.groups[0].sex}}{{item.groups[son].name}}{{item.groups[son].sex}}exportdefault{data(){return{list:[{name:'地名1',result:'1',groups:[{name:'张三',sex
uniapp map组件自定义markers标记点以对_ uni-app学习记录 uni-app javascript 前端
需求是根据后端返回数据在地图上显示标记点，并且根据数据状态控制标记点颜色，标记点背景通过两张图片实现控制{{item.options.labelName}}exportdefault{data(){return{storeIndex:0,locaInfo:{longitude:120.445172,latitude:36.111387},markers:[//标点列表{id:1,//标记点idin
放松的一天 4da9b7687fa0
20190325总结起床07:20图片发自App睡觉:23:00天气:晴今日任务清单学习·信息·阅读•水滴阅读Day40Alice’sAdventuresinWonderlandChapter6.2图片发自App•BBC跟读训练营Day24图片发自App图片发自App图片发自App•潘多拉口语训练营Day6Wow.Whatabigboy!•文化知识学习今日无•阅读时间地狱健康·饮食·锻炼•饮食目标
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
vue + Element UI table动态合并单元格我家媳妇儿萌哒哒 element UI vue.js 前端 javascript
一、功能需求1、根据名称相同的合并工作阶段和主要任务合并这两列，但主要任务内容一样，但要考虑主要任务一样，但工作阶段不一样的情况。（枞向合并）2、落实情况里的定量内容和定性内容值一样则合并。（横向合并）二、功能实现exportdefault{data(){return{tableData:[{name:'a',address:'1',age:'1',six:'2'},{name:'a',addre
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
使用datepicker和uploadify的冲突解决（IE双击才能打开附件上传对话框） zhanglb12
在开发的过程当中，IE的兼容无疑是我们的一块绊脚石，在我们使用的如期的datepicker插件和使用上传附件的uploadify插件的时候，两者就产生冲突，只要点击过时间的插件，uploadify上传框要双才能打开ie浏览器提示错误Missinginstancedataforthisdatepicker解决方案//if(.browser.msie&&'9.0'===.browser.version
golang获取用户输入的几种方式余生逆风飞翔 golang 开发语言后端
一、定义结构体typeUserInfostruct{Namestring`json:"name"`Ageint`json:"age"`Addstring`json:"add"`}typeReturnDatastruct{Messagestring`json:"message"`Statusstring`json:"status"`DataUserInfo`json:"data"`}二、get请求的
【Java】已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException 屿小夏 java 开发语言
文章目录一、分析问题背景问题背景描述出现问题的场景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException在使用Spring框架进行开发时，数据源的配置和使用是非常关键的一环。然而，有时候我们可能会遇到org.springframewo
el-table实现全选整表，单元一页复选框功能周bro vue.js elementui javascript 前端
全选整表单选一页0":popper-append-to-body="false":total="tableData.length":page-size="pageObj.pagesize":page-sizes="[10,50,100]"layout="total,sizes,prev,pager,next"@size-change="handleSizeChange"@current-chang
Vue + Express实现一个表单提交九旬大爷的梦
最近在折腾一个cms系统，用的vue+express，但是就一个表单提交就弄了好久，记录一下。环境：Node10+前端：Vue服务端：Express依赖包：vueexpressaxiosexpress-formidableelement-ui（可选）前言：axiosget请求参数是：paramsaxiospost请求参数是：dataexpressget接受参数是req.queryexpresspo
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1