说明:推荐学习书目中,部分书籍结合软件,但考试中不考查软件操作使用,考生可根据自身需求选择性学习。参考书目不需全部学完,根据考纲知识点进行针对性学习即可。
CDA数据分析师分为CDA LEVELⅠ,LEVEL Ⅱ,LEVEL Ⅲ,涉及金融、电商、医疗、互联网、电信等行业大数据及数据分析从业者所需要具备的技能,
符合当今全球大数据及数据分析技术潮流,为各界企业、机构提供数据分析人才参照标准。
LevelⅠ和Level Ⅱ成功后会发送《考试大纲》、《CDA数据分析师备考手册》(包含:《考试大纲》、《考试大纲解析》、《模拟考试题》三份资料)到考生邮箱,
报考Level Ⅲ成功后会发送《考试大纲》、《模拟考试题》两份资料到考生邮箱。
其他教材根据考试大纲中推荐的学习书目自行网上购买学习,推荐书目不用全部学习完,建议根据考试大纲中规定的知识点逐一进行。
建议学习顺序按照重要程度进行安排:SQL——业务分析——统计学。
根据科目内容具体考点,逐个知识点学习并且总结下来。
a.数据分析概念、方法论、角色(占比1%)
b.数据分析师职业道德与行为准则(占比1%)
c.大数据立法、安全、隐私(占比1%)
[1]王英英.MySQL 8从入门到精通[M].清华大学出版社,2019.(选读)
[2]MICK.SQL基础教程[M].SQL进阶教程[M].人民邮电出版社2017.(选读)
[3]黄缙华.MySQL入门很简单[M].清华大学出版社,2011.(选读)
[4]斯蒂芬森,晋劳,琼斯.SQL入门经典(第5版)[M].人民邮电出版社,2011.(选读)
a.表格结构数据特征(占比2%)
b.表格结构数据获取、引用、查询与计算(占比3%)
c.表结构数据特征(占比5%)
d.表结构数据获取、加工与使用(占比5%)
a.数据库相关概念(占比1%)
b.DDL数据定义语言(占比2%)
c.DML数据操作语言(占比2%)
d.单表查询(占比3%)
e.多表查询(占比3%)
f.子查询(占比3%)
g.数据库函数(占比3%)
[5]贾俊平,何晓群,金勇进.统计学(第7版)[M].中国人民大学出版社,2018.(选读)
PART 4 描述性统计分析(10%)
a.统计基本概念(占比2%)
b.数据的描述性统计(占比3%)
c.统计分布(占比3%)
d.相关分析(占比2%)
[6]黄成明.数据化管理(第1版)[M].电子工业出版社,2014.(选读)
[7]京东数据创新组.京东平台数据化运营(第1版)[M].电子工业出版社,2016.(选读)
[8]刘宝红,赵玲等.供应链的三道防线(第1版)[M].机械工业出版社,2020.(选读)
[9]陈哲.活用数据:驱动业务的数据分析实战(第1版)[M].电子工业出版社,2019.(选读)
[10]顾生宝.数据决策:企业数据的管理、分析与应用(第1版)[M].电子工业出版社,2020.(选读)
a.多表透视分析逻辑(占比3%)
b.多维数据模型(占比3%)
c.透视分析方法(占比4%)
a.数据驱动型业务管理方法(占比3%)
b.指标的应用与设计(占比12%)
c.业务分析方法(占比15%)
客户分析
商品分析
流量、转化分析
行为效果分析
业务分析模型
业务分析方法
a.可视化分析图表(占比5%)
b.撰写业务分析报告(占比5%)
c.创建数据可视化报表(占比5%)
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
PART 1 数据分析概念与职业操守
1、数据分析概念、方法论、角色
【领会】
数据分析基本概念(数据分析、数据挖掘、大数据)
数据分析目的及其意义
数据分析方法与流程
数据分析的不同角色与职责
2、数据分析师职业道德与行为准则
【领会】
数据分析师职业道德操守
数据分析师专业行为准则
3、大数据立法、安全、隐私
【领会】
国外隐私相关法律要求(参阅《国际数据保护规则要览》)
国内大数据立法的历程和展望(参阅《中国大数据法治发展报告》)
欧盟《通用数据保护条例》(General Data Protection Regulation,简称GDPR)中企业和个人的数据使用权限
PART 2 数据结构
总体要求
理解表格结构与表结构的数据特征、理解表结构与表结构数据获取操作方法、理解表结构数据连接及汇总的逻辑、能够应用表结构连接及汇总逻辑关联多表进行汇总求值计算、能够制作ER关系图
1、表格结构数据特征
【领会】
表格结构数据概念
表格结构数据处理工具
【熟知】
表格结构数据特征
2、表格结构数据获取、引用、查询与计算
【领会】
表格结构数据获取方法
【熟知】
单元格区域的特征
【应用】
表格结构数据的引用方法
表格结构数据的查询方法
表格结构数据的常用函数
3、表结构数据特征
【熟知】
理解主键的意义
理解维度及度量的意义
理解缺失值
表结构数据特征
表结构数据与表格结构数据差异
4、表结构数据获取、加工与使用
【领会】
表结构数据获取渠道及方法
【熟知】
表结构数据连接逻辑
表结构数据汇总逻辑
ETL作用、特征
【应用】
应用E-R图
计算两表连接汇总值
应用ETL获取及处理数据
PART 3 数据库应用
总体要求
理解数据库的基本概念、理解DDL及DML语言、能够根据业务需求及数据特征使用查询语言从数据库中获取准确、完整的数据信息、能够应用数据库函数进行数据处理及计算
1、数据库相关概念
【领会】
数据库分类
SQL语言的功能
【熟知】
数据库、数据库管理系统与SQL之间的关系
2、DDL数据定义语言
【领会】
数据库基本结构
【熟知】
数据类型
约束条件
【应用】
创建、选用、删除数据库
创建、修改、删除表
3、DML数据操作语言
【领会】
添加数据的步骤
【熟知】
添加、修改、删除数据的语法规则
【应用】
添加数据
修改数据
删除数据
4、单表查询
【领会】
虚拟结果集
【熟知】
运算符
SQL语句的书写顺序和执行逻辑
【应用】
基本查询:去重查询、设置别名
条件查询:多条件查询、空值查询、模糊查询
分组查询:分组聚合、分组后筛选
查询结果排序、限制查询结果数量
5、多表查询
【领会】
对应关系:一对一、一对多、多对多
连接方式:内连接、左连接、右连接
连接条件:等值连接、不等值连接
【熟知】
连接查询的逻辑和联合查询规则
【应用】
连接查询:内连接、左连接、右连接
联合查询:去重、不去重
6、子查询
【领会】
子查询分类
【熟知】
子查询位置、子查询操作符
【应用】
子查询语法规则
子查询优化
7、数据库函数
【领会】
计算字段
【熟知】
函数功能及参数
【应用】
数学函数、字符串函数、日期时间函数、分组合并函数、逻辑函数
PART 4 描述性统计分析
总体要求
理解统计基本概念、理解描述性统计相关知识内容、理解描述性统计图表定义及适用场景、能够应用描述性统计知识描述及探索业务问题
1、统计基本概念
【熟知】
统计学含义及其应用
统计学的基本概念:数据、总体、样本、参数、变量
2、数据的描述性统计
【领会】
描述性统计图表:直方图、散点图、箱型图
集中趋势的描述:众数、中位数、分位数、平均数
离散程度的描述:极差、方差、标准差、离散系数、变异系数
分布形态的描述:偏态、峰态
【应用】
能够应用描述性统计知识对业务数据进行恰当的数据特征描述,针对数据描述特征阐述业务问题、探索问题原因、提出解决问题方法
3、统计分布
【熟知】
两点分布、二项分布、正态分布、分布、T分布、F分布
4、相关分析
【熟知】
相关分析的描述:散点图、相关分析的类型
相关关系的度量:相关系数
PART 5 多维数据透视分析
总体要求
理解多维数据模型价值、理解多维数据模型逻辑、理解透视分析原理、能够活用多维数据模型结合恰当透视方法观测业务问题实现商业洞察
1、多表透视分析逻辑
【熟知】
熟知透视分析的作用价值
理解多表环境下的连接、透视逻辑
【应用】
能够通过表的字段理解该表所代表的业务维度及业务意义,能够通过表的业务意义倒推回表中字段的主键、维度、度量属性
2、多维数据模型
【领会】
了解使用多维数据模型的业务意义
【熟知】
熟知多维数据模型的创建方法
熟知多维数据模型中连接方式与汇总结果间的关系
熟知多维数据模型下汇总维度与筛选维度间的差异及各自的适用场景
【应用】
能够通过5W2H思维模型梳理业务线索,搜集完整的多表数据。
能够根据业务需求,按照正确的连接关系创建完整、准确、全面的多维数据模型
能够根据多维数据模型推导出可探索的业务问题范围,实现业务洞察
3、透视分析方法
【领会】
透视分析的价值及意义
【熟知】
熟知基本透视规则:求和、求平均、计数、最大最小值
熟知条件筛选透视规则:多条件透视计算、不同层级维度透视计算
熟知基本对比计算规则:均比、基准比、标准比、百分比、差异百分比
熟知时间维度下的透视计算规则:不同时间段、不同时间位移量下的透视计算规则
熟知行间透视与字段上透视的差异
【应用】
能够根据业务需求选择创建正确的透视规则
能够将透视规则应用在正确的多维模型下描述业务问题
能够通过透视结果理解业务问题
透视结果与预期结果不符时,能够检查、追踪问题原因
PART 6 业务数据分析
总体要求
理解业务数据分析方法、掌握业务数据分析流程、能够使用及设计创建业务指标、能够结合业务模型及业务分析方法正确理解业务问题,找到问题原因,并能够提出解决问题建议
1、数据驱动型业务管理方法
【熟知】
熟知数据从业务中来到业务中去的全过程
熟知数据驱动型业务管理的价值意义
熟知数据驱动型业务管理流程
熟知数据驱动型业务管理思维方式
【应用】
能够通过数据驱动型业务管理流程找到业务分析与业务管理需求的结合点,能够正确理解数据的出处及产生逻辑,能够正确的运用数据为业务管理提供有价值的数据分析结果
2、指标的应用与设计
【领会】
指标的作用
【熟知】
熟知从指标结果出发到业务行为落地的思维过程及分析方法
熟知指标与透视计算间的关系
熟知常用指标:
流量相关指标
转化相关指标
营运、销售相关指标
库存类指标
常用财务指标
绩效类指标
客户相关指标
熟知拆解业务需求设计指标方法
【应用】
能够根据指标结果洞察业务问题及影响
能够根据业务场景选择恰当的指标进行观测
能够根据业务需求设计新指标,完善指标体系
3、业务分析方法
【领会】
不同业务分析方法各自的作用
【熟知】
熟知以下业务分析方法:
客户分析:客户来源分析、客户价值分析、客户生命周期分析、客户行为分析
商品分析:商品进销存分析、商品渠道分析、商品耗损分析、商品价格分析
流量、转化分析:流量转化分析、流量渠道分析
行为效果分析:活动效果分析、销售分析、其他行为效果分析
业务分析模型:漏斗模型、RFM模型、客户价值模型
业务分析方法:树状结构分析法、二八分析法、四象限分析法、同期群分析法
【应用】
能够应用恰当分析方法解决业务问题
能够将数据处理分析技能融入到业务分析方法中,为数据驱动型业务管理提供正确、全面、客观的数据依据
PART 7 业务分析报告与数据可视化报表
总体要求
理解业务分析报告与数据可视化报表的制作方法、能够结合业务需求撰写正确的业务分析报告,能够结合业务需求创建全面的数据可视化报表
1、可视化分析图表
【领会】
业务图表与统计图表的区别
【熟知】
业务图表决策树
熟知比较类图表的使用方法
熟知描述类图表的使用方法
熟知结构类图表的使用方法
熟知序列类图表的使用方法
【应用】
能够根据数据特征及业务需求选择正确的业务类图表使用
能够通过图表展示内容理解业务问题
2、撰写业务分析报告
【领会】
业务分析报告作用
【熟知】
熟知业务分析报告撰写流程
熟知业务分析报告撰写注意事项
熟知业务分析报告设计方法
【应用】
能够根据业务需求选择正确的报告论点
能够根据报告论点搜集并展示充分、正确的数据依据
能够撰写合理严谨的分析报告,并提出有价值的分析建议
3、创建数据可视化报表
【领会】
数据可视化报表的作用
【熟知】
熟知数据可视化报表与业务分析报告的差异
熟知数据可视化报表的创建过程
熟知数据可视化报表的设计思路
熟知数据可视化报表的应用方法
【应用】
能够结合业务需求设计可落地的数据可视化报表内容
能够将抽象的业务需求转化为具象的数据维度与度量描述
能够制作可清晰、准确、全面地描述业务问题、展示业务全面场景的数据可视化报表