**黑色字体部分为考纲(截至2022年),蓝色字体部分为笔记,仅供参考
【领会】
数据分析基本概念(数据分析、数据挖掘、大数据)
数据分析目的及其意义
数据分析方法与流程
数据分析的不同角色与职责
【领会】
数据分析师职业道德操守
数据分析师专业行为准则
【领会】
国外隐私相关法律要求(参阅《国际数据保护规则要览》)
国内大数据立法的历程和展望(参阅《中国大数据法治发展报告》)
欧盟《通用数据保护条例》(General Data Protection Regulation,简称GDPR)中企业和个人的数据使用权限
总体要求
理解表格结构与表结构的数据特征、理解表结构与表结构数据获取操作方法、理解表结构数据连接及汇总的逻辑、能够应用表结构连接及汇总逻辑关联多表进行汇总求值计算、能够制作ER关系图
【领会】
表格结构数据概念
表格结构数据处理工具
【熟知】
表格结构数据特征
【领会】
表格结构数据获取方法
【熟知】
单元格区域的特征
【应用】
表格结构数据的引用方法
表格结构数据的查询方法
表格结构数据的常用函数
【熟知】
理解主键的意义
表的业务记录单位。在一个数据表中的所有非主键字段都要围绕主键展开
理解维度及度量的意义
理解缺失值
表结构数据特征
表结构数据与表格结构数据差异
【领会】
表结构数据获取渠道及方法
【熟知】
表结构数据连接逻辑
表结构数据汇总逻辑
ETL作用、特征
【应用】
应用E-R图
计算两表连接汇总值
应用ETL获取及处理数据
总体要求
理解数据库的基本概念、理解DDL及DML语言、能够根据业务需求及数据特征使用查询语言从数据库中获取准确、完整的数据信息、能够应用数据库函数进行数据处理及计算
【领会】
数据库分类
SQL语言的功能
【熟知】
数据库、数据库管理系统与SQL之间的关系
【领会】
数据库基本结构
【熟知】
数据类型
约束条件
数据库三大范式
五大约束
数据完整性
【应用】
创建、选用、删除数据库
create database xxxx;
use xxxx;
drop database xxxx;
创建、修改、删除表
create table yyyy;
alter table yyyy add|modify|drop|rename column
drop table yyyy;
【领会】
添加数据的步骤
【熟知】
添加、修改、删除数据的语法规则
【应用】
添加数据
insert into table (columns) values (v1s)
修改数据
update table set column = value where …
删除数据
delete from table where …
【领会】
虚拟结果集
【熟知】
运算符
SQL语句的书写顺序和执行逻辑
【应用】
基本查询:去重查询、设置别名
distinct
as
条件查询:多条件查询、空值查询、模糊查询
where
is null
like
分组查询:分组聚合、分组后筛选
group by … having
查询结果排序、限制查询结果数量
order by
limit
row_number()
from a,b,c
【领会】
对应关系:一对一、一对多、多对多
连接方式:内连接、左连接、右连接
连接条件:等值连接、不等值连接
【熟知】
连接查询的逻辑和联合查询规则
【应用】
连接查询:内连接、左连接、右连接
inner join
left join
right join
联合查询:去重、不去重
union/union all
【领会】
子查询分类
【熟知】
子查询位置、子查询操作符
【应用】
子查询语法规则
子查询优化
【领会】
计算字段
【熟知】
函数功能及参数
【应用】
数学函数、字符串函数、日期时间函数、分组合并函数、逻辑函数
总体要求
理解统计基本概念、理解描述性统计相关知识内容、理解描述性统计图表定义及适用场景、能够应用描述性统计知识描述及探索业务问题
【熟知】
统计学含义及其应用
统计学的基本概念:数据、总体、样本、参数、变量
参数估计
总体参数 |
符号表示 |
样本统计量 |
均值 |
μ |
|
比例 |
π |
p |
方差 |
² |
s² |
|
双侧检验 |
左侧检验 |
右侧检验 |
原假设 |
H0:μ=μ0 |
H0:μ≥μ0 |
H0:μ≤μ0 |
备择假设 |
H1:μ≠μ0 |
H1:μ<μ0 |
H1:μ>μ0 |
两类错误
影响β错误的因素
显著性水平α
一个总体参数的检验
总体比例的检验
总体方差的检验
总体比例的检验d 总体方差的检验 通常在t 检验之前我们首选需要进行进行F检验(方差齐性检验),判断两个总体的方差是否存在显著差异
Z检验
总体呈正态分布
总体方差已知
样本量较大
t检验
总体呈正态分布
总体方差未知
样本量较小
最小样本量公式
n为样本量
σ2为方差,抽样个体值与整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的样本量越多
E为抽样误差,由于是倒数平方关系,抽样误差减小1/2,抽样量需要增加4倍
【领会】
描述性统计图表:直方图、散点图、箱型图
集中趋势的描述:众数、中位数、分位数、平均
离散程度的描述:极差、方差、标准差、离散系数、变异系数
分布形态的描述:偏态、峰态
偏态
峰态
【应用】
能够应用描述性统计知识对业务数据进行恰当的数据特征描述,针对数据描述特征阐述业务问题、探索问题原因、提出解决问题方法
【熟知】
两点分布、二项分布、正态分布、分布、T分布、F分布
【熟知】
相关分析的描述:散点图、相关分析的类型
相关关系的度量:相关系数
总体要求
理解多维数据模型价值、理解多维数据模型逻辑、理解透视分析原理、能够活用多维数据模型结合恰当透视方法观测业务问题实现商业洞察
【熟知】
熟知透视分析的作用价值
理解多表环境下的连接、透视逻辑
【应用】
能够通过表的字段理解该表所代表的业务维度及业务意义,能够通过表的业务意义倒推回表中字段的主键、维度、度量属性
【领会】
了解使用多维数据模型的业务意义
【熟知】
熟知多维数据模型的创建方法
熟知多维数据模型中连接方式与汇总结果间的关系
熟知多维数据模型下汇总维度与筛选维度间的差异及各自的适用场景
【应用】
能够通过5W2H思维模型梳理业务线索,搜集完整的多表数据
5W2H模型
能够根据业务需求,按照正确的连接关系创建完整、准确、全面的多维数据模型
能够根据多维数据模型推导出可探索的业务问题范围,实现业务洞察
【领会】
透视分析的价值及意义
【熟知】
熟知基本透视规则
熟知条件筛选透视规则:多条件透视计算、不同层级维度透视计算
熟知基本对比计算规则:均比、基准比、标准比、百分比、差异百分比
熟知时间维度下的透视计算规则:不同时间段、不同时间位移量下的透视计算规则
熟知行间透视与字段上透视的差异
【应用】
能够根据业务需求选择创建正确的透视规则
能够将透视规则应用在正确的多维模型下描述业务问题
能够通过透视结果理解业务问题
透视结果与预期结果不符时,能够检查、追踪问题原因
总体要求
理解业务数据分析方法、掌握业务数据分析流程、能够使用及设计创建业务指标、能够结合业务模型及业务分析方法正确理解业务问题,找到问题原因,并能够提出解决问题建议
【熟知】
熟知数据从业务中来到业务中去的全过程
熟知数据驱动型业务管理的价值意义
熟知数据驱动型业务管理流程
熟知数据驱动型业务管理思维方式
经验为主数据为辅,经验比数据更可信
【应用】
能够通过数据驱动型业务管理流程找到业务分析与业务管理需求的结合点,能够正确理解数据的出处及产生逻辑,能够正确的运用数据为业务管理提供有价值的数据分析结果
【领会】
指标的作用
【熟知】
熟知从指标结果出发到业务行为落地的思维过程及分析方法
熟知指标与透视计算间的关系
熟知常用指标
流量相关指标
转化相关指标
营运、销售相关指标
成交额:GMV、实际销售额、税后销售额、退款额
成交量:实际订单量、销量、退款订单量、上架数量
完成情况:目标达成率、退货率
效果:屏效、商品关联性
库存类指标
库龄=存放仓库时长
库存周转次数=平均库存量/出库总量
订货满足率=按合理需求正常供货次数/产品被要求供货的总次数
缺货率=缺货次数/总订货次数
售罄率=1-库存金额/进货金额
常用财务指标
绩效类指标
客户相关指标
熟知拆解业务需求设计指标方法
【应用】
能够根据指标结果洞察业务问题及影响
能够根据业务场景选择恰当的指标进行观测
能够根据业务需求设计新指标,完善指标体系
【领会】
不同业务分析方法各自的作用
【熟知】
熟知以下业务分析方法:
客户分析:客户来源分析、客户价值分析、客户生命周期分析、客户行为分析
商品分析:商品进销存分析、商品渠道分析、商品耗损分析、商品价格分析
流量、转化分析:流量转化分析、流量渠道分析
行为效果分析:活动效果分析、销售分析、其他行为效果分析
业务分析模型:漏斗模型、RFM模型、客户价值模型
右上左下提升难度大
业务分析方法:树状结构分析法、二八分析法、四象限分析法、同期群分析法
树状结构分析
二八分析
四象限分析-波士顿矩阵(明星类-高-高,问题类-低-高,奶牛类-高-低,瘦狗类-低-低)
同期群分析
AARRR模型
Acquisition用户获取
日新登用户数(DNU)
Activation用户激活
日活跃用户数(DAU)
周活跃用户数(WAU)
月活跃用户数(MAU)
日均使用时长(DAOT)
DAU/MAU
Retention用户留存
次日留存率(Day 1Retention Ratio)
定义:日新增用户在+1日登录的用户数占新增用户的比例。
三日留存率(Day 3Retention Ratio)
定义:日新增用户在+3日登录的用户数占新增用户的比例。
七日留存率(Day 7Retention Ratio)
定义:日新增用户在+7日登录的用户数占新增用户的比例。
日流失率(Day 1Churn Ratio)
定义:统计日登录APP,但随后7日未登录APP的用户占统计日活跃用户的比例。
周流失率(Week Churn Ratio)
定义:上周登录过APP,但是本周未登录过APP的用户占上周周活跃用户的比例。
月流失率(Month Churn Ratio)
定义:上月登录过APP,但是本月未登录过APP的用户占上月月活跃用户的比例。
Revenue获得收益
付费率(PR或者PUR)
活跃付费用户数(APA)
平均每用户收入(ARPU)
平均每付费用户收入(ARPPU)
生命周期价值(LTV)
Referral推荐传播
K因子
K=(每个用户向他的朋友们发出的邀请的数量)×(接收到邀请的人转化为新用户的转化率)。
【应用】
能够应用恰当分析方法解决业务问题
能够将数据处理分析技能融入到业务分析方法中,为数据驱动型业务管理提供正确、全面、客观的数据依据
总体要求
理解业务分析报告与数据可视化报表的制作方法、能够结合业务需求撰写正确的业务分析报告,能够结合业务需求创建全面的数据可视化报表
【领会】
业务图表与统计图表的区别
【熟知】
业务图表决策树
熟知比较类图表的使用方法
熟知描述类图表的使用方法
熟知结构类图表的使用方法
熟知序列类图表的使用方法
【应用】
能够根据数据特征及业务需求选择正确的业务类图表使用
能够通过图表展示内容理解业务问题
【领会】
业务分析报告作用
【熟知】
熟知业务分析报告撰写流程
熟知业务分析报告撰写注意事项
熟知业务分析报告设计方法
【应用】
能够根据业务需求选择正确的报告论点
能够根据报告论点搜集并展示充分、正确的数据依据
能够撰写合理严谨的分析报告,并提出有价值的分析建议
【领会】
数据可视化报表的作用
【熟知】
熟知数据可视化报表与业务分析报告的差异
熟知数据可视化报表的创建过程
熟知数据可视化报表的设计思路
熟知数据可视化报表的应用方法
【应用】
能够结合业务需求设计可落地的数据可视化报表内容
能够将抽象的业务需求转化为具象的数据维度与度量描述
能够制作可清晰、准确、全面地描述业务问题、展示业务全面场景的数据可视化报表
|
业务分析报告 |
可视化报表 |
数据结构 |
表格 |
表 |
数据源 |
单数据源 |
多数据源 |
分析侧重点 |
业务点 |
业务面 |
展示形式 |
静态报告 |
动态报告 |
信息获取方式 |
被动 |
主动 |
内容特点 |
深入阐述业务问题并给出合理建议 |
全面、深入、不提供建议 |
载体 |
word、ppt |
BI |