数据分析思维案例实战学习笔记

Part 1

一、国企

1. 招聘解析

工行:技术化、分为保守、职责模糊
招行:职位具体、要求宽泛、看重能力
广发:跟业务线、杂
电信:中规中矩

2. 工作模块

1) 日报、周报、月报:每天看数据、短期复盘、决策
2) 临时数据: 弄清本质需求
3) 工作技巧:机器人发日报、目标建立、寻找领导帮助

3. 专题分析

1)需求解读
原始需求、了解需求、本质需求。沟通
2)建立逻辑树
数据分析思维案例实战学习笔记_第1张图片

3)SQL提数及分析
sql提数三段论;分析(组成部分、数量比较、有何变化、各项分布、各项相关性)
4)撰写报告

4. 软技能、面试技巧

吹水、展示、时间管理、预判

二、BAT数据分析

1. 招聘解析

2. 日常工作

1)数据异常排查
前期准备:业务理解、指标口径、当前数据产出过程
方法论:判断是否异常:亲自看、时间轴拉长看是近期异常还是历史异常、看和该指标关联的其他指标或其他核心指标是否异常、找到一个关键人物提前沟通。
最大概率法则归类:假期效应、热点事件、活动影响、政策影响、底层系统故障(数据传输、存储、清洗有无问题)、统计口径(业务逻辑更改、指标计算方式)
闭环:持续跟踪后续数据是否异常;记录、沉淀、文档化;邮件化
案例:通过数据异常排查,找到新的增长点
2)融入专项被KPI
有目标: 紧贴项目KPI
有节奏:2—3周输出一份报告
有闭环:报告说人话、做人事
案列:今日头条新用户留存专项
第一阶段:新用户留存整体分析,摸清现状找到切入点
数据分析思维案例实战学习笔记_第2张图片
第二阶段:寻找优化切入点,一般是1-2个;
第三阶段:不断重复前面两个阶段,继续寻找其他切入点;同时进行竞品分析、用户流失分析、营销活动分析
个人理解:演绎思维(描述现象、分析原因、对策)
3)埋点、指标体系

3. 面试技巧

流量波动:
数据分析思维案例实战学习笔记_第3张图片

三个手机上常用APP:
商业模式、商业化变现:

三、中小企业数据分析

  1. 日常工作解析
    杂、多,

  2. 转型

  3. 业务线
    数据分析思维案例实战学习笔记_第4张图片
    数据分析思维案例实战学习笔记_第5张图片

四、数据分析工具

  1. 数据分析整体流程
    明确问题
    搭建框架
    数据提取
    数据处理
    数据分析
    数据展现
    撰写报告
    报告演讲
    报告闭环
  2. excel
    excel 对比分析(筛选和色阶)
    excel时间序列拆解分析(透视图)
    excel相关性分析(常用函数)
    excel临界点分析
  3. SQL
    超级熟练
    max函数:误认为数值型但实际为字符型
    日期处理:
    先聚合再计数:尽量少用distinct
    一列变多行:Lateral view explode
    Select *,b from t1 Lateral view explode(a) table as b
    取TOP:rank() over(…)
    避免数据倾斜:小表在左,大表在右,同时对空值进行过滤
  4. R语言

Part 2

数据分析多元分析

  1. 背景

  2. 中观能力
    真正的专业度,需要长期的总结和思考。
    技术理解:技术是为了让业务更加方便高效,而不是让人困惑。
    如数据标准化,去除量纲的差异性max-min、z-score、指数对数法

    逻辑性:相关性是一种基于向量的伴随关系,不代表因果关系。分析师的逻辑性非常重要,每一环节必须严谨。
    价值点:指导性、预测性分析,价值最大,但一定要注意到价值点,即使只有一个

  3. 微观能力
    有效沟通力+快速发散收敛力:想象力、敏感度、快速发现提问、高维视角

  4. 宏观能力
    洞见性的全局观

电商数据分析

以京东app为例

  1. 视角
    引流(场)
    漏斗(货)
    用户(人)

  2. 分发效率评估
    CTR:点击UV/曝光UV
    人均访问页面数:总访问页面PV/总访问UV

  3. 漏斗模型

  4. 新用户分析
    新用户优惠券:逻辑性、分发、文案

互联网金融toC授信模型

  1. 互联网金融背景
    风控、数据建模;
    toB、toC。央行征信报告
  2. 授信模型
    身份:稳定性
    履约能力:兜底性
    信用历史:历史性
    人脉关系:
    行为偏好:真正价值

变量选择:基于RFM原则
数据处理:数值型和字符串型字段缺失性和合理性检验,剔除无效字段;数值型字段的相关性检验;字符串型字段的离散化处理。

数据标准化:
数据建模:查全率、查准率,ROC曲线

游戏数据分析

  1. 背景
    游戏:互联网思维+钱都要具备
    两极化:要么快速流失,要么玩的时间长

流失分析+商业分析

  1. 指标口径
    常规指标
    DAU、MAU:规模
    留存率:次留、7留、30留
    渗透率:某功能模块的使用人数/该产品的日活
    转化率:针对某个连贯路径,使用下一个节点的用户数/使用上一个节点的用户数

商业化指标
ARPU:一段时间内的每用户平均收入,付费金额/活跃人数
CPM:千次曝光的成本,(广告投入总额/所投广告的展示数)*1000
CPC:每个点击用户的成本,广告投入总额/锁头广告带来的点击数
ROI:投资回报率,收入/支出

  1. 用户流失分析
    一般定义为一个月内不使用产品即定义为流失。要合理定义流失。
    回流率=回流用户数/流失用户数=某个周期内的流失用户数在周期结束后又回来了/某个周期内的流失用户数

套路:看流失前最后一步在干啥;
差异化很大的点:深入游戏

  1. 用户付费分析
    整体思路:
    以付费金额和付费模块为切入点;
    根据前一步确定是在高中低哪个群体;
    AB测试,每天看收入情况

传统行业数据分析

Part 3 指标体系

一、指标体系的通俗定义和选取原则
定义:在业务的不同阶段,分析师牵头、业务方协助,制定的一套能从各维度取反映业务状况的一套实施框架
选取原则:根本性、可理解性、结构性
二、指标体系的四部法
原子性指标:最基础的不可拆分指标
修饰词:可选,某种场景:如搜索
时间段:时间周期,如双11
4=1+2+3:派生指标,双11这天通过搜索带来的交易额

1、理清业务阶段和方向
创业期:盘子大小,用户量
上升期:盘子大小、健康度。用户量,留存
成熟期:收入、市场份额。收入指标
2、确定核心指标

3、确定核心维度拆解
公式计算,业务模块分解

4、指标宣贯、存档、落地

三、知乎APP指标体系实操
问答数

Part 4 流量分析

一、背景
定义:流量是广义的流量,从哪来,经过什么,产生什么价值,如果波动了,为何波动
二、渠道分析
1)常见渠道和分类

内部渠道:产品矩阵
外部渠道:搜索引擎、APP广告、社交媒体、软件市场。
拉新,前期app靠渠道
分类:横坐标是量级、纵坐标为质量指标,划分四象限:
扩量 变现
放弃 精细化

一级渠道 二级渠道
2)渠道推广过程
外部渠道、文案展示、落地页、下载、打开、浏览、注册。。。退出
3)渠道关键指标及分析方法
关键指标:前期看有效用户数和次留,中期看次日、7日、30日留存,后期看ROI
有效用户数:主动行为的用户数,比如停留大于3秒的
分析方法:结构分析+趋势分析+对比分析+作弊分析。
结构分析:先按一级渠道来拆解,再按二级渠道来拆解
趋势分析:看每个渠道的变化趋势,包括量级和留存
对比分析:不同渠道间的趋势对比
作弊分析:用户行为分析+机器学习,python

三、转化分析
1)漏斗分析
先把漏斗的每一步拆分完整,针对需要提升的某一步,核心思想都是用户细分:基础属性和行为属性
基础:手机、地域、imei特征
行为:入口、时段、用户活跃度、用户标签
对有问题的群体进行针对性优化-----精细化
2)功能模块常规分析
功能渗透率=功能用户数/大盘用户数
功能功能留存率:第一天使用该功能同时第二天也使用该功能的用户数/第一天使用该功能的用户数
功能大盘留存率:第一天使用该功能同时第二天是大盘用户的用户数/第一天使用该功能的用户数
大盘用户=所有功能用户排重+不使用任何功能的用户

四、价值分析
1)功能核心用户数
复合某种要求,如时长、天数、具备某种行为
2)功能对大盘贡献度
比如对大盘留存提升的贡献,严格来说只有AB测试才能说明问题
3)功能带来的收入对比
每个功能每个月赚多少钱
五、波动分析
流量波动模型
1)日活
日活波动=外部影响+内部影响
外部影响=行业变化+竞品变化=常识+外部事件+竞品策略
内部影响=数据统计+用户基础属性+用户行为属性
数据统计:数有没有错,采集和统计口径
用户基础属性:从哪里来,什么方式,入口,画像
用户行为属性:进来干了什么,具体功能变化,跟版本可能有关

2)留存
留存波动=新用户留存+老用户留存
新用户留存=渠道+渠道过程有关
老用户留存=所有功能用户去重留存+大盘非功能用户留存

Part 5 路径分析

一、路径分析定义
基于用户的所有行为,去挖掘若干条重要的用户路径,通过优化界面交互让产品用起来更加流畅和符合用户习惯,产生更多价值:先有数据再验证假设

二、路径分析过程
1、所有功能用户量级查看,筛选出重要功能
2、先时间序列排序用户行为、再关联功能间数据(抽样)
3、数据标准化及路径画图
4、找出有意思的路径(启发)

三、路径分析思考

Part 6 竞品分析

一、背景
1、场景
准备进入时,看行业规模和前景;
发展处于下降时,看竞争对手,侧重头部玩家分析;
瓶颈时,看竞争对手的数据和功能迭代,监控哦对手数据,寻求突破;
上升期,一般不会做竞品分析
2、定义
1)竞品的选择
哪些才是竞品
2)分析什么点,需要知道分析背景,有针对性切入

二、步骤
1、确定分析目的
1)尝试进入某个新行业,评估可行性。行业趋势、市场规模、财务收入;
2)纯粹看竞品的功能、玩法和数据,学习优点,人无我有,人有我优。学习为主
3)揣摩竞品,预防为主
2、挑选1-2家竞品,进行对比分析
核心功能一样
1)功能体验分析:不需要大而全
2)运营手法分析:某个功能的运营手法
3)宏观微观数据分析

3、给出初步分析结论
1)进入新行业,评估可行性,SWOT分析
2)学习,学习了什么
3)预防,是否需要进行同竞品相似的尝试

三、实例
爱奇艺会员分析,学习优点,提升自家会员
1、基础数据对比
还要看用户画像
2、产品对比
选择:
功能价值:
退货:
3、运营的概念
产品:生孩子
运营:养孩子
数据分析:持续观察孩子成长阶段的各个指标,保证他健康成长。
所有运营都额可以理解为用户运营:提新增、拉留存、降流失。
往往需要产品内容和产品活动来吸引用户

Part 7 营销活动分析

一、营销活动的当前现状
活动参与人数
拉新数
用户画像
理解:
分析的连贯性:活动前、活动中、活动后
分析的对比性:活动与活动间对比,什么样的活动比较适合产品本身
分析的公正性:按标准评判

活动效果评估+活动优化建议
二、营销活动具体怎么分析
1、活动前好好准备:
和运营方定好目标
和研发沟通好埋点
搭建好指标体系和报表
定好输出格式
2、活动中好好观察
观察第1天数据
观察1-3天数据
定时输出活动战报
活动1周后数据——进行一次详细复盘,同步给管理层
3、活动后复盘——公正性
对大盘影响
短期效果——目标完成度,参与人数、拉新、品牌传播指数
长期效果——活动带来的长期用户数
存在的问题——产品设计和用户反馈
三、案例讲解-----百度app

Part 8 用户增长分析

一、用户增长模型理解
1、AARRR,拉新、激活、留存、变现、推荐。看似很完美,然而很有问题,野蛮增长过去式。

2、留存—》变现—》推荐—》拉新—》激活

3、未来也有可能:
变现—》推荐—》拉新—》激活—》留存

不要纠结模型和概念;抱大腿;产品壁垒。

分析师的任务就是做规模和带收入

二、国内用户增长现状
看似很虎的几个用户增长方法
1、魔法数字:一个用户阅读数超过3篇,留存将大大提升
1)本身是用户的一种主动性行为;
2)让阅读篇数小于3篇的人阅读很难

2、优化渠道结构提升新增用户留存
1)用户量大、质量高的渠道总是有限的,渠道人员开始的时候就想着这件事;
2)渠道链路非常长,很多因素控制不了,反馈周期很久
3、流失用户召回
1)手段除了push,还有啥?
2)与其精力放在召回,不如放在流失分析上

实际很好的2个增长思维
1、北极星指标:一定要找到最核心的指标
对北极星指标进行不断拆解,拆解后的指标跟每个团队的kpi挂钩起来
MAU=新增+老=本月新增+上月新增留存+上月老留存+上月老回流
2、AB测试:公正性和快速反馈性
1)基于数据分析做ab
2)看过程数据,排坑

三、摩拜和滴滴的用户增长案例

part 9 专题报告

一、找到本质问题和逻辑树拆解
1、举例
数据分析思维案例实战学习笔记_第6张图片
二、SQL提数和分析
1、前期准备
写SQL前准备,准备
哪张表、哪份日志
筛选条件
之前有什么坑
现在是否有坑
2、报告
白话、结论先行、落地。

三、彩妆行业分析

part 10 AB测试

一、AB测试介绍
数据分析思维案例实战学习笔记_第7张图片
数据分析思维案例实战学习笔记_第8张图片
常见的AB测试:UI界面型、算法测量型

二、AB测试注意事项
数据分析思维案例实战学习笔记_第9张图片

三、AB测试案例

part 11 行业分析

一、背景
进入某行业;业务发展遇到瓶颈

抓住主要,切忌求全,数数支持
数据分析思维案例实战学习笔记_第10张图片

part 12 数据仓库

数据分析思维案例实战学习笔记_第11张图片

你可能感兴趣的:(数据分析,数据分析)